博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
主动学习算法:熵值装袋查询(Entropy query-by-bagging)
阅读量:6341 次
发布时间:2019-06-22

本文共 924 字,大约阅读时间需要 3 分钟。

熵值装袋查询Entropy query-by-baggingEQB)是一种经典的主动学习方法,属于查询委员会方法中的一种。QBC的基本思路是使用可获得的标记样本集合训练一组分类器,这组分类器构成委员会,然后由委员会来分类候选样本集合中的未标记样本,选择出委员会分类“最不一致”的样本。在EQB中,判断“最不一致”的依据是投票熵。

EQB算法首先从初始训练集中以装袋的方法选取k个训练集,然后使用这k个训练集分别训练出k个分类模型,这组模型构成委员会。使用委员会中的分类器对未标记样本集中的每一个样本进行预测,并对每一个样本根据预测类别贴上标签,这样,每个样本就拥有k个标签。EQB正式利用这些标签来计算样本的熵值:

以上就是EQB的查询函数。

HBAG为投票熵:

表示样本xi被k个训练模型预测为类别的概率,即样本xi的预测标签为的得票数/k。Ni是类别总数。

当委员会中所有分类器对样本所属类别的预测一致时,HBAG为0。这表明对当前的分类模型来说,此样本类别几乎是确定的,那么将此样本加入训练集所能几乎不能对改善模型提供帮助。而当委员会中分类器对样本标签的预测分期越大时,HBAG也越大,那么此样本提供的信息量也越大,能够帮助改善模型。可以看出EQB是基于不确定性的方法。

 

EQB算法1.从初始训练集中选取k个训练集,每个训练集抽取初始训练集的一部分2.用k个训练集分别训练k个分类器组成委员会3.用k个分类器分类预测U中样本Repeat3.用查询函数来查询U中样本4.将选择出的样本标注正确的标签7.将新标注的样本加入训练集T8.重新训练分类器Until 达到某种停止准侧

 参考文献:

Copa L, Tuia D, Volpi M, et al. Unbiased query-by-bagging active learning for VHR image classification[C]// Remote Sensing. International Society for Optics and Photonics, 2010.

转载于:https://www.cnblogs.com/tacia/p/6298164.html

你可能感兴趣的文章
使用ntpdate更新系统时间
查看>>
Android M 特性 Doze and App Standby模式详解
查看>>
IE FF(火狐) line-height兼容详解
查看>>
谷歌Pixel 3吸引三星用户, 但未动摇iPhone地位
查看>>
python获取当前工作目录
查看>>
VUE中使用vuex,cookie,全局变量(少代码示例)
查看>>
grep -w 的解析_学习笔记
查看>>
量化交易之启航
查看>>
TX Text Control文字处理教程(3)打印操作
查看>>
CENTOS 7 如何修改IP地址为静态!
查看>>
MyCat分片算法学习(纯转)
查看>>
IO Foundation 3 -文件解析器 FileParser
查看>>
linux学习经验之谈
查看>>
mysqld_multi实现多主一从复制
查看>>
中介模式
查看>>
JS中将变量转为字符串
查看>>
servlet笔记
查看>>
JVM(五)垃圾回收器的前世今生
查看>>
CentOS 7 下安装 Nginx
查看>>
Spring Boot 自动配置之@EnableAutoConfiguration
查看>>