深度学习模型已经成功地应用于各种基于图像的植物表型应用,包括疾病检测和分类。然而,有监督的深度学习模型的成功部署需要大量的标记数据,由于固有的复杂性,这在植物科学(和大多数生物学)领域是一个重大挑战。具体来说,数据注释是昂贵的、费力的、耗时的,并且需要用于表型任务的领域专业知识,尤其是对于疾病。为了克服这一挑战,已经提出了主动学习算法来减少深度学习模型所需的标记量,以实现良好的预测性能。
在大豆叶子上收集的九类数据(八类应激数据和一类健康数据),其中包括第一个数据集
主动学习方法通过使用采集函数自适应地建议样本进行注释来工作,以在固定标记预算下实现最大(分类)性能。本文作者报告了四种不同的主动学习方法的性能,(1)深度贝叶斯主动学习(DBAL),(2)熵,(3)最小置信度,(4)核心集,基于传统的随机采样标注的两种不同的基于图像的分类数据集。
第二个数据集的九个类别包括八个杂草种类和一个无杂草类别(标记为阴性)。从与相关的公开数据集中获取的图像(Olsen et al., 2019)
第一个图像数据集由属于八种不同大豆胁迫和健康类别的大豆 [Glycine max L. (Merr.)] 叶子组成,第二个图像数据集由来自田间的九种不同杂草组成。对于固定的标记预算,作者观察到,对于两个数据集,使用基于主动学习的获取策略的深度学习模型的分类性能优于基于随机采样的获取。数据注释的主动学习策略的集成可以帮助减轻植物科学应用中的标签挑战,特别是在专用于注释的资源有限的情况下。
来源:Wiley Online Library.How useful is active learning for image-based plant phenotyping?
Koushik Nagasubramanian, Talukder Jubery,Fateme Fotouhi Ardakani, Seyed Vahid Mirnezami, Asheesh K Singh, Arti Singh, Soumik Sarkar, Baskar Ganapathysubramanian.
https://acsess.onlinelibrary.wiley.com/doi/10.1002/ppj2.20020