孢粉鉴定在孢粉学、古生态学、法医学等领域具有重要的价值。传统显微镜观察方法效率低、主观性强、对专业人员依赖度高,而现有的深度学习模型在花粉分类中受限于标注数据稀缺与形态特征利用不足。
最近,由中国科学院南京地质古生物研究所研究员毛礼米指导的“卓越科研训练II”课题小组在《古植物学与孢粉学评论》(Review of Palaeobotany and Palynology)期刊发表了《低标注成本下的花粉图像深度学习: 形态特征与训练预测策略的联合优化》论文,提出一种结合深度学习与形态学特征的花粉图像自动识别方法,有效提升了花粉分类的准确性与数据利用效率。
该研究收集了5521张花粉图像,涵盖141个物种。构建了包含20个标准化形态特征的结构化属性表(如花粉形状、极性、纹饰等)。模型架构基于改进的ResNet50,引入掩码机制,将图像特征与形态属性融合。设计了一种联合训练策略,同时利用全标注数据(图像+类别标签)和弱标注数据(图像+部分形态特征)。预测机制包括:用户可输入图像及若干形态特征,系统通过掩码表生成约束向量,对模型输出进行逻辑过滤,提升预测准确性。模型训练策略使用交叉熵损失处理全标注数据、KL散度损失处理弱标注数据,使其输出逼近掩码约束下的分布,最终损失为二者加权和,通过Adam优化器进行训练。
实验结果表明,预测性能提升:仅使用图像时,模型准确率为 83.00%;引入形态特征后,准确率逐步提升至97.99%。F1分数与MCC指标也同步显著提高,表明模型在召回率与类别平衡方面表现优异。在训练数据利用效率方面,联合使用全标注与弱标注数据进行训练,显著缓解了数据稀缺问题;模型在验证集上表现稳定,过拟合现象得到缓解。
该研究提出了一种融合多源信息的深度学习框架,将图像与形态属性有机结合;设计了弱标注数据利用机制,降低了标注成本,提升了数据利用率;在花粉数据集上验证了有效性,为自动化花粉鉴定提供了可扩展的解决方案;为多模态、低标注成本的生物图像分类研究提供了新思路。
该研究通过结合深度学习与形态学先验知识,显著提升了花粉图像的分类性能,同时通过弱标注数据的使用,有效降低了模型对大量精细标注数据的依赖,为孢粉学及相关领域的自动化分析提供了可靠的技术路径。
本研究由古生物学与油气地层应用全国重点实验室与南京学院-南邮贝尔大创项目“基于人工智能的孢粉高精度自动识别”的联合资助。
论文相关信息:Zhang T.(张腾) & Mao L.(毛礼米), 2026. Deep learning of pollen images under low annotation costs: joint optimization of morphological features and training and prediction strategies. Review of Palaeobotany and Palynology 344: 105458. https://doi.org/10.1016/j.revpalbo.2025.105458.

部分花粉图像集示例

花粉形态属性示例表及预测网络的具体结构

训练和验证准确率
附件下载: