高效利用扩散模型时间步 助力通用作物表型感知
文章来源:视觉感知应用研究室 作者:李兆歆 发布时间:2026-06-25
点击量:
【字体:大 中 小】
近日,中国农业科学院农业信息研究所机器视觉与农业机器人团队构建了一种新型农业通用三维视觉感知模型。相关研究成果被计算机视觉顶级会议European Conference on Computer Vision(ECCV )2026录用。
精准估计作物的几何结构是农业高通量表型解析与农机精准作业中的前提。 传统深度感知手段,如RGB-D深度相机存在作用距离和感知精度受限等问题,而使用普通RGB相机直接进行三维感知具有高度的灵活性和可扩展性。扩散模型作为一种通用生成技术,能够联合表面深度估计与法线预测等多任务优化,然而现有框架需要引入庞大复杂的任务分支结构或额外的可学习参数,且在联合优化时易引发梯度冲突与负迁移,导致计算资源冗余、轻量化部署困难。
该研究发现,经典的扩散模型理论体系中仅被用于指示噪声强度的时间步编码,可以在单步生成模型中直接用于不同语义任务的引导优化。该机制无需引入额外参数,通过为场景的单目深度估计、法线预测等不同感知任务分配离散时间步,即可在隐空间中有效解耦多任务流形,从而有效克服联合优化过程中的梯度冲突与负迁移瓶颈。该技术突破可为高效农作物表型解析和农机精准作业提供精准、可靠的三维视觉信息支撑。
该研究得到“中国农业科学院科技创新工程基础科学研究中心(CAAS-BRC-SAE-2025-01)”等支持。
