计算机视觉研究院专栏
作者:Edison_G
之前我们已经推送过该干货,但是原文作者发现多处问题,今天我们尊重原创,重新修改后发布!感谢大家一直的支持与关注!
一、简要
在本研究中,研究者提出了一种有效的深度卷积神经网络(DCNN)结构,利用手持照相机拍摄的照片来检测水稻的生长阶段(DVS)。用不同的策略对DCNN模型进行了训练,并与传统的时间序列Green chromatic coordinate (time-series Gcc)方法和手工提取的特征组合支持向量机(MF-SVM)方法进行了比较。此外,还研究了不同角度的图像、模型训练策略和对DCNN模型预测的解释。利用所提出的两步微调策略训练的DCNN模型得到了最优结果,整体精度为0.913,平均绝对误差为0.090。
结果表明,以大角度拍摄的图像包含更有价值的信息,使用多角度拍摄的图像可以进一步提高模型的性能。两步微调策略极大地提高了模型对视角随机性的鲁棒性。解释结果表明,从图像中提取物候学相关特征是可能的。本研究提供了一种物候学检测方法来实时利用手持照相机图像,并对在现实场景中使用深度学习有了一些重要的见解。
二、背景
本研究的假设是,作物表型的特征可以通过分析图像被机器学习捕捉到,而传统上可以通过观察被农业专家识别。然而,对作物物候学检测的深度学习研究仍然非常有限。Yalcin(Plant phenology recognition using deep learning: Deep-pheno. In 2017 The sixth international conference on agro-geoinformatics (pp. 1–5). https://doi.org/10.1109/Agro-Geoin formatics.2017.8046996)应用DCNN,使用固定角图像对生长阶段进行分类。Bai等人(Rice heading stage automatic observation by multi-classifier cascade based rice spike detection method. Agricultural and Forest Meteorology, 259, 21360–270. https://doi.org/10.1016/j.agrformet.2018.05.001)使用支持向量机和DCNN来区分水稻穗的图块。最后利用稻穗图块数量来判定抽穗期。
以上两项研究集中在固定的角度和位置的图像上,而小农户可以以随机的角度和位置拍摄图像。为了方便处理这些随机图像,有必要开发一种通用的方法。从多个角度拍摄的图像中提取最大的物候学信息将是很吸引人的。还需要一种通过降低图像视角不确定性的影响的训练策略来提高深度学习方法的性能。
三、研究地域
实验地域(23° 5′ 52″–23° 7′ 23″ N, 108° 57′ 7″–108° 58′ 34″ E)位于中国广西宾阳县。该地区的160公顷土地被划分为800多个地块,由当地农民管理。该地区的年平均降水量约为1600毫米,平均气温为21°C。随机选取70块地块,利用管理的12块地块进行分析。
四、研究框架
Data collection and processing
为了利用在不同视角度拍摄的图像进行物候识别,选择了摄影方向和重力方向之间的四个垂直方向:0°(A)、20°(B)、40°(C)和60°(D),如下图a。
在研究区域,大部分地块通过插秧机移栽。当在播种方向拍摄图像时,两排水稻之间的土壤会被很好地捕捉到,而在其他方向,图像捕捉到的土壤会较少。摄影方向和播种方向之间的三个水平方向(分别为0°(a)、45°(b)和90°(c),以避免移栽的影响(如图b))。每次观察都拍摄了12张照片,并在距地面1.5米处大致手工控制视角。对当地农民田块的图像采集工作一共开展了7轮。构建了一个具有622个观测结果的数据集,其中包含7464个图像,并使用其中7320个进行分析。其他的图像的质量很差,无法使用。根据DVS将610项观察结果分为10组,每组进一步分为训练(60%)、验证(20%)和测试(20%)组。
Data augmentation
数据增广的策略
The cropping scheme of three datasets
上图显示从原始图像裁剪的图像块。裁剪后,数据集的结果分布比原始分布更均匀。
Deep convolutional neural network approach
五、实验结果
上表是time-series-Gcc方法的ACC/MAE。
(a) Confusion matrix yielded by the Bb set; (b) confusion matrix yielded by the Dc set.
MF-SVM方法的ACC/MAE。
a–d are results yielded by18 features from one channel, 54 features from 3 channels, 108 features from 6 channels, and 270 features from 15 channels, respectively.
上图中的A, B, C, D分别表示0°, 20°, 40°和60°。
不同拍摄角度的照片比较
最终结果:
本文作者为武汉大学水利水电学院博士生韩景晔,通讯作者为史良胜教授。
史良胜团队以推动我国农业智能化为目标,以现代农业为研究对象,在传统农业学科基础上,融合大数据、云计算、深度学习等新兴数据科学和智能科学的方法和技术,重点研究农业感知、认知和决策智能的基础理论、农业智能管理系统、以及相应的数学模型和软硬件。研究团队拥有国内一流的数字农业大数据库、机器视觉GPU超算中心、高通量数据传输系统、天空地一体化云端、数字农业和增强现实实验平台、无人机遥感和地面一体监测系统,以及先进的生物、物理、化学分析实验室;在湖北、上海、广西、山东全国建立了多个实验站点。
© THE END
转载请联系本公众号获得授权