基于度量学习的深度哈希图像检索研究是我的毕业设计,是一个计算机视觉方面的项目,旨在解决大规模图像检索时带来的高时间消耗和高内存占用率问题。春恋慕
1.课题来源
吉林省省级科技创新专项基金项目、吉林省自然科学基金会项目
2.课题拟解决的问题
该课题可以解决大规模图像检索时带来的高时间消耗和高内存占用率问题,可以极大的提升检索效率,提高检索在大规模图像数据集上的可应用性。
3.主要内容与目标
主要内容:对于训练数据集,使用卷积神经网络提取高维度特征;设计度量学习损失函数,用于提取具有不同类别的图像的高区分度的特征;设计深度哈希网络,获取低维度的哈希特征;设计量化损失函数,用于降低量化带来的信息损失。
目标:对于测试数据集,获取的低维哈希码可以实现快速有效的哈希检索,并在多种精度度量标准(包括map, recall, precision等标准)下都能够取得目前最优的水平。
4.前沿性,理论意义及实际意义
图像检索技术在机器学习、人工智能和计算机视觉等领域起着重要作用。然而随着数据的爆炸式增长和数据维度的增加,大规模图像在存储和计算上给图像技术带来了很大的挑战。近年来,基于哈希计算的图像检索因其存储成本低且检索速度快,在计算机视觉领域得到了广泛的关注和研究。而在基于哈希的图像检索技术中,如何有效的处理高维度特征向量并优化哈希函数以提高检索精度是一个关键问题。
5.课题对于学生的训练价值
可以增强学生对于计算机视觉方向,深度学习方向的理论理解。可以使学生提前接触计算机检索方向的前沿科研成果。
可以训练学生的python语言,在tensorflow框架/pytorch框架下的代码编写能力。
可以训练学生的大规模数据处理能力。以及数据存储和管理的能力。
6.课题的主要任务以及技术指标要求
主要任务:选择合适的数据集(例如遥感数据集UCMD和AID)。使用预训练卷积神经网络作为基础网络,设计度量学习损失函数(从基于样本的损失函数或者基于代理的损失函数两方面进行考虑)对网络参数进行微调。设计深度哈希网络(基于全连接层设计)提取哈希码。设计量化损失函数降低量化损失。
技术指标要求:在map评价标准上能够达到0.9以上的准确率;在precision评价标准上达到0.85以上的准确率;在recall@1达到0.6以上的召回率。