在机器学习中,您标注的数据是AI模型的基础,因此选择正确的方式十分重要,建立质检流程,跟进每一个测试环节。随着技术比以往发展地更迅速,人工智能在安全和人脸识别方面的应用愈加普及。当我们使用人脸解锁手机的时候,比如,科技巨头苹果公司通过多轮测试使人脸识别变得准确——正是通过详细的关键点来实现的。
什么是关键点?
在数据标注中,机器学习工程师构建模型的策略需要考虑到实际应用场景。我们在人工智能做的大量工作都是和人与机器交互相关,尤其是在检测人类运动和情绪方面。在这些实践中,我们会使用关键点来标注目标物体。想象一下人类的面部,机器要知道眼睛、鼻子、嘴和其他关键部位用来识别这是一个人类,这时你就需要用到关键点标注。
与其他标注类型不同,关键点标注是用来标注物体的骨骼轮廓而不是标注物体外缘,这就是为什么人体和动物经常用关键点来标注,通过这种方式标注,AI模型可以检测到物体的运动形态。举例来说,在我们标注人体关键点的时候一般会标注在关节部位,比如手指关节。
为什么使用关键点?
关键点标注最适合于追踪物体运动的AI模型,所以经常用于视频连续帧标注。使用关键点来分析运动轨迹帮助模型检测某些伤害、弱点和面部情绪识别。
人脸识别
手机人脸识别系统
现在信息安全越来越重要,这意味着所有企业都务必重视信息保护,比如我们每天使用的智能手机,人脸识别和检测有助于提高手机的安全性,防止黑客入侵和其他安全风险。在看似简单的人脸解锁的背后,实际上是通过大量的人脸数据集和标注,训练模型而实现的。为了实现这一点,苹果公司的工程师团队可能在产品投入使用前使用了数千个关键点。
当构建一个人脸识别模型时,工程师们查看关键点以测量重要的距离,比如你的眼睛到鼻子的距离,又或者眉毛到额头的距离,等等……分析这些关键点之后,模型可以学习到人脸的细节。在查看了数千个人脸关键点之后,你的模型就可以开始检测人脸特征。
阻止犯罪活动
除了防止偷窥的人来看我们的手机信息以外,人脸识别在美国机场还有其他用例,比如国土安全局用人脸识别来检测签证过期和非法入境的人。Clearview AI是一家在美国联邦和地方层面开发人脸识别解决方案的公司,使用开源的网络数据,他们已经超越了传统犯罪数据库的能力,并阻止了诸如拉斯维加斯的人口贩运团伙和美国及墨西哥边境的毒品走私等犯罪活动。
人脸识别同样可以用在大型聚会和活动当中,著名的“歌神张学友演唱会五杀”事件——在张学友的演唱会上,通过人脸识别系统识别到人群中的在逃人员。这也让更多人了解到人脸识别的概念和其强大的实践用例。
在执法之外,面部识别还用于其他应用,例如打开网上银行应用程序和批准交易。福特等一些汽车公司正在试水,开发面部识别软件作为安全和防盗的附加层。走进一辆不属于你的车?它不会识别谁在驾驶,因此不会启动。
除了执法以外,人脸是被还可以用于支付宝或支付程序的批准交易。福特等一些汽车公司正在试验用人脸识别系统来阻止车辆盗窃,如果你坐到一辆不属于你的汽车汇总,它可能不会被启动。
缺点
人脸识别系统很复杂,需要大量的数据以构建高度准确的AI模型,模型如果出现任何错误,都无法正常识别或者导致冤枉一个没有犯罪的人。准确的模型必须考虑到边缘情况,人脸的远距离照片或者模糊的照片很容易导致错误判断。此外,很多人担心人脸数据存储在数据库中会导致个人隐私泄露,如果这些照片和数据,以及关键点落入不法分子手里该怎么办?机器学习专家们必须要考虑到所有的这些因素。
运动识别
人体骨骼点检测
人工智能似乎不太可能在体育运动中占有一席之地,但职业体育运动也开始产生了关键点检测的需求。使用 AI 技术,一些组织正在分析球员的运动,能够发现一些肉眼无法察觉的细节。此外,肌肉运动的轻微变化可能表明即将出现损伤,在损害发生之前进行预测有助于预防并有可能延长运动员的职业生涯。
对于教练来说,使用AI模型来分析运动员的优势和劣势也有助于招募和评估。使用关键点标注训练模型能够检测运动员的动作并了解他们的技能水平。然后将这些数据存储起来,并针对其他运动员进行评估,以公平地评估候选人的技能水平。教练可以评估一名球员的最佳优势,并将其和其他成员或其他候选人进行比较,从而获得球队的整体概况预测,有助于找到尚未在大联盟中证明自己的球员。
Second Spectrum 正是这样做的,作为 NBA 和英超联赛中领先的球员分析系统,他们开发了一种分析球员表现、更好地预测比赛结果并在几秒钟内搜索任何比赛的方案。 Second Spectrum 使用人工智能技术将数学应用于运动,分析统计信息以给出报告并帮助分析比赛。我们现在可以通过数据来看这些比赛是如何调整策略帮助做出更好决定并进入季后赛。
日常训练
除了专业运动,关键点标注和分析技术在虚拟运动软件和辅助平台中发挥了重要作用。分析一个人的动作,学习哪种健身方式才是正确的,并了解关节是如何旋转的,有助于为日常健身爱好者提供反馈。例如,健身运动很容易适得其反。不正确的动作会导致发力点错误而受伤。
随着健身运动的流行,我们看到了更多人开始居家健身,从 YouTube 上预先录制的视频到 Tonal 和 Mirror 等更复杂的系统。
随着大流行,我们看到了家庭锻炼的巨大增长,从 YouTube 上预先录制的视频到 Tonal 和 Mirror 等更复杂的系统。后者通过将计算机视觉技术应用于人体的 17 个主要关键点来工作。在这里,虚拟教练可以了解您的健身进度、检测疲劳,甚至可以在举重训练期间充当观察员。将虚拟辅助作为日常锻炼的一部分可减少受伤的可能性,有助于制定个性化的健身计划,并提供私人教练服务,这一切足不出户即可实现。
步态分析
关键点标注和运动分析比运动更重要。在医学界,通过关键点标注模型进行的运动分析可以揭示很多关于患者健康的信息,尤其是通过观察他们的步态。科学家们正在使用他们对步态测量和分析的了解来获取有关各种疾病和伤害的信息,并且他们正在使用机器学习来扩展他们的知识并制定治疗方案。
通过捕捉患有中风、帕金森和脑瘫等疾病的患者的视频片段,医疗专业人员能够在对患者的逐帧分析中标注主要关节区域。通过将迁移学习的概念应用于他们的数据并通过深度学习实施预训练模型,科学家们能够测量各种参数,例如步行速度、节奏、摆动和站立时间以及双支撑时间。利用他们的发现,他们能够在预训练模型中将步态测量值与健康个体的步态测量值进行比较。因为健康的人往往有相似的步态,所以很容易对这些测量应该是什么样子有一个整体的了解。
步态分析和测量使医疗专业人员能够深入了解一个人的运动模式,并可以确定受伤或疼痛的来源。它还可以识别骨骼错位并确定某些退行性疾病的进展。了解一个人的步态可以帮助起草治疗计划和进行某些测试。
影响因素和阻碍
对有运动问题的患者进行步态分析通常需要辅助技术的外部帮助,例如支架和助行器或者医生和护士的帮助。拥有这些额外因素肯能导致数据集噪音,因此为了确保您的模型能够正确计算结果,排除外部影响非常重要。此外,使用非专业的手持相机拍摄的视频必须包含不同角度,以便收集更多有用和准确的数据。
用于步态分析的机器学习应用仍然是一种新兴的实践。虽然有开源数据集,但使用关键点标注来探索可能性仍然是一种新的尝试。将其广泛使用需要大量时间和数千个关键点。更重要的是,这一切实施起来很昂贵,而且并不是每个医疗机构或治疗中心都有资源来建立强大的机器学习研究。
结论
关键点识别技术具有许多已经实现的应用场景,例如人脸识别,能够识别目标并防止犯罪活动的发生,挽救生命并防止灾难性事件。不过,将你的脸与成千上万的其他人一起保存在数据库中,你会感到有些担心,这是可以理解的,如果没有适当的安全措施,数据可能会泄露并落入不法分子之手。将数据安全当做最优先考虑的问题至关重要。
关键点技术还对运动医学铺平了道路,一些体育组织正在使用这项技术来分析动作、调整训练技术并防止受伤。在医学界,步态分析和运动研究正在为新型诊断工具和治疗计划打下基础。对于物理治疗师来说,通过科学和人工智能来处理患者的疾病可以加快康复速度。