在无监督学习中,样本的标签是未知的,也就是说因变量不像监督学习中有明确的标注,比如房价多少,相亲见或不见,鸢尾花所属类别等等。但在现实生活中,我们很难获取到都经过标注的样本数据或者标注数据成本很高,这时候无监督学习...
为进一步优化美团搜索排序结果的深度语义相关性,提升用户体验,搜索与NLP部算法团队从2019年底开始基于BERT优化美团搜索排序相关性,经过三个月的算法迭代优化,离线和线上效果均取得一定进展。本文主要介绍探索过程以及实...
面对着自然世界中越来越多的无标注数据,研究者们都希望找到一种正确的方式,从中学习对于视觉任务有帮助的特征,从而使得各类视觉任务能有进一步的突破,也使各类算法和模型能在实际生产环境中有更加充分的应用。最近的研究...
近年来,自监督表征学习由于无需人工标注,特征较好的泛化性等优势受到了越来越多的关注,并不断有研究在图像、语言等领域取得了较大进展。本论文则立足于数据形式更为复杂的视频表征学习,介绍了一种简单且有效的自监督学习...
统计学习(statistical learning)是关于计算机基于数据构建概率统计模型并运用模型对数据进行预测与分析的一门学科。统计学习也称为统计机器学习(statistical machine learning)。...
聚类 是将样本集合中相似的样本(实例)分配到相同的类,不相似的样本分配到不同的类。
感知机、k近邻法、朴素贝叶斯法、决策树 是简单的分类方法,具有模型直观、方法简单、实现容易等特点
三种常用的统计机器学习方法,非负矩阵分解(NMF)、变分推理、幂法 这些方法通常用于无监督学习的 聚类、降维、话题分析、图分析
强化学习(Reinforcement Learning,RL)是实现强人工智能的方法之一,在智能体(Agent)与环境的交互过程中,通过学习策略(Policy)以最大化回报或实现特定的目标。在实际应用场景中,RL 面临一个重要的问题:agent 无法得到足够多的、有...
ICML 2020投稿中,周志华教授组发表的一篇有关深度半监督学习的论文引发热议。