目前机器学习最热门的领域有以下七个:
1.迁移学习Transferlearning
- 简介:一种学习对另一种学习的影响,它广泛地存在于知识、技能、态度和行为规范的学习中。任何一种学习都要受到学习者已有知识经验、技能、态度等的影响,只要有学习,就有迁移。迁移是学习的继续和巩固,又是提高和深化学习的条件,学习与迁移不可分割。
- 参考:http://www.cse.ust.hk/TL/index.html
2.半监督学习Semi-Supervisedlearning
- 简介:模式识别和机器学习领域研究的重点问题,是监督学习与无监督学习相结合的一种学习方法。它主要考虑如何利用少量的标注样本和大量的未标注样本进行训练和分类的问题。主要算法有五类:基于概率的算法;在现有监督算法基础上作修改的方法;直接依赖于聚类假设的方法;基于多试图的方法;基于图的方法。
- 参考:http://pages.cs.wisc.edu/~jerryzhu/research/ssl/semireview.html
3.Deeplearning
- 简介:深度学习是机器学习研究中的一个新的领域,其动机在于建立、模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,例如图像,声音和文本。深度机器学习方法也有监督学习与无监督学习之分.不同的学习框架下建立的学习模型很是不同.例如,卷积神经网络(Convolutional neural networks,简称CNNs)就是一种深度的监督学习下的机器学习模型,而深度置信网(Deep Belief Nets,简称DBNs)就是一种无监督学习下的机器学习模型。
- 参考:http://deeplearning.net/
4.主题模型TopicModel
- 简介:在机器学习和自然语言处理等领域是用来在一系列文档中发现抽象主题的一种统计模型。直观来讲,如果一篇文章有一个中心思想,那么一些特定词语会更频繁的出现。比方说,如果一篇文章是在讲狗的,那“狗”和“骨头”等词出现的频率会高些。如果一篇文章是在讲猫的,那“猫”和“鱼”等词出现的频率会高些。而有些词例如“这个”、“和”大概在两篇文章中出现的频率会大致相等。但真实的情况是,一篇文章通常包含多种主题,而且每个主题所占比例各不相同。因此,如果一 篇文章10%和猫有关,90%和狗有关,那么和狗相关的关键字出现的次数大概会是和猫相关的关键字出现次数的9倍。一个主题模型试图用数学框架来体现文档 的这种特点。主题模型自动分析每个文档,统计文档内的词语,根据统计的信息来断定当前文档含有哪些主题,以及每个主题所占的比例各为多少。主题模型最初是运用于自然语言处理相关方向,但目前以及延伸至例如生物信息学的其它领域。
- 参考:http://www.cs.princeton.edu/~blei/topicmodeling.html
5.高斯过程GaussianProcess
- 简介:又称正态随机过程,它是一种普遍存在和重要的随机过程。在通信信道中的噪声,通常是一种高斯过程。故又称高斯噪声。 通俗地讲,在任意时刻去观察随机过程,若其随机变量的概率分布都满足高斯分布,这个随机过程就是高斯过程。
- 参考:http://www.gaussianprocess.org/
6.垃圾信息检测SpamDetection
直接上网站:http://www.esi.uem.es/~jmgomez/spam/
7.机器排序学习LearningtoRank
- 简介:Learning to rank[1] or machine-learned ranking (MLR) is the application of machine learning, typically supervised, semi-supervised or reinforcement learning, in the construction of ranking models for information retrieval systems.[2] Training data consists of lists of items with some partial order specified between items in each list. This order is typically induced by giving a numerical or ordinal score or a binary judgment (e.g. "relevant" or "not relevant") for each item. The ranking model's purpose is to rank, i.e. produce a permutation of items in new, unseen lists in a way which is "similar" to rankings in the training data in some sense.Learning to rank is a relatively new research area which has emerged in the past decade.
- 参考:http://en.wikipedia.org/wiki/Learning_to_rank