什么是机器学习
机器学习的定义
A computer program is said to learn from experience E with respect to some task T and some performance measure P, if its performance on T, as measured by P, improves with experience E. ——Tom Mitchelle
简言之,机器学习通过完成任务(T)得到经验(E),进而提升性能(P)。
例如:一个自我对弈的跳棋学习机器:E :自我对弈的棋局 T:下跳棋 P:与新对手玩跳棋时的获胜概率
机器学习的主要算法类型
- 监督学习(Supervised)undefined人教会计算机完成任务。undefined根据统计数据做直线或曲线拟合/分离数据,来预测结果。undefined其中包括了两大问题:
- 回归(Regression) 给算法做一个数据集,包含正确答案,(比如房价-年),用线性/非线性回归方程拟合数据,预测数据。
- 分类问题(逻辑回归问题)(Classification/Logical regression)undefined用实数对出现的可能状况分类undefined(比如:1和0表示患乳腺癌/不患乳腺癌 ;1表示患乳腺癌A,2表示患乳腺癌B,0表示不患乳腺癌),在多维坐标系中(每一个维度表示不同的属性),然后用线性或非线性的函数将不同类的数据分开。
- 无监督学习(Unsupervised)undefined计算机自己学习,经典的算法分为两大类:
- 聚类算法undefined对并不明确分类的数据集,计算机根据数据特征自动将数据分为几个簇
- 鸡尾酒会算法(Cocktail party)undefined略,这里只对鸡尾酒会问题和解决方法作一个概述:undefined 鸡尾酒会问题是在计算机语音识别 领域的一个问题。 当前语音识别技术已经可以以较高精度识别一个人所讲的话,但是当说话的人数为两人或者多人时,语音识别率就会极大的降低,这一难题被称为鸡尾酒会问题。 对于的给定混合信号,分离出鸡尾酒会中 同时说话的每个人的独立信号。 鸡尾酒问题的解决方法是把两个收音器分别放在两个人的附近,每个收音器且与两个人的距离是不等距的,如此来分离两个人的声音。