给定数据集D={(x_1,y_1),(x_2,y_2),…,(x_m,y_m)};x_i=(x_{i1};x_{i2};…;x_(id)),y_i in R
在PCA中,要做的是找到一个方向向量(Vector direction),当把所有的数据都投射到该向量上时,PCA的关键点就是找到一个投影平面使得投影误差最小化。
本周中主要讲解了推荐系统的相关知识。推荐系统应该是目前机器学习领域或者说人工智能领域最热门的方向之一,还有NLP、CV等,主要内容包含:
在监督学习中,我们给学习算法一个数据集,比如一系列房子的数据,给定数据集中每个样本的正确价格,即它们实际的售价然后运用学习算法,算出更多的答案,我们需要估算一个连续值的结果,这属于回归问题...
还是利用房价模型的例子,增加了更多的特征,比如:房间楼层、房间数量、地理位置等,构成了一个含有多个变量的模型
假设预测的变量y是离散的值,需要使用逻辑回归Logistic Regression,LR的算法,实际上它是一种分类算法
向量化主要是针对a的式子来进行改进,将:分子看做w{(i)},v{(i)},分母看做w{(i)},w{(i)}
在我写的这本书,《基于股票大数据分析的Python入门实战(视频教学版)》里,用能吸引人的股票案例,带领大家入门Python的语法,数据分析和机器学习。...
机器学习涉及大量的高数知识,对待高数不要怕,学习机器学习要指导其中的数学原理,不要沉溺于数据的具体推导公式而耽误整体的学习进度。
本文为《机器学习实战:基于Scikit-Learn和TensorFlow》的读书笔记。 中文翻译参考