写在前面的话
山人今天开始将围绕机器智能的算法方面讲讲故事,主要涉及了建模的三要素:模型、策略、算法。这个坑很大,我尽自己最大的努力来填一填,争取用浅显易懂、生动有趣的方式对相关的理论、方法及应用聊一聊,文笔简陋、疏漏错误之处请各位看官不吝指点,这里先感谢了
拉个提纲
根据统计学习所依赖的数据情况可以将方法分为四类:监督学习;无监督学习;半监督学习;强化学习。
- 监督学习方法有:神经网络(CNN、RNN、YOLO等)、感知机、k近邻法、朴素贝叶斯法、决策树、逻辑斯蒂回归与最大熵模型、支持向量机、提升方法、EM算法、隐马尔科夫模型、条件随机场等。
- 无监督学习方法有:聚类、降维、自动编码器等。
- 半监督学习方法有:神经网络(GAN等)、半监督SVM、半监督聚类、图半监督学习、基于分歧的方法、生成式方法等。
- 强化学习方法有:Q-Learning;sarsa;状态行动奖励状态行动;DQN,深度Q网络;DDPG,深度确定性策略梯度等。
——该图引用自林轩田,台湾大学,机器学习基石课程
监督学习流程的一张形式化框图
今天先聊一聊监督学习,监督学习利用训练数据集学习一个模型,再用模型对测试样本集进行预测。监督学习有一个前提,假设了输入输出的随机变量X和Y遵循联合概率分布P(X,Y)。而整个的统计学习也有一个假设前提,数据存在一定的统计规律。
下图是监督学习流程的形式化表示,监督学习认为学习的目标函数存在一个函数空间集合,其中有所有可能的函数,通过训练样本D 学习算法A,我们可以得到一个最终函数g(x),通过验证样本(x,y)判断函数g(x)是否接近真实的函数f(x)。
——该图引用自林轩田,台湾大学,机器学习基石课程
讲个故事:如何成为股神
试着用一个故事来比喻一下监督学习流程。我们在炒股的时候总是要寻找时间与股价的规律,假设时间t和股价p之间符合联合概率分布(实际上不一定或者说一定不是,否则早就发财了哈哈),那么一定有一个函数g(x)可以非常准确的描述t和p之间的变化规律,这个函数可能存在于一个函数集合h之中,也就是说有这么一类函数可以描述股价随时间变化的规律,但是需要找出是具体哪一个,即函数中的参数如何设定?
再比如股价随时间变化的规律是一个二次多项式,学习算法就是要找出多项式的参数都是什么,就像我们解方程一样,真有这么简单该多好!这个学习过程就是通过我们收集到的一些历史股价数据训练学习算法A,找出函数g(x)的,再通过没有用来训练的股价数据验证一下g(x)在输入时间t时所给出的股价p是否足够精确,当误差能够接受的时候,我们就认为学习完成了,找到了足够接近股价变化规律的真实函数的g(x)。这时候你就可以用这个模型去炒股了,你就是股神,你可以非常自信的说明天这只股票的价格是多少,今天是买入还是卖出,同学,你财务自由了!
拓展阅读
机器学习-联合概率分布笔记:https://blog.csdn.net/tiankong_/article/details/78332666
参考资料
- 李航,统计学习方法
- 林轩田,机器学习基石
- 周志华,机器学习