集成学习是机器学习算法中地位非常重要的一类算法, 其拥有理论基础扎实、易扩展、可解释性强等特点, 其核心思想是, 使用弱学习器(如线性模型、决策树等)进行加权求和, 从而产生性能较为强大的强学习器. 若按照指导弱...
但是作者后续的分析,只挑选了more functional (MF) mutations, 就是那些被PolyPhen-2软件认定为是“probably damaging” or “possibly damaging” 的 469,553 位点。
林外传里佟掌柜有一句话,春天已然到来,而属于我的春天何时能够到来呢,小安如此“优秀”,怎么就是没有属于自己的另一半呢,刚巧在浏览GitHub时碰到一个预测自己会不会有女朋友的项目,觉得很有意思,于是特地与大家分享,用漫画的...
Vishal Morde讲了这样一个故事:十五年前我刚完成研究生课程,并以分析师的身份加入了一家全球投资银行。在我工作的第一天,我试着回忆我学过的一切。与此同时,在内心深处,我想知道我是否能够胜任这份工作。我的老板感觉到我...
算法实习生面经(nlp、数据挖掘、机器学习)作者:酱油大大大链接:https://www.nowcoder.com/discuss/155251?type=2&order=3&pos=7&page
作者:Savan Patel 时间:2017年5月14日 原文:https://medium.com/machine-learning-101/chapter-3-decision-tree-classifier-coding-ae7df4284e99
如果你你正在学习机器学习,那么特征工程必不可少,特征缩放和特征编码刚是其中的一项,如果你之前不了解,那么希望这边文章能对你有所启发。关于特征缩放和特征编码,前者主要是归一化和正则化,用于消除量纲关系的影响,后者包括...
尽管近年来神经网络复兴并大为流行,但提升算法在训练样本量有限、所需训练时间较短、缺乏调参知识等场景依然有其不可或缺的优势。目前代表性的提升方法有 CatBoost、Light GBM 和 XGBoost 等,本文介绍一项新的开源工作...
Carlos Guestrin,亚马逊计算机科学机器学习教授,Dato公司ceo及创始人 (Dato原名GraphLab,大数据分析云服务平台)
作者:Savan Patel 时间:2017年5月11日 原文:原文:https://medium.com/machine-learning-101/chapter-3-decision-trees-theory-e7398adac567