作者:Nature
出品:AI机器思维
业务使用者更多的将精力放到业务本身——避免过渡关注算法原理
随着大数据、人工智能、区块链、物联网、移动互联网等的发展,学科的界限变得比较模糊,各学科交叉融合的趋势在增强,数学的重要性在提升。未来的大学教育不在局限在哪个专业,打破专业的思维局限自己的发展成为趋势。
未来数学与计算机融合发展,借助计算机改变传统数学教育方法,提升数学学习兴趣应用到一线教学可能带来数学大发展。从应用的角度,业务人员只需要应用算法,不需要太多关注算法的数学知识,估计能提高学习的热情。
减少关注算法的工作原理,提升使用这些算法的案例,就像我们开车会开就可以,不用过渡关注汽车的制造原理。驾驭好开车正如业务人员驾驭好使用算法,会调节参数就可以。
对于学习python这门语言,目前之所以比较火,是因为其在数据分析与数据挖掘的应用得到了检验。Python是一种通用型编程语言,它简单易学,上手快,有着丰富的第三方库,社区氛围友好。
从数据采集与处理、分析与挖掘一直到应用开发层面,Python都有成熟的库。使用Python语言进行开发,无需过多关注语言细节,开发者可以将主要精力放到业务本身,只要会用就可以,专业的人员干专业的事,语言深层次的开发与算法理解交给研究者,避免走入研究数学算法推导与技术的误区。理解数据挖掘的基础知识,掌握用数据挖掘知识解决问题的方法,提升业务应用是关键。
搭建数据挖掘环境,理解使用语言工具是基础,跟着业务案例学习,提升业务应用价值是关键。正如我们希望通过计算机把网页翻译成其他语言,推荐理财,预报天气,推荐喜欢的文章,诊断健康等。通过数据挖掘技术可以用来训练其在某个领域的应用,提升其更高的精确度。
随着开源的市场需求,数据分析与数据挖掘对Python的迅速普及应用并非偶然。基于它的灵活度高,模块众多,可以执行很多任务;比起其他任何 编程语言,Python代码通常更为简洁,可读性更强。Python在数据挖掘领域已经形成了一个由研究员、从业者和新手组成的强大社区。
如何学习数据挖掘?个人建议需要从以下几个方面着手:
○理解数据挖掘流程及其应用场景
○搭建数据挖掘环境——如搭建python数据挖掘环境
○根据实际案例学习
○迭代应用到场景,反思数据挖掘的不足之处,逐渐提升应用场景价值。
数据挖掘本身不复杂,明确业务、理解业务是关键。通过收集相关的业务数据,让计算机借助算法模型做出基于数据的决策都属于数据挖掘。如天气数据预测未来几天的天气、拦截垃圾短信、拦截垃圾电话,预测客户购买意向等。
对于真正想学习数据挖掘的业务人员,需要适当了解下算法、统计学、计算机编程等相关领域的知识。同时对语言学、神经学、数据科学等整合这些业务相关的特点领域知识。虽然数据挖掘不同的业务场景千差万别,但整个开发流程基本相同,只是算法引用不同,从较高层次看,它们往往大同小异。数据挖掘的第一步一般都是对数据挖掘业务场景分析,全都是用场景,然后收集业务场景相关的数据并建立数据挖掘数据集,这些数据能够描述真实世界的业务场景。数据集收集是最耗费时间和精力的一个过程,有效的数据是关键,否则其他都是错误的。
对业务场景中选择合适的数据挖掘算法,引用数据集,调整算法,每种数据挖掘算法都有参数,这些参数有的是算法自身包含的,有的可能是使用者添加的,这些参数会影响算法的具体决策。
第二讲以python应用讲解,本讲开篇从宏观上和心得上让大家对数据挖掘产生一个简单应用的感觉,不畏艰难才能勇往直前!
——往期精彩——