我是一名程序员,主要做Java和Python相关方面的开发,不敢说自己有多么精通,各方面仅仅会一点点皮毛,在编程领域还是一名小学生。
很多人认识我是从沪漂小窝开始的,转眼间已经2年多过去了,这个项目我是一直在断断续续的维护,甚至在今年315的时候,某瓣平台因为违规被和谐了很久,导致了沪漂小窝一度失去了供应商。
后来,我都自己整合了一下数据库中的数据,做了一个开放的Api提供学习使用,详情请看强行续命!沪漂小窝的新数据供应商来了。不过前不久,某瓣平台又活过来了,现在沪漂小窝还是可以继续学习使用了。
最开始在2020年的时候,我就把项目的源码开源在我的github上,截止到目前一共有30名小伙伴,对此项目点亮star,感谢你们的肯定(31是包含我自己的点赞)
很多小白在入门过程中,遇到了很多的问题。90%的原因是因为基础不扎实,或者可以说,之前从来没有编程的基础,导致学习起来比较费劲。
为了大家方便的学习,最终我把沪漂小窝中前前后后所涉及到的知识点,从开始到最后,都书写了下来,作为一个学习的demo教程分享给你。
由于我个人技术水平有限,在编写文字稿的时候也比较仓促,肯定有不对的地方,有异议或者错误的可以直接联系我微信号【mlscoder】,虚心接受学习以及批评指正。
整篇专栏的内容,围绕着沪漂小窝是如何实现的为学习目标,从开始的Python基础知识、数据库、文件读写、爬虫、scrapy、flask、文本分类等,我还是把此专栏定义成数据处理或者数据分析,不过这种分析仅仅处于浅层面上的,从一眼可得的定性的结论到定量的表示的,还是比较初级或者入门级别的内容。
如果你很懂了,开发了好几年的代码了,也不需要从头开始看,纯属浪费时间。当然如果你觉得我看了这个教程,就会成为很会写代码的大神,也不现实啊。
教程中提到的内容,在网上都有公开的资料和视频,我写的这个不一定好,仅供参考。我在重复一遍的目的是,这个知识点后面在做沪漂小窝中有涉及到。
什么是数据处理
数据处理通常是指"收集和操作数据项以产生有意义的信息 "——维基百科
数据处理这个概念很大,就当下的场景,我所描述的数据处理,指的是多数职场人常见的一些表格处理,不仅仅包括上面我提到的两个问题,也可能是一些报表合并、计算等等的问题,这类问题有一个结论,也就是说你有自己明确的要求的输出结果,而不是对数据进行探索性的分析,那样可能更像是数据分析的范畴,这里我们先不谈分析,只需要处理好领导交给我们的,或者岗位本身需要处理的工作。
做数据分析也好,爬虫也好,甚至web项目建业也好,很多需要可以选择,但是我为什么还是推荐使用Python?
为什么是Python
1.学习成本相对低
Python使用起来相对比较简单,就语言本身来说,它是一个解释性语言,不需要编译,可以直接运行。
其次Python是一个弱类型的语言。比如
代码语言:javascript复制a=1 #这是数值类型
a="1" #这是字符串类型
在Java中这样写,会直接报错的,因为Java是一个强类型的语言,不声明变量的数据类型是无法使用的。同样的内容Java是这样的:
代码语言:javascript复制int a= 1 //这是数值类型
String b ="1" //这是字符串类型
这两者各有优缺点,不做好坏的区分,仅仅说明两者都不同的特点。
其实微软也自研发的语言就是vba,但是据我所知,vba学习成本比较高,而且移植性比较差,仅仅能在Windows上运行。不过vba对excel是非常支持的,可是话说回来的,这跟选车一样,最好选择一个大众的车型,开的人多,即便是坏了,找配件也好找,相对冷门的车开的少,配件都不一定能找得到。
2.丰富的第三方库
在选择一个语言的时候,其实就是选择一个生态,换句话说,当你遇到一个问题的时候,把你问题放在百度上搜一下,如果有前辈已经把相关的功能做好了,你只需要Copy下,安装下依赖包,就可以完成你的需求就可以了。
记住,我们的学习的目的是为了减少重复性、简单的、无脑的工作,而不是为了展示自己对代码有多么深的理解,炫耀自己的技术大牛。
所以,在选择的语言的时候,就得考虑生态怎么样,我想做的事情,是不是有别人已经给我写好了。
3. 其他的广泛用途
这个跟当下的主题关系不大,虽然被广泛使用在数据分析,web开发,机器学习,人工智能领域,有兴趣的可以继续深入的了解,不作为本次教程的重点学习内容,我们的目的是首先解决工作中可能出现的问题,这种专业领域的事情,就交给专业的人去做吧。
环境搭建
在本教程的第二章中,我给了一个参考性质的环境搭建范例,供使用和参考。不过就如果安装Python的博客,在网上能搜到很多,不过有的内容,因为时间比较久了,在版本更新过程中就迭代掉了,不一定都管用。
目前现在主流的要求使用Python3.7 ,很多的最新版本的包都要求最低3.7的版本,为了后面可能出现的重做环境的麻烦,那么还是按照基本要求来做一个环境。个人推荐使用Python3.9 ,当然也你可以使用3.10以上的版本,毕竟在学习阶段,尽量用新不用旧。
声明
本专栏的教程内容,由马拉松程序员编写和建设,你可以学习使用,但是不可以用作商业用途!如有错误或者bug请联系我改正,虚心请假!
沪漂小窝教程地址:www.mlscoder.cn 需要使用PC端浏览,手机端没做好适配。
我是马拉松程序员,可不至于代码!