在工作中,不免进行一些数据的整理分析,从而来定位问题并解决,提高工作或者业务效率。发现新的机会点,保持持续的竞争优势。那么就来研究一下如何利用合适的工具,提升数据分析的效率。
至于数据分析是什么以及有哪些种类,应该都有所了解,那么至于分析常规流程有哪些呢。一般包含如下步骤:
(1)目的明确,知道要分析什么
(2)知道数据如何获取
(3)处理获取到的数据
(4)分析数据
(5)得出分析结果
(6)验证
(7)展示分析结果
这些过程中,都离不开工具的帮助,熟练合理的运用分析工具就会事半功倍更好的处理数据并分析。
一般数据分析工具离不开excel以及三方工具,但今天我们介绍的三方工具就是python,相信大家也很熟悉,因为excel可以通过人工鼠标键盘操作数据,而python可以通过代码直接操作excel,比如导入或者导出数据,在批量操作执行方面,python是占据优势的。
data = pd.read_excel(filepath ”cilliantest.xlsx”)读取.xlsx文件
这里我们就不介绍如何安装官方版python,因为从官方下载后,虽然有很多现成的模块,但在调用之前需要自己手动安装需要的模块,这里对于初学python数据分析的小白还是不太友好,那么有没有直接安装打包好常用库的python工具呢,当然有,这里就来介绍一下Anaconda,这个工具其实就是python的一个开源版本,它的好处有啥呢,就是它自带一些常用的Python库,不需要自己手动安装,下面就介绍一下具体安装流程:
(1)打开官网https://www.anaconda.com ,点击Download按钮
(2)选择合适的系统和对应软件
我这是windows 64位的,大家不要选错哦
(3)点击下载后,双击安装包直接点next直到安装完成
(4)安装完成后,在电脑开始界面就会看到新添加的程序,看到这些说明python已经安装好了
(5)点击后打开浏览器web界面
说到这里,就得说一下,ide和idel,ide表示集成开发环境,就是用来提供开发环境的程序,一般会包含编辑器、编译器、调试器、UI界面等,idel是ide中最简单基础的一种,其他例如vscode、pycharm、spyder、jupter notebook都是idel,数据分析方面,大家用的比较多的就是jupter notebook。
(1)新建文件,点击右上角new,新建一个Python3文件
(2)编写程序文件
(3)编写并运行第一段代码
(4)新建后,文件名字还没定,可以重命名并保存
点击file-rename即可,点击file-save and checkpoint 会保存在默认路径下,文件格式是默认的jupternotbook格式ipynb.
到了这里就得开始学习python的一些基础知识了,学好之后就可以利用python进行数据操作分析。
需要知道这么几个概念:列表、字典、数组、字符串、循环语句、函数、模块。
学会以上的基础概念之后,就可以正式开始数据分析的操作了,这里会用到pandas、numpy、matplotlib这几个模块,直接导入即可:
>>>import pandas as pd
>>>import numpy as np
>>>import matplotlib.pyplot as plt
如何使用就需要更详细的描述,关于数据分析就介绍到这里,这些模块的具体使用,关注后期的更新,祝学习顺利!
END
作者|希里安