python数据分析入门

2023-10-30 17:32:18 浏览数 (1)

在工作中,不免进行一些数据的整理分析,从而来定位问题并解决,提高工作或者业务效率。发现新的机会点,保持持续的竞争优势。那么就来研究一下如何利用合适的工具,提升数据分析的效率。

至于数据分析是什么以及有哪些种类,应该都有所了解,那么至于分析常规流程有哪些呢。一般包含如下步骤:

(1)目的明确,知道要分析什么

(2)知道数据如何获取

(3)处理获取到的数据

(4)分析数据

(5)得出分析结果

(6)验证

(7)展示分析结果

这些过程中,都离不开工具的帮助,熟练合理的运用分析工具就会事半功倍更好的处理数据并分析。

一般数据分析工具离不开excel以及三方工具,但今天我们介绍的三方工具就是python,相信大家也很熟悉,因为excel可以通过人工鼠标键盘操作数据,而python可以通过代码直接操作excel,比如导入或者导出数据,在批量操作执行方面,python是占据优势的。

data = pd.read_excel(filepath ”cilliantest.xlsx”)读取.xlsx文件

这里我们就不介绍如何安装官方版python,因为从官方下载后,虽然有很多现成的模块,但在调用之前需要自己手动安装需要的模块,这里对于初学python数据分析的小白还是不太友好,那么有没有直接安装打包好常用库的python工具呢,当然有,这里就来介绍一下Anaconda,这个工具其实就是python的一个开源版本,它的好处有啥呢,就是它自带一些常用的Python库,不需要自己手动安装,下面就介绍一下具体安装流程:

(1)打开官网https://www.anaconda.com ,点击Download按钮

(2)选择合适的系统和对应软件

我这是windows 64位的,大家不要选错哦

(3)点击下载后,双击安装包直接点next直到安装完成

(4)安装完成后,在电脑开始界面就会看到新添加的程序,看到这些说明python已经安装好了

(5)点击后打开浏览器web界面

说到这里,就得说一下,ide和idel,ide表示集成开发环境,就是用来提供开发环境的程序,一般会包含编辑器、编译器、调试器、UI界面等,idel是ide中最简单基础的一种,其他例如vscode、pycharm、spyder、jupter notebook都是idel,数据分析方面,大家用的比较多的就是jupter notebook。

(1)新建文件,点击右上角new,新建一个Python3文件

(2)编写程序文件

(3)编写并运行第一段代码

(4)新建后,文件名字还没定,可以重命名并保存

点击file-rename即可,点击file-save and checkpoint 会保存在默认路径下,文件格式是默认的jupternotbook格式ipynb.

到了这里就得开始学习python的一些基础知识了,学好之后就可以利用python进行数据操作分析。

需要知道这么几个概念:列表、字典、数组、字符串、循环语句、函数、模块。

学会以上的基础概念之后,就可以正式开始数据分析的操作了,这里会用到pandas、numpy、matplotlib这几个模块,直接导入即可:

>>>import pandas as pd

>>>import numpy as np

>>>import matplotlib.pyplot as plt

如何使用就需要更详细的描述,关于数据分析就介绍到这里,这些模块的具体使用,关注后期的更新,祝学习顺利!

END

作者|希里安

0 人点赞