代码语言:javascript复制
近期小编也开始学习python语音,基于VSCODE开发一些数据分析,API接口导入,一直技术难点就是如何对接EXCEL中的数据,
终于在网络上总结获取到pands数据分析导入的能力,故分享给大家,谢谢
一,CSV文件读和写
(1)通过标准的Python中的库导入CSV文件
CSV,用来处理CSV文件,这个类库中的阅读器()函数用来读入CSV文件。
当CSV文件被读入后,可以利用这些数据生成一个numpy的数组,用来训练算法模型。
代码语言:javascript复制#!/usr/bin/python3
from csv import reader
import numpy as np
filename='pima_data.csv' #这个文件中所有数据都是数字,并且数据中不包含文件头。
with open(filename,'rt') as raw_data:
readers = reader(raw_data, delimiter=',')
x=list(readers)
data=np.array(x).astype('float')
print(data.shape)
(2)采用numpy的导入CSV文件
可以使用Munpy的loadtxt()函数导入数据。
使用这个函数处理的数据没有文件头,并且所有的数据结构都是一样的,也就是说,数据类型都是一样的。
代码语言:javascript复制#!/usr/bin/python3
import numpy as np
filename='pima_data.csv'
with open(filename,'rt') as raw_data:
data=loadtxt(raw_data,delimiter=',')
print(data.shape)
(3)采用Pandas导入CSV文件 - 机器学习项目中常用来做数据清洗与数据准备工作,推荐使用。
使用熊猫来导入文件需要使用pandas.read_csv()函数。这个函数的返回值是数据帧,可以很方便地进行下一步的处理。
代码语言:javascript复制#!/usr/bin/python3
from pandas import read_csv
filename='iris.data.csv'
names=['separ-length','separ-width','petal-length','petal-width','class']
dataset=read_csv(filename,names=names)
print(dataset.shape)