最近做课程作业,需求解TSP问题(旅行商问题),数据集格式均是.tsp格式的,下面就用pandas来进行数据的加载,并转换成列表形式。
具体步骤
1、查看源数据
在pycharm中可以打开tsp文件,可以发现,所有数据集格式都一致,从第七行开始是具体数据,第一列是标号,第二列是城市的x坐标,第三列是城市y坐标。
2、加载文件
使用pandas的read_csv接口可以成功加载很多格式的文件。 接口有很多参数,具体可以参见pandas.read_csv参数整理
代码语言:javascript复制df = pd.read_csv('./TSP问题测试数据集/att48.tsp', sep=" ", skiprows=6, header=None)
这里选用了三个参数: sep为空格,即不同列数据以空格形式分隔; skiprows=6,跳过前7行,注:skiprows以0作为第一行; header = None 即纯数据,不包含表格。
3、读取城市序号
进行完上面的操作后,df就成为了一个DateFrame对象,索引时需注意,第一个为列标,第二个为行标(和二维数组的索引顺序相反)
由于最后一行以EOF结束,因此我们需读取len(df)-1行内容。
代码语言:javascript复制city = np.array(df[0][0:len(df)-2])
这里用到的是numpy的array,通过tolist,可以将其转换成列表。
代码语言:javascript复制city_name = city.tolist()
4、读取城市坐标
读取城市坐标和上面就比较类似了,分别用两个array进行读取,之后再用zip一一配对。
代码语言:javascript复制city_x = np.array(df[1][0:len(df)-2])
city_y = np.array(df[2][0:len(df)-2])
city_location = list(zip(city_x, city_y))
注:直接用zip打印出的是对象的地址信息,需在外套一层list转换。
完整代码
代码语言:javascript复制import pandas as pd
import numpy as np
# 载入数据
df = pd.read_csv('./TSP问题测试数据集/att48.tsp', sep=" ", skiprows=6, header=None)
city = np.array(df[0][0:len(df)-2]) # 最后一行为EOF,不读入
city_name = city.tolist()
# print(city_name)
city_x = np.array(df[1][0:len(df)-2])
city_y = np.array(df[2][0:len(df)-2])
city_location = list(zip(city_x, city_y))
# print(city_location)