项目四 OpenRefine 处理北京公交线路数据

2024-09-23 09:09:04 浏览数 (2)

服务器启动OpenRefine

  • 根目录下启动OpenRefine 脚本
  • 复制web地址至浏览器

导入csv数据

  • 左上角设置语言
  • 设置完毕点击右上角的新建项目

列格式的转换功能

  • 选中功能
  • 输入表达式 value.replace("运行时间:" , "")
  • 运行时间:替换为空字符串
  • 最后单击确定即可
  • 输入表达式value.replace("[", "").replace("]", "")
  • bus_type列的[]去掉

派生新的列

  • 派生公司列
  • 派生为服务热线列
  • 将服务热线的列转换出对应的格式
  • 输入表达式value.split("(")[1].split(":")[1].split(")")[0]
  • gongsi列的电话号码提取出来

导出数据

  • 右上角点击导出
  • 选择文件格式即可导出

0 人点赞