hadoop-3.2.0------>入门三 本地模式 WordCount实例

2020-12-07 14:42:04 浏览数 (1)

1、进入hadoop根目录下

2、创建wcinput文件夹(命令:mkdir mcinput)

3、进入wcinput文件夹(命令:cd wcinput)

4、创建wc.input文件(命令:touch wc.input)

5、对 wc.input进行编辑添加数据(命令 vi wc.input)

6、点击i进行编辑

7、保存并退出(先点击esc退出编辑模式,然后输入wq!进行保存并退出)

8、返回到hadoop根目录下

9、输入命令 bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-3.2.0.jar wordcount wcinput wcoutput

bin/hadoop jar:执行一个jar文件

share/hadoop/mapreduce/hadoop-mapreduce-examples-3.2.0.jar :文件所在的目录 examples因为加s了肯定是多个案例

wordcount :因为examples是多个案例我们这里执行的是wordcount 案例

wcinput :输入文件夹

wcoutput :输出文件夹,名字可以随意取,一般会以执行的文件名字 output命名

注意:这里的output文件夹不能存在,如果存在将会报错,在执行命令时会自动创建wcoutput 文件夹

10、进入wcoutput文件夹(命令:cd wcoutput)

11、查看文件夹中的文件(命令:dir),看到_SUCCESS文件即执行成功

12、查看part-r-00000文件中内容(命令:cat part-r-00000)

前面的拼音代表我们之前创建的wc.input文件中的内容有哪些,后面数字即该名称出现的次数

0 人点赞