R语言:读取中文数据乱码的解决方案

2019-02-18 15:16:32 浏览数 (1)

R语言不是中国人开发的,自然对中文的处理上没有特别考虑,但是我们依然可以处理。

下面我给出了解决方案。但我想,别的读取解决方案应该也是一样的。不信,可以看我的下一篇文章对各种类型的中文数据的读取。

一个例子,R语言读取excel表的中文数据,关于excel表的读取请看博客R语言包gdata读取excel文件。

代码语言:javascript复制
setwd("..")#设置工作目录
getwd()#查看工作目录
> a<-read.xls("watermelon.xlsx",sheet=1,header =T)
> a
  缂栧彿 鑹叉辰 鏍硅拏 鏁插0 绾圭悊 鑴愰儴 瑙.劅
1      4 闈掔豢 铚风缉 娌夐椃 娓呮櫚 鍑归櫡 纭粦
2      6 闈掔豢 绋嶈湻 娴婂搷 娓呮櫚 绋嶅嚬 杞矘
3      8 涔岄粦 绋嶈湻 娴婂搷 娓呮櫚 绋嶅嚬 纭粦
4     10 闈掔豢  纭尯 娓呰剢 娓呮櫚 骞冲潶 杞矘
5     12 娴呯櫧 铚风缉 娴婂搷 妯$硦 骞冲潶 杞矘
6     14 娴呯櫧 绋嶈湻 娌夐椃 绋嶇硦 鍑归櫡 纭粦
7     16 娴呯櫧 铚风缉 娴婂搷 妯$硦 骞冲潶 纭粦
                                                        濂界摐
1  鏄xaf"n5,娴呯櫧,铚风缉,娴婂搷,娓呮櫚,鍑归櫡,纭粦,鏄xaf"
2  鏄xaf"n7,涔岄粦,绋嶈湻,娴婂搷,绋嶇硦,绋嶅嚬,杞矘,鏄xaf"
3  鏄xaf"n9,涔岄粦,绋嶈湻,娌夐椃,绋嶇硦,绋嶅嚬,纭粦,鍚xa6"
4  鍚xa6"n11,娴呯櫧,纭尯,娓呰剢,妯$硦,骞冲潶,纭粦,鍚xa6"
5 鍚xa6"n13,闈掔豢,绋嶈湻,娴婂搷,绋嶇硦,鍑归櫡,纭粦,鍚xa6"
6 鍚xa6"n15,涔岄粦,绋嶈湻,娴婂搷,娓呮櫚,绋嶅嚬,杞矘,鍚xa6"
7 鍚xa6"n17,闈掔豢,铚风缉,娌夐椃,绋嶇硦,绋嶅嚬,纭粦,鍚xa6"

乱码了,下面来处理。

代码语言:javascript复制
> a<-read.xls("watermelon.xlsx",sheet=1,header =T,fileEncoding="utf8")
> a
   编号 色泽 根蒂 敲声 纹理 脐部 触感 好瓜
1     1 青绿 蜷缩 浊响 清晰 凹陷 硬滑   是
2     2 乌黑 蜷缩 沉闷 清晰 凹陷 硬滑   是
3     3 乌黑 蜷缩 浊响 清晰 凹陷 硬滑   是
4     4 青绿 蜷缩 沉闷 清晰 凹陷 硬滑   是
5     5 浅白 蜷缩 浊响 清晰 凹陷 硬滑   是
6     6 青绿 稍蜷 浊响 清晰 稍凹 软粘   是
7     7 乌黑 稍蜷 浊响 稍糊 稍凹 软粘   是
8     8 乌黑 稍蜷 浊响 清晰 稍凹 硬滑   是
9     9 乌黑 稍蜷 沉闷 稍糊 稍凹 硬滑   否
10   10 青绿 硬挺 清脆 清晰 平坦 软粘   否
11   11 浅白 硬挺 清脆 模糊 平坦 硬滑   否
12   12 浅白 蜷缩 浊响 模糊 平坦 软粘   否
13   13 青绿 稍蜷 浊响 稍糊 凹陷 硬滑   否
14   14 浅白 稍蜷 沉闷 稍糊 凹陷 硬滑   否
15   15 乌黑 稍蜷 浊响 清晰 稍凹 软粘   否
16   16 浅白 蜷缩 浊响 模糊 平坦 硬滑   否
17   17 青绿 蜷缩 沉闷 稍糊 稍凹 硬滑   否

OK啦,完美解决。好高兴,好有成就感哟!

0 人点赞