今天给大家介绍一个在R语言中实现了可视化的操作界面的包rattle。此包主要用来实现数据的挖掘的相关功能。首先我们看下包的安装:
代码语言:javascript复制install.packages(“RGtk2”)
install.packages(“rattle”)
接下来我们进行详细界面的解说,通过rattle()函数我们可以启动此包的可视化操作界面,如下:
首先是数据的载入,此包提供了八种数据的载入形式,其实我们正常用到的不过是file(从文件读入),Rdata(R语言生成的数据)。我们直接使用此包自带的数据集,所以直接点击“Execute”会出现下面的页面:
点击“Yes”后就看到载入的数据了:
这样,我们的数据集已载入工作环境,我们可以首先进行一个简单的数据描述性统计,我们需要选择“Explore”目录,然后就可以看到描述性统计以及相关的PCA分析,相关性分析等。当然如果相关的功能包未安装时,他会提醒安装:
我们直接看下实例,首先是描述性总结:
然后是主成分分析,会产生各成分的数据以及极坐标图
当然我们也可以借助ggraptR包对数据进行交互式操作:
接下来就是各种统计检验分析,基本都包括了,你只需要选择对应的列就行:
我们直接看下实例:
然后是数据的标准化处理界面:
最后是模型模块,包括了聚类分类模型的构建:
聚类模型:
关联规则分析:
分类模型:
分类模型构建的优化,及结果的展示:
当然,如果你觉得想把程序保留下来,那么也是可以的,通过下面的log栏目直接复制粘贴就好:
另外,此包还有个强大的功能就是顶部的导航栏:
这样整个数据挖掘的分析过程都包含在这个包里了,是不是很方便,就是不知道在数据量很大的时候会不会卡死。
欢迎大家学习交流!