rapidminer是一个开源数据挖掘软件,其可视化和工作流应该算是其亮点,当然该产品相应的商业化版本介绍中已经融合了R和hadoop等大数据框架。
两年前曾经在sourceforge.net上下载过源码,可是后悔当时很多插件都没有下载,现在一个朋友想要点这方面的资料,再上一下sourceforge,居然被清空了。
不过主体程序还在,就将以前编译的版本在博客上贴一下。这个源码的编译记得还是得费些功夫的,主要是两块:
(1) openjdk的问题,这个当然可以以巧妙的方式跳过去。如对文件的操作和AWT的扩展问题,这些还是有其他包来处理的。
(2) 6.5版本中的license问题,这个是无解的,涉及到其商业化版本的注册机制问题,所以网上肯定也找不到相关的JAR包。
当然现在已经不搞这个了,做大规模数据挖掘用这个软件还是限制挺大的。