一、主要介绍12种
1.传统的数据挖掘套件(Classic suites):
SAS Enterprise Miner 5.3 SPSS Clementine 12 2.开源数据挖掘软件(Open Source): Weka 3.4.13 RapidMiner 4.2 KNIME 1.3.5
3.自动化数据挖掘软件(Self-Acting): KXEN Analytic Framework 4.04 4.专门化的数据挖掘软件(Specialized): Viscovery SOMiner 5.0 prudsys Discovery 5.5 / Basket Analyzer 5.2 Bissantz Delta Master 5.3.6 5.BI产品内置的数据挖掘软件(BI Vendors): SAP NetWear 7.0 Data Mining Workbench Oracle 11g Data Mining Microsoft SQL Server 2005 Analysis Services
二、按公司分类
SAS公司的 Enterprise Miner; IBM公司的 Intelligent Miner; SPSS公司的 Clementine; Statsoft公司的Statistica Data Miner;
DB Miner公司的 DBMiner; NCR公司的Teradata Warehouse Miner; Unica公司的Affinium Model; Insightful公司的Insightful Miner;
Data Miner 公司的RIK, EDM and DMSK; Information Discovery 公司的Data Mining Suite; Angoss 公司的 KnowledgeSTUDIO;
Data Mining Technologies 公司的 Nuggets; Fujitsu公司的 GhostMiner; Oracle公司的 Darwin;
神州通用:国产的K-Miner数据挖掘软件: MPP SMP并行计算架构,是目前唯一的所有算法都实现了并行化数据挖掘软件;27个数据挖掘算法 13个统计分析算法;大部分算法执行速度都远快于SPSS等的相应算法。(http://www.shentongdata.com/?bid=3&eid=354 )
三.比较著名的有IBM Intelligent Miner、SAS Enterprise Miner、SPSS Clementine等,它们都能够提供常规的挖掘过程和挖掘模式。
3.1 Intelligent Miner
由美国IBM公司开发的数据挖掘软件Intelligent Miner是一种分别面向数据库和文本信息进行数据挖掘的软件系列,它包括Intelligent Miner for Data和Intelligent Miner for Text。Intelligent Miner for Data可以挖掘包含在数据库、数据仓库和数据中心中的隐含信息,帮助用
户利用传统数据库或普通文件中的结构化数据进行数据挖掘。它已经成功应用于市场分析、诈骗行为监测及客户联系管理等;Intelligent Miner for Text允许企业从文本信息进行数据挖掘,文本数据源可以是文本文件、Web页面、电子邮件、Lotus Notes数据库等等。
3.2 Enterprise Miner[5]
这是一种在我国的企业中得到采用的数据挖掘工具,比较典型的包括上海宝钢配矿系统应用和铁路部门在春运客运研究中的应用。SAS Enterprise Miner是一种通用的数据挖掘工具,按照“抽样——探索——转换——建模——评估”的方法进行数据挖掘。可以与SAS数据仓库和OLAP集成,实现从提出数据、抓住数据到得到解答的“端到端”知识发现。
3.3 SPSS Clementine
SPSS Clementine是一个开放式数据挖掘工具,曾两次获得英国政府SMART 创新奖,它不但支持整个数据挖掘流程,从数据获取、转化、建模、评估到最终部署的全部过程,还支持数据挖掘的行业标准——CRISP-DM。 Clementine的可视化数据挖掘使得"思路"分析成为可能,即将集中精力在要解决的问题本身,而不是局限于完成一些技术性工作(比如编写代码)。提供了多种图形化技术,有助理解数据间的关键性联系,指导用户以最便捷的途径找到问题的最终解决办法。
其它常用的数据挖掘工具还有LEVEL5 Quest 、MineSet (SGI) 、Partek 、SE-Learn 、SPSS 的数据挖掘软件Snob、Ashraf Azmy 的SuperQuery 、WINROSA 、XmdvTool 等。
四、比较适合初学者者的有Weka, Spss clementine. 特别是前一个软件,如果想自己更深入学习的话,我们可以用Java 编程设计相应功能的算法来拓展Weka,因为其源代码是开源的,我们可以扩充并重新编译。
为什么要拓展Weka?
1. 需要加入第三方的构件。
2. 需要加入自己设计或者改进的算法
3. 需要将Weka整合到实际的应用系统中。
要点:
1. 重新编译Weka
2. 加入新算法(第三方、自己设计或者改进)。
3. 在自己的Java程序中使用Weka。