第一部分 命令行
第一章 命令行入门
1.1 引言
在首次实验中,使用图形界面会很方便,然而,我们还是推荐在深入的使用中使用命令行界面。因为,它提供了一些图形界面无法访问到的功能,而且占用更少内存。你应该给java虚拟机增加堆的最大容量来避免内存错误,一般是通过 -Xmx1024M
或者 -Xmx1024m
分配1GB的空间,默认的64MB太小了。如果你遇到了“找不到指定类”的错误,检查你的CLASSPATH
目录下面有没有存放weka.jar
。你也可以使用 -cp
命令来显式指定 CLASSPATH
目录。
我们会从基础的概念和思想讲起,然后是 weka.filters
包,它用来转换输入数据,例如预处理、转化、特征聚集以及其他。
接着,我们会关注机器学习的算法本身,他们在weka中叫做分类器。我们会限制在所有分类器的通用设置上,并稍微讲解一下机器学习中所有主要方法的典型方法。
再接着,会提供一些实践性的例子。
最后,在weka的文档目录中,你可以找到所有weka中的java类。准备好使用它们,因为这个手册不会提供完整的描述。如果你想知道他们的内部机制,请查看具有良好注释的源代码。它们可以在 weka-src.jar
中找到,并且可以在jdk提供的jar工具里查看(或者任何可以解压缩zip格式文件程序都行)。