注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

Koala++'s blog

计算广告学 RTB

 
 
 

日志

 
 

Weka开发[2]-分类器类  

2008-11-28 19:35:26|  分类: 机器学习 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

       这次介绍如何利用weka里的类对数据集进行分类,要对数据集进行分类,第一步要指定数据集中哪一列做为类别,如果这一步忘记了(事实上经常会忘记)会出现Class index is negative (not set)!这个错误,设置某一列为类别用Instances类的成员方法setClassIndex,要设置最后一列为类别则可以用Instances类的numAttributes()成员方法得到属性的个数再减1

    然后选择分类器,比较常用的分类器有J48NaiveBayesSMOLibSVMJava版的,可以在weka中使用,但要设置路径),训练分类器使用J48buildClassifier(注意J48还有别的分类器它们都继承自Classifier类,使用方法都差不多),分类数据用J48类中的classifyInstance方法,例中使用的数据集为contact-lenses.arff,分类结果为2.0,结果为2.0的原因是:首先用文本编辑器打开数据集,有一行为@attribute contact-lenses {soft, hard, none},而第一个样本为young, myope, no, reduced, none,最后一列为类别,也就是contact-lences为类别,第一个样本的类别为none,在属性说明中none为第二个所以为2.0(从0开始数)。

 

package instanceTest;

 

import java.io.FileReader;

 

import weka.classifiers.trees.J48;

import weka.core.Instances;

 

public class ClassifierTest

{

    private Instances m_instances = null;

   

    public void getFileInstances( String fileName ) throws Exception

    {

        FileReader frData = new FileReader( fileName );

        m_instances = new Instances( frData );

       

        m_instances.setClassIndex( m_instances.numAttributes() - 1 );

    }

   

    public void classify() throws Exception

    {

        J48 classifier = new J48();

        //NaiveBayes classifier = new NaiveBayes();

        //SMO classifier = new SMO();

       

        classifier.buildClassifier( m_instances );

        System.out.println( classifier.classifyInstance( m_instances.instance( 0 ) ) );

    }

   

    public static void main( String[] args ) throws Exception

    {

        ClassifierTest ctest = new ClassifierTest();

       

        ctest.getFileInstances( "F://Program Files//Weka-3-4//data//contact-lenses.arff");

        ctest.classify();

    }

}

 

  评论这张
 
阅读(8170)| 评论(17)
推荐 转载

历史上的今天

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017