注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

anqiang专栏

不要问细节是怎么搞的,源码说明一切

 
 
 

日志

 
 

J48实现中的一些问题 一  

2009-05-24 10:50:16|  分类: Weka 学习系列 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

图形界面下叶子节点后数字的涵义

   在最近的研究中,遇到了一些关于J48实现上的问题,在这里提供出来供大家参考.有一个问题是这样的.

J48实现中的一些问题(一) - 笨笨 - anqiang专栏

我们看到这个图是J48”labor.arff”样本集上生成的树.在叶子节点上有这样的描述, “wage-increase-first-year <= 2.5: bad (15.27/2.27)”, 后面的(15.27/2.27)是什么意思.

通过查看一下代码我们可以发现它们的含义:

 

public final String dumpLabel(int index,Instances data) throws Exception {

 

    StringBuffer text;

 

    text = new StringBuffer();

   

    /*

     * 打印出在m_distribution中权重最高的 atrribute

     */

    text.append(((Instances)data).classAttribute().

       value(m_distribution.maxClass(index)));

    /*

     *

     * 打印出在m_distribution中权重最高的 atrribute 对应的样本权重

     */

    text.append(" ("+Utils.roundDouble(m_distribution.perBag(index),2));

    /*

     * 当叶子节点错误样本的权重大于0是我们将错误样本的权重打印出来

     * 这就是我们在"/"后面看到得结果

     */

    if (Utils.gr(m_distribution.numIncorrect(index),0))

      text.append("/"+Utils.roundDouble(m_distribution.numIncorrect(index),2));

    text.append(")");

 

    return text.toString();

  }

这个函数在 weka.classifiers.trees.j48.ClassifierSplitModel.至于m_distribution是如何工作地,相信在其它地方可以找到答案,我就写到这里了.

  评论这张
 
阅读(793)| 评论(2)
推荐 转载

历史上的今天

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017