KNIME学习笔记1:解决官方项目中MissingCell错误

博客园开篇第一篇随笔啊!!!!

1.KNIME的简单介绍参见:

http://www.cnblogs.com/suokun/archive/2011/07/09/2101857.html

2.最近信息组织研究课程需要使用SQL  Server进行数据挖掘,我个人比较讨厌数据挖掘,所以就想着一个其他数据挖掘的开源工具,然后就找到了下面这篇博文:

五个免费开源的数据挖掘软件 :http://news.cnblogs.com/n/84399/

本来同学用了Orange,据说可视化比较好,然后我又分析了一下,发现KNIME在很多方面都比较好一点,而且基于Eclipse,所以,就选他做作业了,找到了官网:

http://tech.knime.org/

然后就想跟着官网学习,想做个分类之类的吧,就找到了官方的实验项目:http://tech.knime.org/examples

这里直接能够下载项目源码,然后导入都KNIME工程中就好了,很方便学习,然后,我导入了一个分类的项目(Workflow)才发现,根本没那么简单,也不知道什么情况,在进行一些节点执行的时候总是出现下面的错误:(比如我在使用Bow Creator(词袋生成器))的时候:

ERROR  BoW creator  Execute failed: org.knime.core.data.DataType$MissingCell cannot be cast to org.knime.ext.textprocessing.data.DocumentValue

我想,官方给的怎么会处错误呢,但是查看这个错误是类型无法强制转换的错误,然后找了N年,官网,各种搜,一直无果,纠结死了,最后一次关键词选择对了,我直接搜索,“Missing Cell”,然后,竟然链接到了下面这个网址(这个是介绍Missing Cell这个节点的页面):

http://www.knime.org/files/nodedetails/_manipulation_column_column_transform_Missing_Value.html

简单看了一下介绍,一下子茅塞顿开啊,原来,KNIME的节点库里面还有这样一个节点,所以,我尝试着在Bow Creator和前面的一个节点中间加了这个节点(注意:还需要设置一下Configure:在String Columns的时候选择remove row,在unknown columns也选择remove row),竟然一下子跑通了,哎,高兴死我了,时间一看,现在已经是将近凌晨3点了。想来,碰到这样的问题,还是要淡定,仔细分析,最快速的寻找解决之道啊。其实就是一些丢失的行导致的错误,这里设置直接删除这一行就可以了,因为我检查之前的数据,有些数据的行内容就是一些问号(?),但是当时不知道怎么办。

另外就像说,官方给的项目怎么会有这样的毛病呢,坑爹呢是,可浪费了我大把青春时光呢。

不知道大家有没有碰到这个情况,可能我比较笨一些,这么久才找到解决方法,或者说是对官方的东西太信任了些;如果有没有解决的,试一下这个方法。

 发一张错误图片吧:

posted @ 2012-11-24 02:52  天外的星星  阅读(1611)  评论(1编辑  收藏  举报