随笔-159  评论-57  文章-1  trackbacks-3

本以为数据填充会简单点,没想到做了这么多工作,还不能很好的拿出数据来
主要是程序本来处理的比较好时添加了实验的数据统计模块,这些模块的差错
导致系统的段错误!
经过3天的时间这个问题终于解决了~~
现在能够正确的采集实验数据了!
下面是部分数据的填充工作:
 

词组类型

单字

双字词

多字词

字节数

2Byte

4Byte

>4Byte

同字长的总词数

6475

70325

96777

约占总词数比例

0.0373

0.40544

0.55755


 

 

单字词

双字词

多字词

单字词

28

7502

11275

双字词

3630

40307

62412

多字词

1085

11819

19596


 

 

单字词

双字词

多字词

单字词

60444

0

0

双字词

0

63944

0

多字词

0

0

87661


实验完毕~论文完毕!
呵呵~~
posted on 2007-06-11 15:28 riky 阅读(207) 评论(2)  编辑 收藏 所属分类: Search Engine

评论:
#1楼  2007-06-17 21:59 | 柚子Nan      
这是什么?
  回复  引用  查看    
#2楼  2007-06-18 18:18 | riky [未注册用户]
实验数据
不同字长的词的冲突数~~
  回复  引用    

标题  
姓名  
主页
Email (博主才能看到) 
验证码 *  看不清,换一张 [登录][注册]
内容(请不要发表任何与政治相关的内容)  
  登录  使用高级评论  新用户注册  返回页首  恢复上次提交      
该文被作者在 2007-06-21 17:58 编辑过


相关链接: