2015年12月13日

Github博客地址

摘要: 欢迎访问我的Github博客:J.R.Smith_blog 阅读全文

posted @ 2015-12-13 15:57 JRSmith 阅读(320) 评论(0) 推荐(0) 编辑

2015年3月3日

三种常见字符编码简介:ASCII、Unicode和UTF-8

摘要: 什么是字符编码? 计算机只能处理数字,如果要处理文本,就必须先把文本转换为数字才能处理。最早的计算机在设计时采用8个比特(bit)作为一个字节(byte),所以,一个字节能表示的最大的整数就是255(二进制11111111=十进制255),如果要表示更大的整数,就必须用更多的字节。比如两个字节可... 阅读全文

posted @ 2015-03-03 14:53 JRSmith 阅读(28875) 评论(6) 推荐(11) 编辑

2014年11月12日

自动文档摘要评价方法:Edmundson,ROUGE

摘要: 自动文档摘要评价方法大致分为两类:(1)内部评价方法(Intrinsic Methods):提供参考摘要,以参考摘要为基准评价系统摘要的质量。系统摘要与参考摘要越吻合, 质量越高。(2)外部评价方法(Extrinsic Methods):不提供参考摘要,利用文档摘要代替原文档执行某个文档相关的应... 阅读全文

posted @ 2014-11-12 17:05 JRSmith 阅读(11062) 评论(0) 推荐(0) 编辑

2014年11月5日

Learning LexRank——Graph-based Centrality as Salience in Text Summarization(一)

摘要: (1)What isSentence Centrality and Centroid-based Summarization ? Extractive summarization works by choosing a subset of the sentences in the original... 阅读全文

posted @ 2014-11-05 21:56 JRSmith 阅读(1203) 评论(0) 推荐(0) 编辑

导航