摘要: 介绍 随着近几年文本信息的爆发式增长,人们每天能接触到海量的文本信息,如新闻、博客、聊天、报告、论文、微博等。从大量文本信息中提取重要的内容,已成为我们的一个迫切需求,而自动文本摘要(automatic text summarization)则提供了一个高效的解决方案。 根据Radev的定义[3], 阅读全文
posted @ 2019-06-06 21:08 静悟生慧 阅读(8687) 评论(0) 推荐(1)
摘要: 1.日期格式转换(将yyyymmdd转换为yyyy-mm-dd) 2..hive去掉字段中除字母和数字外的其它字符 3.hive解析json字段 content字段存储json {"score":"100","name":"zhou","class":''math"},若要对json进行解析,则可用 阅读全文
posted @ 2019-06-06 17:59 静悟生慧 阅读(1233) 评论(0) 推荐(0)