2018年8月24日

sohu_news搜狐新闻类型分类

摘要: 数据获取 数据是从搜狐新闻开放的新闻xml数据,经过一系列的处理之后,生成的一个excel文件 该xml文件的处理有单独的处理过程,就是用pandas处理,该过程在此省略 读取新闻文本文件,查看文本的长度 去掉长度小于50的文本 查看新闻类型的分布,共9类 health 30929 news 276 阅读全文

posted @ 2018-08-24 17:16 多一点 阅读(937) 评论(1) 推荐(0)

导航