王瑞---第一次个人编程作业

博客班级 https://edu.cnblogs.com/campus/fzzcxy/2018CS
作业要求 https://edu.cnblogs.com/campus/fzzcxy/2018CS/homework/11732
作业目标 爬取腾讯视频《在一起》并且进行高频词统计和词云图展示
作业源代码 https://github.com/wr110/first-personal-work
学号 211806238

时间分布

要求 内容
代码行数 28行
分析时间 2h
编程时间 2h
步骤
通过比对网页的url, 只有last_id是不同的
打开js界面,有v2开头的点开可以看到如下界面
这里是用正则匹配last,内容保存在comment.txt中
内容如下
数据处理
下载jieba
这里是利用pycharm导入jieba包
在网上搜索了关于jieba包的使用方法和操作
以下是代码
统计了共20个高频词
利用js插件echarts.js,绘制词云图
之前没有学过html的内容
所以从网上下载echarts的插件后百度了模板将数据输入

posted on 2021-02-25 17:30  WR==  阅读(90)  评论(0编辑  收藏  举报

导航