王瑞---第一次个人编程作业
| 博客班级 | https://edu.cnblogs.com/campus/fzzcxy/2018CS |
|---|---|
| 作业要求 | https://edu.cnblogs.com/campus/fzzcxy/2018CS/homework/11732 |
| 作业目标 | 爬取腾讯视频《在一起》并且进行高频词统计和词云图展示 |
| 作业源代码 | https://github.com/wr110/first-personal-work |
| 学号 | 211806238 |
时间分布
| 要求 | 内容 |
|---|---|
| 代码行数 | 28行 |
| 分析时间 | 2h |
| 编程时间 | 2h |
| 步骤 | |
| 通过比对网页的url, 只有last_id是不同的 | |
| 打开js界面,有v2开头的点开可以看到如下界面 | |
![]() |
|
![]() |
|
| 这里是用正则匹配last,内容保存在comment.txt中 | |
![]() |
|
| 内容如下 | |
![]() |
|
| 数据处理 | |
| 下载jieba | |
| 这里是利用pycharm导入jieba包 | |
| 在网上搜索了关于jieba包的使用方法和操作 | |
![]() |
|
| 以下是代码 | |
![]() |
|
| 统计了共20个高频词 | |
![]() |
|
| 利用js插件echarts.js,绘制词云图 | |
| 之前没有学过html的内容 | |
| 所以从网上下载echarts的插件后百度了模板将数据输入 | |
![]() |
|
![]() |









浙公网安备 33010602011771号