谢朴风--第一次编程作业
| 博客班级 | https://edu.cnblogs.com/campus/fzzcxy/2018CS |
|---|---|
| 作业要求 | https://edu.cnblogs.com/campus/fzzcxy/2018CS/homework/11732 |
| 作业目标 | 爬取腾讯视频《在一起》所有评论,分词处理后制作出词云图 |
| 作业源代码 | https://github.com/xiepiaofeng/first-personal-work/tree/main |
| 学号 | 211806136 |
时间记录
| 步骤 | 花费时间 |
|---|---|
| 1.进行数据采集 | 4h |
| 2.数据处理 | 3h |
| 3.数据分析 | 1h |
| 4.上传代码 | 1h |
1.网页分析
打开《在一起》的网页,进入评论界面,多次点击查看更多评论进行网页的分析

2.爬取评论
复习了上学期的爬虫知识然后对网页内容的进行了爬取,然后爬取评论的内容

3.数据处理
使用jieba库进行分词处理,因为是第一次接触然后比较不熟悉,在研究上面花费了不少时间,到网上找了一些常用的停词表,然后编写代码进行分词处理,将前面爬取的评论处理保存


4.制作词云图
去百度搜索模板,然后制作词云图

5.上传代码






6.总结
通过这次作业,更加熟悉了这块的内容,觉得学习起来还是比较容易的,因为以前学习的东西也不够多,所以要慢慢摸索,多花点时间去研究,才能更熟悉这块的内容。

浙公网安备 33010602011771号