谢朴风--第一次编程作业

博客班级 https://edu.cnblogs.com/campus/fzzcxy/2018CS
作业要求 https://edu.cnblogs.com/campus/fzzcxy/2018CS/homework/11732
作业目标 爬取腾讯视频《在一起》所有评论,分词处理后制作出词云图
作业源代码 https://github.com/xiepiaofeng/first-personal-work/tree/main
学号 211806136

时间记录

步骤 花费时间
1.进行数据采集 4h
2.数据处理 3h
3.数据分析 1h
4.上传代码 1h

1.网页分析
打开《在一起》的网页,进入评论界面,多次点击查看更多评论进行网页的分析

2.爬取评论
复习了上学期的爬虫知识然后对网页内容的进行了爬取,然后爬取评论的内容

3.数据处理
使用jieba库进行分词处理,因为是第一次接触然后比较不熟悉,在研究上面花费了不少时间,到网上找了一些常用的停词表,然后编写代码进行分词处理,将前面爬取的评论处理保存


4.制作词云图
去百度搜索模板,然后制作词云图

5.上传代码






6.总结
通过这次作业,更加熟悉了这块的内容,觉得学习起来还是比较容易的,因为以前学习的东西也不够多,所以要慢慢摸索,多花点时间去研究,才能更熟悉这块的内容。

posted @ 2021-02-26 21:04  谢朴风  阅读(63)  评论(0)    收藏  举报