第三次作业
博客班级 | https://edu.cnblogs.com/campus/fzzcxy/Freshman/ |
---|---|
作业要求 | https://edu.cnblogs.com/campus/fzzcxy/Freshman/homework/11734 |
作业目标 | <学习并利用爬虫获取资料,使用Git习惯> |
作业源代码 | https://github.com/L-MuSo/WinterVacationHomework/tree/main |
学号 | <212010132> |
一.利用爬虫功能,分析豆瓣上的短评
1.搜索豆瓣:刺杀小说家
右击查看页面源代码
数据采集
下拉搜索到短评位置
2.下载结巴库,安装pycharm
这里遇到困难,下载好文件后,网络教程大多默认解压即可使用
这里借鉴了哔哩哔哩的这位up主的方法,简单明了!
成功安装结巴库
数据处理
试运行成功
同理安装pycharm
3.pycharm运行结巴库!
出现import jieba运行失败,说明未能安装成功!
学习方法一:https://blog.csdn.net/weixin_44115959/article/details/104088986
这个方法基本与python安装结巴库一致,但遗憾的是我并没有能在pycharm文件里找到site开头的文件,也许是版本的问题
学习方法二:https://blog.csdn.net/weixin_44014654/article/details/88910862?ops_request_misc=&request_id=&biz_id=102&utm_term=pycharm安装jieba库&utm_medium=distribute.pc_search_result.none-task-blog-2~
至此网上无法查到别的方法
4.学习你好,李焕英影评提取方式
应用https://blog.csdn.net/IT_charge/article/details/113979633?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522161442467116780274166239%2522%252C%2522scm%2522%253A%252220140713.130102334.pc%255Fall.%2522%257D&request_id=161442467116780274166239&biz_id=0&utm_medium=distribute.pc_search_result.none-task-blog-2allfirst_rank_v2~rank_v29-2-113979633.first_rank_v2_pc_rank_v29&utm_term=%E7%88%AC%E8%99%AB%E4%BD%A0%E5%A5%BD%E6%9D%8E%E7%84%95%E8%8B%B1%E7%9A%84%E8%AF%84%E4%BB%B7
爬取代码
制作词云
二.Git
https://github.com/L-MuSo/WinterVacationHomework/tree/main
制作一部分后运行出现问题
三.随笔
分析刺杀小说家影评失败了,并且发现了网络世界的深奥。首先在安装软件上我就花费了大量的时间,同时也发现百度不是万能的,有的时候反应不过来的点很难用语言表达的,百度也很难找到合适的答案(不能说百度没有,但是我找不到的话百度也就没有了作用)。
学习到了利用python做这一项有趣的小事情,尽管我不是很成功,但是接下去我还会继续研究,争取之后能做出刺杀小说家的影评提取和词云数据分析!