第三次作业

博客班级 https://edu.cnblogs.com/campus/fzzcxy/Freshman/
作业要求 https://edu.cnblogs.com/campus/fzzcxy/Freshman/homework/11734
作业目标 <学习并利用爬虫获取资料,使用Git习惯>
作业源代码 https://github.com/L-MuSo/WinterVacationHomework/tree/main
学号 <212010132>

一.利用爬虫功能,分析豆瓣上的短评

1.搜索豆瓣:刺杀小说家

右击查看页面源代码


数据采集

下拉搜索到短评位置

2.下载结巴库,安装pycharm

这里遇到困难,下载好文件后,网络教程大多默认解压即可使用

这里借鉴了哔哩哔哩的这位up主的方法,简单明了!

https://www.bilibili.com/video/BV1RV411h7p4?p=1&share_medium=android&share_plat=android&share_source=QQ&share_tag=s_i&timestamp=1614422915&unique_k=xmnsV8

成功安装结巴库

数据处理

试运行成功

同理安装pycharm

3.pycharm运行结巴库!


出现import jieba运行失败,说明未能安装成功!

学习方法一:https://blog.csdn.net/weixin_44115959/article/details/104088986

这个方法基本与python安装结巴库一致,但遗憾的是我并没有能在pycharm文件里找到site开头的文件,也许是版本的问题

学习方法二:https://blog.csdn.net/weixin_44014654/article/details/88910862?ops_request_misc=&request_id=&biz_id=102&utm_term=pycharm安装jieba库&utm_medium=distribute.pc_search_result.none-task-blog-2~

至此网上无法查到别的方法

4.学习你好,李焕英影评提取方式

应用https://blog.csdn.net/IT_charge/article/details/113979633?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522161442467116780274166239%2522%252C%2522scm%2522%253A%252220140713.130102334.pc%255Fall.%2522%257D&request_id=161442467116780274166239&biz_id=0&utm_medium=distribute.pc_search_result.none-task-blog-2allfirst_rank_v2~rank_v29-2-113979633.first_rank_v2_pc_rank_v29&utm_term=%E7%88%AC%E8%99%AB%E4%BD%A0%E5%A5%BD%E6%9D%8E%E7%84%95%E8%8B%B1%E7%9A%84%E8%AF%84%E4%BB%B7

爬取代码


制作词云


二.Git

https://github.com/L-MuSo/WinterVacationHomework/tree/main
制作一部分后运行出现问题

三.随笔

分析刺杀小说家影评失败了,并且发现了网络世界的深奥。首先在安装软件上我就花费了大量的时间,同时也发现百度不是万能的,有的时候反应不过来的点很难用语言表达的,百度也很难找到合适的答案(不能说百度没有,但是我找不到的话百度也就没有了作用)。
学习到了利用python做这一项有趣的小事情,尽管我不是很成功,但是接下去我还会继续研究,争取之后能做出刺杀小说家的影评提取和词云数据分析!

posted @ 2021-02-27 19:08  L-MuSo  阅读(53)  评论(0编辑  收藏  举报