王锦辉---第一次个人编程作业

博客班级 <软件工程综合实践>
作业要求 <第一次个人编程作业>
作业目标 <数据采集分析,jieba分词,echarts渲染词云图,上传GitHub>
作业源代码 <GitHub>
学号 <211808525>
代码行数:53
过程 用时
:-----------------: :---------------:
准备工作 一天
数据采集分析 6h
使用jieba分词 5h
echarts渲染词云图 4h
GitHub操作 3h

1.数据采集分析
①打开腾讯视频电视剧《在一起》,找到在一起评论页面,查看源代码


观察后发现评论区为会加载的内容
还观察出页面主要通过改变cursor和source的数值来进行改变,每加载一次更多评论,source便加一,cursor起始值为0,在查找发现后cursor在每一个页面的,所以我选用正则表达式来爬取评论

2.jieba分词
在pycham中安装插件jieba 然后利用jieba进行分词、统计词频

3.词云图
在统计完词频后,取前面几十个词频高的来做成云图,自己去echarts官网搞了搞不太懂,然后找做好的同学要来了echarts的压缩包,也不太会用。就简单的用 在线词云制作工具做出词云效果图

4.代码上传到GitHub
Git具体步骤:
(a).新建一个“第一次编程”文件夹,里面添加几个文件。右击“第一次编程”文件夹根目录,点击“Git Bash Here”,打开git命令行。
(b).在命令行中,输入“git init”,使“第一次编程”文件夹加入git管理

(c).输入“git remote add origin xxxx“ (git remote add origin 你自己的https地址),连接你的guthub仓库。

(d).将Git中的仓库内容复制到该文件夹中,这是文件夹会新建一个first-personal-work文件

(e).进去first-personal-work文件,查看所有分支,如需更换(输入 “git checkout crawl”)


(f).输入“git add .”(不要漏了“.”),将文件夹全部内容添加到git;也可以输入“git add 上传文件的名字” ,将此文件内容添加到git

(g).输入“git commit -m "first"”(“git commit -m "提交信息"”)

(h).输入“git push -u origin master(可以更换其他分支)”,上传项目到Github。这里会要求输入Github的账号密码,按要求输入就可以。

(i).将两个分支分别合并到主分支,合并后的分支不要删除
从当前分支切换到主干main上("git checkout main");合并某个分支到主干master("git merge chart");上传代码(git push)

总结
1.首先这次过年后太放纵自己了,计算机基础弱,还比较晚开始做作业,我怎么敢的呀
2.爬虫掌握得不好,而且有些忘了,代码还是有参考了其他同学的作业
3.有一些没有学过的知识,通过百度尽量解决它们
4.echarts.js插件不太知道使用,争取这几天能弄懂
5.git的分支、合并这方面的知识还是很懵,这次作业git部分做得不好,这几天一定会重新编辑好这次的分支合并。好好学习git的使用。
6.这次作业完成艰难,勉强提交,意识到自己很菜,我得更加更加好好学习。
参考资料
Python爬虫实战:爬取腾讯视频的评论
“结巴”中文分词:做最好的 Python 中文分词组件
echarts如何实现关键词云图
快速制作一款高逼格词云图
git创建分支提交远程分支,将分支branch合并到主干master

posted @ 2021-02-27 04:21  空白给你  阅读(118)  评论(2编辑  收藏  举报