会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
王书玉
博客园
首页
新随笔
联系
订阅
管理
2020年5月10日
数据分析——医科大学排名
摘要: 经过之前的慕课内容和b站上的一些知识内容的学习,决定制作一个2019中国最好医科大学的数据分析。 之前试着爬过其他的网站...一些爬出来的排版真的是逼疯我了= = 还有另一些网站自己就是图表形式的数据展示... 找网站着实费了那么一丢丢时间... 于是我就换了最好大学网。 (这多好看!) 首先通过以
阅读全文
posted @ 2020-05-10 12:56 王书玉
阅读(242)
评论(0)
推荐(1)
2020年4月27日
网络爬虫爬取音乐榜单
摘要: 通过学习requests和bs4两个爬虫相关第三方库的使用,尝试爬取本周网易云音乐的飙升榜单的歌曲名以及相关网页链接。 网址为:https://music.163.com/#/discover/toplist 通过查看网页源代码找到相关信息和标签: 为了找到上面这张图片内容需要往下翻很久......
阅读全文
posted @ 2020-04-27 11:15 王书玉
阅读(576)
评论(0)
推荐(0)
2020年4月4日
词云制作
摘要: 【领域文章来源】: 通过百度查找余光中的《寻李白》,复制粘贴内容,在本地自己创建txt文件。 【程序编写基本思路】: 通过jieba库和wordcloud库制作词云图片。调用目标txt内容,通过jieba的分词功能来产生词组;再用wordcloud库展示词云。 【源代码】: import jieba
阅读全文
posted @ 2020-04-04 15:15 王书玉
阅读(325)
评论(1)
推荐(1)
公告