会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
陈溪
博客园
首页
新随笔
联系
订阅
管理
2020年5月10日
数据分析之全球电影演员片酬排行榜
摘要: 看到这项作业时,试了几个题目,都没有成功,最终选择了分析电影演员的片酬 首先是在网上找到相关网页,然后试着去爬取相关内容 但是这个并没有输出正确结果,几次改变代码也只能输出部分结果 然后想起MOOC上面有讲到数据分析获取数据有两种方法,一是通过网络爬取二是通过下载相应文件进行分析,由于不能再改变代码
阅读全文
posted @ 2020-05-10 02:27 陈溪
阅读(610)
评论(0)
推荐(0)
2020年4月30日
新浪新闻标题爬取
摘要: 先说一下自己进行网络爬虫的经过吧,我首先是跟着嵩天教授的《Python网络爬虫与信息提取》课程先对爬虫的基本知识进行学习了解,在学习的过程中,我会跟着视频中讲解的实例自己手头也进行编码,虽然是跟着视频一起编写但是还是会总出现错误, 就是会出现一直爬取失败的现象,但反复地看视频并进行修改,最终也能爬取
阅读全文
posted @ 2020-04-30 01:59 陈溪
阅读(597)
评论(0)
推荐(0)
2020年4月8日
词云制作
摘要: 一、文章来源: 通过浏览器搜索网上关于纪念张国荣的文章,复制文章内容,在自己的电脑中建立文档 二、程序编写基本思路: 通过课程所讲内容,使用jieba库和Wordcloud库,编写代码制作词云 三、源代码: import jiebaimport wordcloudfrom imageio impor
阅读全文
posted @ 2020-04-08 00:04 陈溪
阅读(1220)
评论(0)
推荐(0)
公告