会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
Endall
博客园
首页
新随笔
联系
管理
订阅
2019年12月20日
Python高级应用程序设计任务
摘要: 一、主题式网络爬虫设计方案 1. 主题式网络爬虫的名称 纵横小说网的爬取 2. 主题式网络爬虫的内容与数据特征分析 爬取内容:小说网链接,小说网页面链接,小说链接,小说名 小说的字数、总推荐、总点击、周推荐、作品总数和每月更新 数据特征分析: 把书名、总推荐和总点击做透视表和可视化 做用每月更新和作
阅读全文
posted @ 2019-12-20 21:53 Endall
阅读(510)
评论(0)
推荐(0)
2019年10月31日
第3次作业-MOOC学习笔记:Python网络爬虫与信息提取
摘要: 1.注册中国大学MOOC 2.选择北京理工大学嵩天老师的《Python网络爬虫与信息提取》MOOC课程 3.学习完成第0周至第4周的课程内容,并完成各周作业 首先,Python网络爬虫与信息提取这门课是以掌握定向网络数据爬取和网页解析的基本能力为要求,内容分为五个点,为Requests库,robot
阅读全文
posted @ 2019-10-31 18:10 Endall
阅读(176)
评论(0)
推荐(0)
2019年10月17日
第2次作业-titanic数据集练习
摘要: 一、读入titanic.xlsx文件,按照教材示例步骤,完成数据清洗。 titanic数据集包含11个特征,分别是: Survived:0代表死亡,1代表存活Pclass:乘客所持票类,有三种值(1,2,3)Name:乘客姓名Sex:乘客性别Age:乘客年龄(有缺失)SibSp:乘客兄弟姐妹/配偶的
阅读全文
posted @ 2019-10-17 11:55 Endall
阅读(229)
评论(0)
推荐(0)
2019年9月23日
第1次作业-Numpy练习
摘要: 1.创建一个边界值为1而内部都是0的数组,图例如下:[提示:]解此题可以先把所有值都设置为1,这是大正方形;其次,把边界除外小正方形全部设置为0。本题用到numpy的切片原理。多维数组同样遵循x[start:stop:step]的原理。[1. 1. 1. 1. 1. 1. 1. 1. 1. 1.][
阅读全文
posted @ 2019-09-23 11:43 Endall
阅读(134)
评论(0)
推荐(0)
公告