摘要: 一、主题式网络爬虫设计方案(15分) 1.主题式网络爬虫名称 NBA球星科比布莱恩特20年职业生涯季后赛赛季48分钟场均数据爬取 2.主题式网络爬虫爬取的内容与数据特征分析 科比20年生涯巅峰季后赛赛季(得分、篮板、助攻、抢断、盖帽)、总得分以及最强数据3.主题式网络爬虫设计方案概述(包括实现思路与 阅读全文
posted @ 2019-12-15 21:34 洪翔 阅读(428) 评论(0) 推荐(0) 编辑
摘要: 1.注册中国大学MOOC 2.选择北京理工大学嵩天老师的《Python网络爬虫与信息提取》MOOC课程 3.学习完成第0周至第4周的课程内容,并完成各周作业 Requests库的爬取性能分析 (1)京东商品页面的爬取 import requests url = "https://item.jd.co 阅读全文
posted @ 2019-10-18 22:56 洪翔 阅读(978) 评论(1) 推荐(0) 编辑
摘要: 一、读入titanic.xlsx文件,按照教材示例步骤,完成数据清洗。 titanic数据集包含11个特征,分别是: Survived:0代表死亡,1代表存活Pclass:乘客所持票类,有三种值(1,2,3)Name:乘客姓名Sex:乘客性别Age:乘客年龄(有缺失)SibSp:乘客兄弟姐妹/配偶的 阅读全文
posted @ 2019-10-14 22:12 洪翔 阅读(128) 评论(0) 推荐(0) 编辑
摘要: 1.创建一个边界值为1而内部都是0的数组,图例如下:[提示:]解此题可以先把所有值都设置为1,这是大正方形;其次,把边界除外小正方形全部设置为0。本题用到numpy的切片原理。多维数组同样遵循x[start:stop:step]的原理。 2.在数组主对角线上创建一个值为1,2,3,4的5x5矩阵,图 阅读全文
posted @ 2019-09-20 23:16 洪翔 阅读(177) 评论(0) 推荐(0) 编辑