摘要: 一、主题式网络爬虫设计方案(15分)1.主题式网络爬虫名称 爬取淘手游王者荣耀租号的质量2.主题式网络爬虫爬取的内容与数据特征分析 最短租期,记时价格,段位,英雄数量,以及皮肤数量 3.主题式网络爬虫设计方案概述(包括实现思路与技术难点) 创建一个get的类,定义get_alldata()方法用来获 阅读全文
posted @ 2019-12-18 12:29 former-boyfriend 阅读(321) 评论(0) 推荐(0)
摘要: 5.写一篇不少于1000字的学习笔记,谈一下学习的体会和收获。 经过四星期嵩天老师对我们讲解的爬虫,让我清晰的认识到自己对于我们所学的专业,我还是多么无知的一个人,他的这门课程就像通往知识海洋里的一所大门的钥匙。 在网络爬虫之实战中,学习了正则表达式,是用来简洁表达一组字符串的表达式。认识了正则表达 阅读全文
posted @ 2019-10-30 13:01 former-boyfriend 阅读(125) 评论(0) 推荐(0)
摘要: 一、读入titanic.xlsx文件,按照教材示例步骤,完成数据清洗。 titanic数据集包含11个特征,分别是: Survived:0代表死亡,1代表存活Pclass:乘客所持票类,有三种值(1,2,3)Name:乘客姓名Sex:乘客性别Age:乘客年龄(有缺失)SibSp:乘客兄弟姐妹/配偶的 阅读全文
posted @ 2019-10-17 09:26 former-boyfriend 阅读(96) 评论(0) 推荐(0)
摘要: 1.创建一个边界值为1而内部都是0的数组,图例如下: [提示:]解此题可以先把所有值都设置为1,这是大正方形;其次,把边界除外小正方形全部设置为0。 本题用到numpy的切片原理。多维数组同样遵循x[start:stop:step]的原理。 2.在数组主对角线上创建一个值为1,2,3,4的5x5矩阵 阅读全文
posted @ 2019-09-25 19:30 former-boyfriend 阅读(160) 评论(0) 推荐(0)
点击右上角即可分享
微信分享提示