2019年12月16日
摘要: Python高级应用程序设计任务要求 用Python实现一个面向主题的网络爬虫程序,并完成以下内容: (注:每人一题,主题内容自选,所有设计内容与源代码需提交到博客园平台) 一、主题式网络爬虫设计方案(15分)1.主题式网络爬虫名称 B站的视频信息爬取2.主题式网络爬虫爬取的内容与数据特征分析 爬取 阅读全文
posted @ 2019-12-16 21:26 Silver_Sakura(腾辉) 阅读(341) 评论(0) 推荐(0)
  2019年10月31日
摘要: 1.注册中国大学MOOC 2.选择北京理工大学嵩天老师的《Python网络爬虫与信息提取》MOOC课程3.学习完成第0周至第4周的课程内容,并完成各周作业4.提供图片或网站显示的学习进度,证明学习的过程。 5.写一篇不少于1000字的学习笔记,谈一下学习的体会和收获。 首先谈下这门课程都讲了些什么: 阅读全文
posted @ 2019-10-31 11:52 Silver_Sakura(腾辉) 阅读(133) 评论(0) 推荐(0)
  2019年10月15日
摘要: 一、读入titanic.xlsx文件,按照教材示例步骤,完成数据清洗。 titanic数据集包含11个特征,分别是: Survived:0代表死亡,1代表存活Pclass:乘客所持票类,有三种值(1,2,3)Name:乘客姓名Sex:乘客性别Age:乘客年龄(有缺失)SibSp:乘客兄弟姐妹/配偶的 阅读全文
posted @ 2019-10-15 14:52 Silver_Sakura(腾辉) 阅读(115) 评论(0) 推荐(0)
  2019年9月25日
摘要: 1.创建一个边界值为1而内部都是0的数组,图例如下:[提示:]解此题可以先把所有值都设置为1,这是大正方形;其次,把边界除外小正方形全部设置为0。本题用到numpy的切片原理。多维数组同样遵循x[start:stop:step]的原理。[1. 1. 1. 1. 1. 1. 1. 1. 1. 1.][ 阅读全文
posted @ 2019-09-25 23:09 Silver_Sakura(腾辉) 阅读(164) 评论(0) 推荐(0)