empty6city

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

2019年12月29日

摘要: 一、读入titanic.xlsx文件,按照教材示例步骤,完成数据清洗。 titanic数据集包含11个特征,分别是: Survived:0代表死亡,1代表存活Pclass:乘客所持票类,有三种值(1,2,3)Name:乘客姓名Sex:乘客性别Age:乘客年龄(有缺失)SibSp:乘客兄弟姐妹/配偶的 阅读全文
posted @ 2019-12-29 15:56 empty6city 阅读(123) 评论(0) 推荐(0) 编辑

摘要: 1.创建一个边界值为1而内部都是0的数组,图例如下:[提示:]解此题可以先把所有值都设置为1,这是大正方形;其次,把边界除外小正方形全部设置为0。本题用到numpy的切片原理。多维数组同样遵循x[start:stop:step]的原理。 [1. 1. 1. 1. 1. 1. 1. 1. 1. 1.] 阅读全文
posted @ 2019-12-29 15:55 empty6city 阅读(134) 评论(0) 推荐(0) 编辑

2019年12月19日

摘要: 用Python实现一个面向主题的网络爬虫程序,并完成以下内容:(注:每人一题,主题内容自选,所有设计内容与源代码需提交到博客园平台) 一、主题式网络爬虫设计方案(15分) 1.主题式网络爬虫名称 新浪网汽车类新闻爬虫词云分析 (结巴分词) 2.主题式网络爬虫爬取的内容与数据特征分析 新浪网新闻汽车类 阅读全文
posted @ 2019-12-19 23:06 empty6city 阅读(273) 评论(0) 推荐(0) 编辑

2019年10月27日

摘要: 随感: 在学习学习这门课之前,因为选修课的缘故我接触过中国大学MOOC这个网址,也通过老师的介绍初步学习到了“python网络爬虫与信息提取”这门课。Python是一个广泛使用的脚本语言,其自带了urllib、urllib2等基本的库,爬虫是最基本的库;在接触“爬虫”这个名词之前,我们对这个概念的理 阅读全文
posted @ 2019-10-27 14:25 empty6city 阅读(119) 评论(0) 推荐(0) 编辑