10 2017 档案
摘要:一.材料准备 https://www.kaggle.com/c/titanic-gettingStarted/ 二.提出问题 生存率和哪些因素有关(性别,年龄,是否有伴侣,票价,舱位等级,包间,出发地点) 1.乘客的年龄和票价的分布 2.样本生存的几率是多少 3.乘客的性别比例 4.乘客的舱位分布
阅读全文
摘要:一.numpy二维数组 1.声明 1 import numpy as np 2 3 #每一个[]代表一行 4 ridership = np.array([ 5 [ 0, 0, 2, 5, 0], 6 [1478, 3877, 3674, 2328, 2539], 7 [1613, 4088, 399
阅读全文
摘要:1.Numpy数组 numpy的数组只能存放同一种数据类型,使用的方式和Python列表类似 1.1 声明: 1 import numpy as np 2 countries = np.array([ 3 'Afghanistan', 'Albania', 'Algeria', 'Angola',
阅读全文
摘要:一.数据分析的步骤: 1.查看数据并提出问题 2.数据清洗 3.代码编写,提取出结果数据,并分析是否有异常数据,修改代码 4.根据数据选择合适的图表进行展示 5.根据图表小组讨论交流获得最终的结果 二.环境与原始数据准备 安装Anaconda2版本,同时更新软件包更新最新版本 conda upgra
阅读全文
浙公网安备 33010602011771号