• 博客园logo
  • 会员
  • 众包
  • 新闻
  • 博问
  • 闪存
  • 赞助商
  • HarmonyOS
  • Chat2DB
    • 搜索
      所有博客
    • 搜索
      当前博客
  • 写随笔 我的博客 短消息 简洁模式
    用户头像
    我的博客 我的园子 账号设置 会员中心 简洁模式 ... 退出登录
    注册 登录
 






sfzyk

 
 

Powered by 博客园
博客园 | 首页 | 新随笔 | 联系 | 订阅 订阅 | 管理
上一页 1 ··· 6 7 8 9 10 11 12 下一页

2017年5月24日

<第一周>降维
摘要: PCA 矩阵的主成分就是其协方差矩阵对应的特征向量,按照对应的特征值大小进行排序,最大的特征值为第一主成分,以此类推 主要过程 + 对所有样本进行中心化 + 计算样本的协方差矩阵 XX.T + 对协方差矩阵做特征值分解 + 取最大的几个特征向量 使用方法 sklearn sklearn.decomp 阅读全文
posted @ 2017-05-24 14:49 sfzyk 阅读(217) 评论(0) 推荐(0)
 

2017年5月22日

<第一周> city中国城市聚类 testdata学生上网聚类 例子
摘要: 中国城市聚类 学生上网数据聚类 bdscan算法 这里有一个Silhouette coefficient是一个轮廓系数,用于评价聚类效果 阅读全文
posted @ 2017-05-22 17:14 sfzyk 阅读(342) 评论(0) 推荐(0)
 

2017年5月21日

Python数据分析与展示[第三周](pandas数据类型操作)
摘要: 数据类型操作 如何改变Series/ DataFrame 对象 + 增加或重排:重新索引 + 删除:drop 重新索引 .reindex() reindex() 能够改变或重排Series和DataFrame索引 d.reindex(['c5','c4','v3','v2','c1']) 这样是改变 阅读全文
posted @ 2017-05-21 16:36 sfzyk 阅读(656) 评论(0) 推荐(0)
 
Python数据分析与展示[第三周](pandas数据特征分析单元8)
摘要: 数据理解 + 基本统计 + 分布/累计统计 + 数据特征 + 数据挖掘 数据排序 操作索引的排序 .sort_index() 在指定轴上排序,默认升序 参数 + axis=0 column + ascending=True 升序 .sort_values() 参数同上 +by 对应的(axis)轴上 阅读全文
posted @ 2017-05-21 16:34 sfzyk 阅读(379) 评论(0) 推荐(0)
 

2017年5月19日

第一周<单元一聚类>
摘要: K means 聚类算法 初始随机选择 而后不断更新 kmeans 应用 省份归类 调用kmeans方法所需要的参数 + n_clusters 指定的聚类中心 + init 初始聚类中心的初始化方法 默认k means++ + max_iter 最大的次数 默认300 + data 数据 + lab 阅读全文
posted @ 2017-05-19 14:11 sfzyk 阅读(158) 评论(0) 推荐(0)
 
第一周<导学>
摘要: 导学 + 欧氏距离 平方 + 曼哈顿距离 一次方 + 马氏距离 协方差(先标准化再计算距离)\\(d(x_{i},x_{j})=\sqrt{(x_{i} x_{j})^{T}s^{ 1}(x_{i} x{j})}\\) s为数据的协方差 + 夹角余弦 sklearn cluster sklearn. 阅读全文
posted @ 2017-05-19 12:50 sfzyk 阅读(137) 评论(0) 推荐(0)
 
总体<导学>
摘要: 有一些奇奇怪怪的数据集 波士顿房价数据集 使用 加载相关的数据集 重要参数 return_X_y 表示是否返回target (价格) 默认为False 同时返回data和target 鸢尾花数据集 类别分为三类 Iris Setosa,Iris Versicolour Iris Virginica 阅读全文
posted @ 2017-05-19 12:49 sfzyk 阅读(217) 评论(0) 推荐(0)
 

2017年5月9日

Python数据分析与展示[第三周](pandas简介与数据创建)
摘要: 第三周的课程pandas 分析数据 http://pandas.pydata.org import pandas as pd 常与numpy matplotlib 一块定义 d=pd.Series(range(20)) d.cumsum() 主要提供两个数据类型 Series DataFrame 基 阅读全文
posted @ 2017-05-09 16:41 sfzyk 阅读(216) 评论(0) 推荐(0)
 

2017年4月24日

Python数据分析与展示[第二周]
摘要: matplotlib 有各种可视化的类构成 一般调用 matplotlib.pypolt 这个命令字库 相当于快捷方式 plt.plot(a) 只有一个一维列表 x轴充当列表索引 plt.ylabel("grade") plt.savefig("test",dpi=600 ) # png 文件 pl 阅读全文
posted @ 2017-04-24 12:39 sfzyk 阅读(241) 评论(0) 推荐(0)
 

2017年4月19日

linux系统 (实验二)实验楼的课程笔记
摘要: who am i 打印用户名和终端 终端的启动时间 whoami 打印用户名 who 命令其它常用参数 su,su- 与 sudo su <user> 可以切换到用户 user,执行时需要输入目标用户的密码 sudo <cmd> 可以以特权级别运行 cmd 命令,需要当前用户属于 sudo 组,且需 阅读全文
posted @ 2017-04-19 15:37 sfzyk 阅读(573) 评论(0) 推荐(0)
 
上一页 1 ··· 6 7 8 9 10 11 12 下一页