会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
陈玉兰
Welcome : )
博客园
首页
新随笔
联系
订阅
管理
2021年6月14日
数据挖掘与分析练习——蘑菇(涉及聚类、降维)
摘要: 使用数据:mushrooms.csv mushrooms_o.csv visuals.py
阅读全文
posted @ 2021-06-14 22:27 陈玉兰
阅读(678)
评论(0)
推荐(0)
2021年5月17日
Python 字典 键值和字典值互换 key和value互换
摘要: ''' 已有word_index,格式如下 {'word1': 1, 'word2': 2, 'word3': 3, ... } ''' # 快速互换 index_word_map = {v:k for k,v in word_index.items()} ''' {1:'word1', 2:'wo
阅读全文
posted @ 2021-05-17 22:31 陈玉兰
阅读(258)
评论(0)
推荐(0)
Python 去掉数组(array)中的零/过滤数据中的零/提取数据中的非零
摘要: 思路:使用mask import numpy as np # 创建一串数 data = np.array([0,0,0,135,30,125]) # 目的是提取后面三个非零数据 mask = data!=0 #[False False False True True True] new_data =
阅读全文
posted @ 2021-05-17 22:11 陈玉兰
阅读(5259)
评论(0)
推荐(1)
2021年5月13日
Juypter Notebook 保存图片 matplotlib plt.savefig 记录时间 设置dpi
摘要: import matplotlib.pyplot as plt # 第一种,在savefig函数那里设置像素 plt.figure(figsize=(5, 5)) #设置画布尺寸——正方形 plt.scatter(data[:, 0], data[:, 1],label="your label")
阅读全文
posted @ 2021-05-13 22:14 陈玉兰
阅读(2022)
评论(0)
推荐(0)
2021年5月8日
新建一个空的DataFrame 表头与 旧DataFrame 一致
摘要: newdf = pd.DataFrame(data=None, columns=olddf.columns) #其中olddf是先前处理完毕的数据 #不使用copy()是因为newdf中不需要所有olddf中的数据,而是需要根据条件筛选并添加 for i in range(...): tmpdf =
阅读全文
posted @ 2021-05-08 12:32 陈玉兰
阅读(555)
评论(0)
推荐(0)
2021年5月7日
Python 保存数据为excel
摘要: 核心:使用DataFrame的to_excel函数 import pandas as pd datadf = pd.DataFrame(data) datadf.to_excel('excel_name.xlsx',header=True, index=True) #保留列名,新建一列index,从
阅读全文
posted @ 2021-05-07 19:53 陈玉兰
阅读(378)
评论(0)
推荐(0)
聚类 sklearn contingency matrix 权变矩阵 解释
摘要: >>> from sklearn.metrics.cluster import contingency_matrix >>> x = ["a", "a", "a", "b", "b", "b"] >>> y = [0, 0, 1, 1, 2, 2] >>> contingency_matrix(x,
阅读全文
posted @ 2021-05-07 11:52 陈玉兰
阅读(942)
评论(0)
推荐(0)
2021年5月6日
随机生成 指定范围内 指定个数 的 整数/生成随机整数
摘要: 关键:使用numpy import numpy as np np.random.randint(0, high=100, size=50) #随机生成0到100之间的不重复的整数,个数为50个 对比:生成固定整数 l_1 = [1]*20 #[1, 1, 1, ..., 1] l_2 = [2]*2
阅读全文
posted @ 2021-05-06 13:08 陈玉兰
阅读(393)
评论(0)
推荐(0)
2021年5月5日
对 一串数字 一个列表(list) 一个array 一次性输出 所有 基本统计信息(最值、均值...)
摘要: 核心:数据转成pandas中的Series import pandas as pd s = pd.Series([1, 2, 3, 4]) print(s.describe())
阅读全文
posted @ 2021-05-05 16:37 陈玉兰
阅读(87)
评论(0)
推荐(0)
Python 保存任何格式的数据输出 pickle 使用
摘要: import pickle as pkl #处理数据得到data #保存 f = open("file_name.pickle",'wb') pkl.dump(data, f) f.close() #读取 tmp = open("file_name.pickle", 'rb') data = pkl
阅读全文
posted @ 2021-05-05 16:24 陈玉兰
阅读(357)
评论(0)
推荐(0)
下一页
公告