随笔分类 -  【Python学习笔记】

摘要:使用 bat 批处理运行 python 最近实习处理数据,在一个工作流里面需要同时使用到 python2 和 python3,这样我就不能使用一个 main 文件把所有步骤串起来一键执行,多了很多人工操控的步骤。 bat 打开了新世界的大门。 这篇笔记讲讲用到的基本 bat 语法,以及如何使用它来把 阅读全文
posted @ 2021-05-12 11:25 Yingjing 阅读(3477) 评论(0) 推荐(0) 编辑
摘要:geopandas 安装(以及 contextily 的安装) 直接按官方方法失败过 n 次,后来参考了geopandas安装心得(win10)总算成功安装。 遇到的 BUG 有直接 conda install geopandas 无报错,但是 import geopandas 又提示缺少 dll 阅读全文
posted @ 2021-04-12 15:55 Yingjing 阅读(1509) 评论(0) 推荐(0) 编辑
摘要: 生成器 摘录自《利用 Python 进行数据分析》第三版 3.2.6 迭代器协议 是一种令对象可遍历的通用方式。比如用 for 循环来遍历一个字典 some_dict,Python 解释器会先尝试根据 some_dict 生成一个迭代器,即一种用于在上下文中向 Python 解释器生成对象的对象 阅读全文
posted @ 2020-01-18 22:27 Yingjing 阅读(226) 评论(0) 推荐(0) 编辑
摘要: 使用序列生成字典 摘录自《利用 Python 进行数据分析》第三版 3.1.4.1 有时可能需要两个序列 (list) 按元素配对生成字典。我们可能会这样写代码 由于字典本质上是 2 元组 (含有 2 个元素的元组)的集合,字典是可以接受一个 2 元组的列表作为参数的。所以以上代码可以简化为一行 阅读全文
posted @ 2020-01-18 21:49 Yingjing 阅读(492) 评论(0) 推荐(0) 编辑
摘要:字典 (dictionary) 的默认值 摘录自《利用 Python 进行数据分析》第三版 3.1.4.2 通常,如果想要获得字典里对应键的值,但是我们先前并不确定这个键是否存在于字典中的话,代码会这样写 但是,字典的 get 方法和 pop 方法可以添加一个默认值的参数,使得上述的代码可以被简化为 阅读全文
posted @ 2020-01-18 21:43 Yingjing 阅读(1737) 评论(0) 推荐(0) 编辑
摘要: Python 列表的连接和联合 Python 两个列表可以使用 + 号连接,如下。 如果有一个已经定义的列表,那么可以用 extend 方法向该列表添加多个元素。 需要注意的是, 通过添加内容来连接列表是一种相对高代价的操作 ,因为连接过程中创建了新列表,并且还要复制对象。而使用 extend 阅读全文
posted @ 2019-12-26 22:26 Yingjing 阅读(5349) 评论(0) 推荐(0) 编辑
摘要:如果需要对一个很大的数据集进行操作,而基于一列数据生成新的一列数据可能都需要耗费很长时间。 于是可以使用 joblib 进行并行处理。 阅读全文
posted @ 2019-11-19 15:39 Yingjing 阅读(3726) 评论(0) 推荐(0) 编辑
摘要:可以直接通过pip安装。 1 NumPy的数值类型 每一种数据类型都有相应的转换函数。使用 属性 可以查看数组的数据类型。如下。 2 数组操作 使用 函数 可以来生成数组。 2.1 元素索引 如果数组是一维的,直接跟list一样索引就好。 如果数组是多维的,就使用跟线性代数里一样的行,列索引。如下。 阅读全文
posted @ 2019-11-08 21:05 Yingjing 阅读(411) 评论(0) 推荐(0) 编辑
摘要:本文转载自 "【机器学习】模型融合方法概述 贝尔塔的文章 知乎" 转载仅出于个人学习收藏,侵删 我理解的Kaggle比赛中提高成绩主要有3个地方 特征工程 调参 模型融合 之前每次打比赛都只做了前两部分,最后的模型融合就是简单的加权平均,对于进阶的 Stacking 方法一直没尝试,这几天摸索了一下 阅读全文
posted @ 2019-11-07 19:29 Yingjing 阅读(748) 评论(0) 推荐(0) 编辑
摘要:问题介绍 八皇后问题是一个以国际象棋为背景的问题:如何能够在 $8\times8$ 的国际象棋棋盘上放置八个皇后,使得任何一个皇后都无法直接吃掉其他的皇后?为了达到此目的,任两个皇后都不能处于同一条横行、纵行或斜线上。八皇后问题可以推广为更一般的 n 皇后摆放问题。 要解决 n 皇后问题,首先在棋盘 阅读全文
posted @ 2019-11-07 18:51 Yingjing 阅读(864) 评论(0) 推荐(0) 编辑
摘要:朴素贝叶斯分类器 (naive bayes classifier, NBC) 是一种常见且简单有效的贝叶斯分类算法。对已知类别,朴素贝叶斯分类器在估计类条件概率时假设特征之间条件独立。这样的假设,可以使得在有限的训练样本下,原本难以计算的联合概率 $P(X_1, X_2, \cdots, X_n | 阅读全文
posted @ 2019-11-07 18:18 Yingjing 阅读(595) 评论(0) 推荐(0) 编辑
摘要:支持向量机 (support vector machine, SVM) 是建立在统计学习理论的 VC 维理论和结构风险最小原理基础上的,根据有限的样本信息在模型的复杂性(即对特点训练样本的学习精度)和学习能力(即无错误地识别任意样本的能力)之间寻求最佳折中,以期获得最好的泛化能力。 支持向量机的 基 阅读全文
posted @ 2019-11-07 18:18 Yingjing 阅读(556) 评论(0) 推荐(0) 编辑
摘要:决策树 (decision tree) 是一种常用的有监督算法。 决策树算法有很多类型,其中最大的差别就是最优特征选择的方法不同。最优特征指的是,在每个结点处,如何选择最好的特征(属性)对样本进行分类,这里最佳的意义即经过这步划分,能使分类精度最好,直到这棵树能准确分类所有训练样本。 通常特征选择的 阅读全文
posted @ 2019-11-07 18:13 Yingjing 阅读(606) 评论(0) 推荐(0) 编辑
摘要:主成分分析 (principal component analysis, PCA) 是投影法的典型代表。 阅读全文
posted @ 2019-11-07 18:11 Yingjing 阅读(1637) 评论(0) 推荐(0) 编辑
摘要:K近邻 (K-nearest neighbor, KNN) 算法直接作用于带标记的样本,属于有监督的算法。 阅读全文
posted @ 2019-11-07 18:09 Yingjing 阅读(651) 评论(0) 推荐(0) 编辑
摘要:列表生成器为创建列表提供了一种简洁的方式 阅读全文
posted @ 2019-11-07 17:39 Yingjing 阅读(3097) 评论(0) 推荐(0) 编辑
摘要:Collections是Python内建的一个集合模块,提供了许多额外的数据类型 阅读全文
posted @ 2019-11-07 17:38 Yingjing 阅读(884) 评论(0) 推荐(0) 编辑
摘要:我们研究生的课程内容,做下笔记记录一下。 阅读全文
posted @ 2019-11-07 15:31 Yingjing 阅读(8236) 评论(1) 推荐(3) 编辑
摘要:K Means 聚类是最常用的一种聚类算法,它的思想很简单,对于给定的样本集和用户事先给定的 K 的个数,将数据集里所有的样本划分成 K 个簇,使得簇内的点尽量紧密地连在一起,簇间的距离尽量远。由于每个簇的中心点是该簇中所有点的均值计算而得,因此叫作 K Means 聚类。 算法过程 (1)从所有样 阅读全文
posted @ 2019-01-25 17:28 Yingjing 阅读(3080) 评论(0) 推荐(0) 编辑
摘要:使用Python进行T检验 所需要用到的第三方库有 scipy 。 均可以通过pip直接安装。 引入第三方库 注: 、`ttest_ind ttest_rel`均进行双侧检验。 $H_0:\mu=\mu_0$ $H_1:\mu=\mu_0$ 单样本T检验(ttest_1samp) 官方文档 "tte 阅读全文
posted @ 2018-12-17 21:23 Yingjing 阅读(36992) 评论(0) 推荐(3) 编辑