【Python学习笔记】 - 随笔分类 - Yingjing

使用 bat 批处理运行 python

摘要：使用 bat 批处理运行 python 最近实习处理数据，在一个工作流里面需要同时使用到 python2 和 python3，这样我就不能使用一个 main 文件把所有步骤串起来一键执行，多了很多人工操控的步骤。 bat 打开了新世界的大门。这篇笔记讲讲用到的基本 bat 语法，以及如何使用它来把阅读全文

posted @ 2021-05-12 11:25 Yingjing 阅读(3477) 评论(0) 推荐(0) 编辑

geopandas 安装（以及 contextily 的安装）

摘要：geopandas 安装（以及 contextily 的安装）直接按官方方法失败过 n 次，后来参考了geopandas安装心得（win10）总算成功安装。遇到的 BUG 有直接 conda install geopandas 无报错，但是 import geopandas 又提示缺少 dll 阅读全文

posted @ 2021-04-12 15:55 Yingjing 阅读(1509) 评论(0) 推荐(0) 编辑

生成器

摘要：生成器摘录自《利用 Python 进行数据分析》第三版 3.2.6 迭代器协议是一种令对象可遍历的通用方式。比如用 for 循环来遍历一个字典 some_dict，Python 解释器会先尝试根据 some_dict 生成一个迭代器，即一种用于在上下文中向 Python 解释器生成对象的对象阅读全文

posted @ 2020-01-18 22:27 Yingjing 阅读(226) 评论(0) 推荐(0) 编辑

使用序列生成字典

摘要：使用序列生成字典摘录自《利用 Python 进行数据分析》第三版 3.1.4.1 有时可能需要两个序列 (list) 按元素配对生成字典。我们可能会这样写代码由于字典本质上是 2 元组（含有 2 个元素的元组）的集合，字典是可以接受一个 2 元组的列表作为参数的。所以以上代码可以简化为一行阅读全文

posted @ 2020-01-18 21:49 Yingjing 阅读(492) 评论(0) 推荐(0) 编辑

字典 (dictionary) 的默认值

摘要：字典 (dictionary) 的默认值摘录自《利用 Python 进行数据分析》第三版 3.1.4.2 通常，如果想要获得字典里对应键的值，但是我们先前并不确定这个键是否存在于字典中的话，代码会这样写但是，字典的 get 方法和 pop 方法可以添加一个默认值的参数，使得上述的代码可以被简化为阅读全文

posted @ 2020-01-18 21:43 Yingjing 阅读(1737) 评论(0) 推荐(0) 编辑

Python 列表的连接和联合

摘要： Python 列表的连接和联合 Python 两个列表可以使用 + 号连接，如下。如果有一个已经定义的列表，那么可以用 extend 方法向该列表添加多个元素。需要注意的是，通过添加内容来连接列表是一种相对高代价的操作，因为连接过程中创建了新列表，并且还要复制对象。而使用 extend 阅读全文

posted @ 2019-12-26 22:26 Yingjing 阅读(5349) 评论(0) 推荐(0) 编辑

使用 joblib 对 Pandas 数据进行并行处理

摘要：如果需要对一个很大的数据集进行操作，而基于一列数据生成新的一列数据可能都需要耗费很长时间。于是可以使用 joblib 进行并行处理。阅读全文

posted @ 2019-11-19 15:39 Yingjing 阅读(3726) 评论(0) 推荐(0) 编辑

Numpy 库

摘要：可以直接通过pip安装。 1 NumPy的数值类型每一种数据类型都有相应的转换函数。使用属性可以查看数组的数据类型。如下。 2 数组操作使用函数可以来生成数组。 2.1 元素索引如果数组是一维的，直接跟list一样索引就好。如果数组是多维的，就使用跟线性代数里一样的行，列索引。如下。阅读全文

posted @ 2019-11-08 21:05 Yingjing 阅读(411) 评论(0) 推荐(0) 编辑

【转载】机器学习-模型融合方法概述

摘要：本文转载自 "【机器学习】模型融合方法概述贝尔塔的文章知乎" 转载仅出于个人学习收藏，侵删我理解的Kaggle比赛中提高成绩主要有3个地方特征工程调参模型融合之前每次打比赛都只做了前两部分，最后的模型融合就是简单的加权平均，对于进阶的 Stacking 方法一直没尝试，这几天摸索了一下阅读全文

posted @ 2019-11-07 19:29 Yingjing 阅读(748) 评论(0) 推荐(0) 编辑

Python 解决八皇后问题

摘要：问题介绍八皇后问题是一个以国际象棋为背景的问题：如何能够在 $8\times8$ 的国际象棋棋盘上放置八个皇后，使得任何一个皇后都无法直接吃掉其他的皇后？为了达到此目的，任两个皇后都不能处于同一条横行、纵行或斜线上。八皇后问题可以推广为更一般的 n 皇后摆放问题。要解决 n 皇后问题，首先在棋盘阅读全文

posted @ 2019-11-07 18:51 Yingjing 阅读(864) 评论(0) 推荐(0) 编辑

机器学习之朴素贝叶斯分类器

摘要：朴素贝叶斯分类器 (naive bayes classifier, NBC) 是一种常见且简单有效的贝叶斯分类算法。对已知类别，朴素贝叶斯分类器在估计类条件概率时假设特征之间条件独立。这样的假设，可以使得在有限的训练样本下，原本难以计算的联合概率 $P(X_1, X_2, \cdots, X_n | 阅读全文

posted @ 2019-11-07 18:18 Yingjing 阅读(595) 评论(0) 推荐(0) 编辑

机器学习之支持向量机

摘要：支持向量机 (support vector machine, SVM) 是建立在统计学习理论的 VC 维理论和结构风险最小原理基础上的，根据有限的样本信息在模型的复杂性（即对特点训练样本的学习精度）和学习能力（即无错误地识别任意样本的能力）之间寻求最佳折中，以期获得最好的泛化能力。支持向量机的基阅读全文

posted @ 2019-11-07 18:18 Yingjing 阅读(556) 评论(0) 推荐(0) 编辑

机器学习之决策树算法

摘要：决策树 (decision tree) 是一种常用的有监督算法。决策树算法有很多类型，其中最大的差别就是最优特征选择的方法不同。最优特征指的是，在每个结点处，如何选择最好的特征（属性）对样本进行分类，这里最佳的意义即经过这步划分，能使分类精度最好，直到这棵树能准确分类所有训练样本。通常特征选择的阅读全文

posted @ 2019-11-07 18:13 Yingjing 阅读(606) 评论(0) 推荐(0) 编辑

机器学习之主成分分析

摘要：主成分分析 (principal component analysis, PCA) 是投影法的典型代表。阅读全文

posted @ 2019-11-07 18:11 Yingjing 阅读(1637) 评论(0) 推荐(0) 编辑

机器学习之K近邻算法

摘要：K近邻 (K-nearest neighbor, KNN) 算法直接作用于带标记的样本，属于有监督的算法。阅读全文

posted @ 2019-11-07 18:09 Yingjing 阅读(651) 评论(0) 推荐(0) 编辑

Python 的列表生成器

摘要：列表生成器为创建列表提供了一种简洁的方式阅读全文

posted @ 2019-11-07 17:39 Yingjing 阅读(3097) 评论(0) 推荐(0) 编辑

Python 的 Collection 库

摘要：Collections是Python内建的一个集合模块，提供了许多额外的数据类型阅读全文

posted @ 2019-11-07 17:38 Yingjing 阅读(884) 评论(0) 推荐(0) 编辑

百度地图POI爬取

摘要：我们研究生的课程内容，做下笔记记录一下。阅读全文

posted @ 2019-11-07 15:31 Yingjing 阅读(8236) 评论(1) 推荐(3) 编辑

kmeans 聚类

摘要：K Means 聚类是最常用的一种聚类算法，它的思想很简单，对于给定的样本集和用户事先给定的 K 的个数，将数据集里所有的样本划分成 K 个簇，使得簇内的点尽量紧密地连在一起，簇间的距离尽量远。由于每个簇的中心点是该簇中所有点的均值计算而得，因此叫作 K Means 聚类。算法过程（1）从所有样阅读全文

posted @ 2019-01-25 17:28 Yingjing 阅读(3080) 评论(0) 推荐(0) 编辑

使用 Python 进行 T检验

摘要：使用Python进行T检验所需要用到的第三方库有 scipy 。均可以通过pip直接安装。引入第三方库注：、`ttest_ind ttest_rel`均进行双侧检验。 $H_0:\mu=\mu_0$ $H_1:\mu=\mu_0$ 单样本T检验(ttest_1samp) 官方文档 "tte 阅读全文

posted @ 2018-12-17 21:23 Yingjing 阅读(36992) 评论(0) 推荐(3) 编辑

YingjingHuang

It's good to be weird.

随笔分类 - 【Python学习笔记】

公告