随笔分类 - Python
摘要:首先查看数据形态: 再查看数据类型和非空值的个数与比例 使用SimpleImputer进行填补 默认是用均值进行填补,参数如下: missing_values: 空值的类型。默认np.nan 注意,numpy自带的fillna只能填补np.nan,而此处则可以指定空值的类型。比如 或 strateg
阅读全文
摘要:一、导论 1.1 人工智能、机器学习、深度学习 人工智能、机器学习 人工智能 :1980年代达到高峰的是专家系统,符号AI是之前的,但不能解决模糊、复杂的问题。 机器学习 是把数据、答案做输入,规则作输出。而传统的是把数据、规则作输入,答案作输出。和统计学有关,但是比统计学解决问题更加复杂。 机器学
阅读全文
摘要:二值化 设置一个condition,把连续型的数据分类两类。比如Age,大于30,和小于30。 这是x中 30的设置为1,其他的设置为0. 标签 有时数据可能需要对数据进行分箱化处理,或者给不同的数据设置不同的标签。 可以在l对象,用classes_属性,查看总共有多少类。 label中就是处理过的
阅读全文
摘要:基本原理 Kmeans是无监督学习的代表,没有所谓的Y。主要目的是分类,分类的依据就是样本之间的距离。比如要分为K类。步骤是: 1. 随机选取K个点。 2. 计算每个点到K个质心的距离,分成K个簇。 3. 计算K个簇样本的平均值作新的质心 4. 循环2、3 5. 位置不变,距离完成 距离 Kmean
阅读全文
摘要:思想 以 以内为例。 1. 生成一个全是 的`101`大小的数组 2. 开始,遇到2的倍数(4,6,8,10...)都赋值为 因为这些数字都有 因子 2 3. 开始,遇到 的倍数(6,9,12...)都赋值为 因为这些数字都有 因子 3 4. 以此类推,把所有数字的倍数都赋值为 5. 输出值是 的数
阅读全文
摘要:一、 基础语法 在Python 的 json库中,共有四个方法。分别是: 二、举例 以下所以例子,都以这个字典为例。 2.1 对象之间的转化 把这个dict转换为 json 对象: 输出结果是:j1 {"en": "\u82f1\u8bed", "cn": "\u4e2d\u6587", "fr":
阅读全文
摘要:准备 相关的库 相关的库包括: numpy pandas sklearn 带入代码如下: 数据准备 数据是sklearn的乳腺癌数据。 data主要分为两部分: 和`target DataFrame`中可查看基本形状。 的数据其形式比较固定, 的主要属性有: 。数据,即变量的值,多行多列 。目标,即
阅读全文
摘要:Python 时间处理 一共有三个时间模式。 , ,` datetime() timedelta()` 获取当前 注意,以上两个返回的类型是 和`datetime类型`,而不是字符串。如果要返回字符串,则需要进行格式化。 datetime.date(2019, 5, 16) datetime.dat
阅读全文
摘要:map 把 中的数字,一个一个运用到 中,常和 一起用。 输出: [1, 4, 9, 16, 25] 这里有个比较骚的用法 输出是有 个值的列表,每个值都是把当前 运用到 的结果。 filter 和map有点像,只不过 的输出结果是布尔类型,并且把是 的筛选出来。下面代码是筛选出1 14之间的偶数:
阅读全文
摘要:几乎所有的关于操作系统的内容可以在python 官方文档中找到:https://docs.python.org/3/library/os.html#module-os 其中os.path被单独列出:https://docs.python.org/3/library/os.path.html#modu
阅读全文
摘要:问题与尝试 代码 中,出现 错误。 找了很多,原因可能是,把代码文件命名为 ,这样就会在你自己的代码中寻找 当然找不到了。(详见 "这里" ) 解决 但是我并没有把源文件命名为 。于是我不用 ,而直接用 ,没有出错。 于是我用代码提示 后面出现若干如: , 等 于是可能压根没有这个,于是我查看了更新
阅读全文
摘要:错误再现 环境: 使用Anaconda 中 conda 4.6.2, Python 3.7版本 Windows 7 操作系统 CPU: Intel i5 原始安装过程 直接在CMD中,安装 "链接" 中的方式,创建了TensorFlow环境,按照默认的版本安装 出现如(链接)[https://clo
阅读全文
摘要:引言:此处能看到pep8 的详细介绍:https://www.python.org/dev/peps/pep-0008/。是 Style Guide for Python Code,python代码的style guide 一、前提准备 在Python安装了pip的情况下,命令行输入 pip ins
阅读全文
摘要:同一目录相互import的时候, . 不能省略。否则会找不到该module from .a import Adef
阅读全文
摘要:1. 设置断点 先放例子: import pdb 后,用pdb.set_trace()设置断点。 2. 调试。 查看变量的类型值等 程序会在pdb.set_trace()的地方中断,如下图: 此时输入:p a 则会输出变量a的值 whatis a 则会输出a的类型: c是继续 b是设置断点 这些是常
阅读全文

浙公网安备 33010602011771号