10 2017 档案

摘要:注:本文是 "人工智能研究网" 的学习笔记 回归器评估方法 explained_variance_score(...) mean_absolute_erroe(...) 平均绝对损失 mean_squared_error(...) 均方损失 median_absolute_error(...) r2 阅读全文
posted @ 2017-10-30 16:37 cnkai 阅读(1220) 评论(0) 推荐(0)
摘要:注:本文是 "人工智能研究网" 的学习笔记 ROC是什么 二元分类器(binary classifier)的分类结果 ROC空间 最好的预测模型在左上角,代表100%的灵敏度和0%的虚警率,被称为完美分类器。 一个随机猜测模型。会给出从左下角到右上角的沿着对角线的点(对角线被称作line of no 阅读全文
posted @ 2017-10-30 16:36 cnkai 阅读(3327) 评论(0) 推荐(0)
摘要:注:本文是 "人工智能研究网" 的学习笔记 Precision和Recall都能够从下面的TP,TN,FP,FN里面计算出来。 几个缩写的含义 : 缩写 | 含义 | P | condition positive N | condition negative TP | true positive ( 阅读全文
posted @ 2017-10-30 16:35 cnkai 阅读(11503) 评论(2) 推荐(2)
摘要:注:本文是 "人工智能研究网" 的学习笔记 准确率 accuracy_score:函数计算分类准确率,返回被正确分类的样本比例(default)或者是数量(normalize=False) 在多标签分类问题中,该函数返回子集的准确率,对于一个给定的多标签样本,如果预测得到的标签集合与该样本真正的标签 阅读全文
posted @ 2017-10-30 16:34 cnkai 阅读(25249) 评论(0) 推荐(0)
摘要:注:本文是 "人工智能研究网" 的学习笔记 使用sklearn.metrics包中的性能度量函数 1. 分类器性能指标 2. 回归器性能指标 3. 聚类器性能指标 4. 两两距离测度 分类器性能评估指标 将二元分类指标拓展到多类或多标签问题中去 阅读全文
posted @ 2017-10-30 16:33 cnkai 阅读(879) 评论(0) 推荐(0)
摘要:注:本文是 "人工智能研究网" 的学习笔记 1. Estimator对象的score方法 2. 在交叉验证中使用scoring参数 3. 使用sklearn.metric中的性能度量函数 Estimator对象的score方法 分类算法必须要继承ClassifierMixin类, 回归算法必须要继承 阅读全文
posted @ 2017-10-30 16:32 cnkai 阅读(2351) 评论(0) 推荐(0)
摘要:注:本文是 "人工智能研究网" 的学习笔记 模型验证方法一览 名称 | 模块 | 通过交叉验证计算得分 | model_selection.cross_val_score(estimator, X) 对每个输入点产生交叉验证估计 | model_selection.cross_val_predict 阅读全文
posted @ 2017-10-30 16:31 cnkai 阅读(3307) 评论(0) 推荐(0)
摘要:注:本文是 "人工智能研究网" 的学习笔记 K折交叉验证 模块 | | sklearn.model_selection.KFold | sklearn.model_selection.GroupKFold | sklearn.model_selection.StratifiedKFold | 核心思 阅读全文
posted @ 2017-10-30 16:30 cnkai 阅读(1709) 评论(0) 推荐(0)
摘要:注:本文是 "人工智能研究网" 的学习笔记 学习器模型中一般有两类参数,一类是可以从数据中学习估计得到,还有一类参数时无法从数据中估计,只能靠人的经验进行设计指定,后者成为超参数。比如,支持向量机里面的C, Kernal, game;朴素贝叶斯里面的alpha等。 使用以下的方法获得学习器模型的参数 阅读全文
posted @ 2017-10-30 16:30 cnkai 阅读(1820) 评论(0) 推荐(0)
摘要:注:本文是 "人工智能研究网" 的学习笔记 标称型特征编码(Encoding categorical feature) 有些情况下,某些特征的取值不是连续的数值,而是离散的标称变量(categorical)。 比如一个人的特征描述可能是下面的或几种: 这样的特征可以被有效的编码为整型特征值(inte 阅读全文
posted @ 2017-10-30 16:29 cnkai 阅读(3370) 评论(0) 推荐(1)
摘要:注:本文是 "人工智能研究网" 的学习笔记 规范化(Normalization) Normalization: scaling individual to have unit norm 规范化是指,将单个的样本特征向量变换成具有单位长度(unit norm)的特征向量的过程。当你要使用二次形式(qu 阅读全文
posted @ 2017-10-30 16:28 cnkai 阅读(5684) 评论(0) 推荐(0)
摘要:注:本文是 "人工智能研究网" 的学习笔记 常用的数据预处理方式 1. Standardization, or mean removal and variance scaling 2. Normalization: scaling individual to have unit norm 3. Bi 阅读全文
posted @ 2017-10-30 16:27 cnkai 阅读(2021) 评论(0) 推荐(0)
摘要:注:本文是 "人工智能研究网" 的学习笔记 sklearn.feature_extaction模块提供了从原始数据如文本,图像等中抽取能够被机器学习算法直接处理的特征向量。 Feature extraction和Feature selection是不同的:前者将任意的数据变换成机器学习算法可用的数值 阅读全文
posted @ 2017-10-30 16:26 cnkai 阅读(4082) 评论(1) 推荐(0)
摘要:注:本文是 "人工智能研究网" 的学习笔记 Pipeline:chaining(链接)estimators Pipeline可以用于把多个estimators级联合成一个estimator。这么做的原因是考虑了数据处理过程的一系列前后相继的固定流程,比如:feature selection norm 阅读全文
posted @ 2017-10-30 16:25 cnkai 阅读(431) 评论(0) 推荐(0)
摘要:注:本文是 "人工智能研究网" 的学习笔记 数据集一览 类型 | 获取方式 | 自带的小数据集 | sklearn.datasets.load_ 在线下载的数据集 | sklearn.datasets.fetch_ 计算机生成的数据集 | sklearn.datasets.make_ svmligh 阅读全文
posted @ 2017-10-30 16:23 cnkai 阅读(3188) 评论(0) 推荐(0)
摘要:注:本文是 "人工智能研究网" 的学习笔记 计算机生成的数据集 用于分类任务和聚类任务,这些函数产生样本特征向量矩阵以及对应的类别标签集合。 数据集 | 简介 | make_blobs | 多类单标签数据集,为每个类分配一个或者多个正态分布的点集,提供了控制每个数据点的参数:中心点(均值),标准差, 阅读全文
posted @ 2017-10-30 16:23 cnkai 阅读(1612) 评论(0) 推荐(0)
摘要:六大板块 分类 | 回归 | 聚类 | 数据降维 | 数据预处理 | 特征抽取 | | | | | 统一API estimator.fit(X_train,[y_train]) | estimator.fit(X_train,[y_train]) | estimator.predict(X_test 阅读全文
posted @ 2017-10-30 16:20 cnkai 阅读(706) 评论(0) 推荐(0)
摘要:选择器 | 例子 | 例子描述 | | .class | .intro| 选择 class="intro" 的所有元素。 id | firstname| 选择 id="firstname" 的所有元素。 | |选择所有元素。 element| p |选择所有 元素。 element,element| 阅读全文
posted @ 2017-10-10 20:15 cnkai 阅读(314) 评论(0) 推荐(0)
摘要:解析库 解析器 | 使用方法 | 优势 | 劣势 | | | Python标准库 | BeautifulSoup(html, 'html.parser') | 速度适中,容错能力强 | 老版本python容错能力差 lxml HTML解析库 | BeautifulSoup(html, 'lxml') 阅读全文
posted @ 2017-10-10 20:15 cnkai 阅读(483) 评论(0) 推荐(0)
摘要:``` from selenium import webdriver from selenium.webdriver import ActionChains from selenium.webdriver.common.by import By from selenium.webdriver.sup 阅读全文
posted @ 2017-10-09 20:19 cnkai 阅读(846) 评论(0) 推荐(0)
摘要:创建对象 通过对象自面量的形式创建对象 使用new object创建对象 使用构造函数创建对象 使用Object.create()创建对象 操作对象 首先创建两个对象 访问属性: 对象名.属性名 对象名[属性名] 当处于某个对象方法内部的时候,可是使用this来访问同一对象的属性 var key=' 阅读全文
posted @ 2017-10-09 20:18 cnkai 阅读(294) 评论(0) 推荐(0)
摘要:隐式转换 1. 其他类型转换成布尔类型: undefined false null false 0或者0.0或者NaN false 字符串长度为0 false 其他对象 true 2. 其他类型转换成数值类型: undefined NaN null 0 true 1 false 0 内容为数字 数字 阅读全文
posted @ 2017-10-09 20:17 cnkai 阅读(315) 评论(0) 推荐(0)
摘要:自定义函数 JS中有两种方法定义函数: 使用function关键字定义函数 使用js中的函数构造器(Function())定义函数 注意: 1. 函数名称不要包含特殊字符 2. 函数名称最好含义明确 3. 函数名称最好遵循驼峰标记法或者下划线法 4. 函数名称严格区分大小写 5. 函数名称如果相同会 阅读全文
posted @ 2017-10-09 20:17 cnkai 阅读(361) 评论(0) 推荐(0)
摘要:连接数据库 创建数据库 创建表 插入数据 事务机制,一旦出错会回滚,不存在一半插入一半没插入的情况。 更新数据 删除数据 查询数据 fetch()存在指针偏移的问题,使用一次,指针就会向后偏移一次。 阅读全文
posted @ 2017-10-09 20:15 cnkai 阅读(405) 评论(0) 推荐(0)
摘要:连接数据库 StrictRedis ConnectionPool 构造url方式连接到数据库,有以下三种模式: String操作 方法 | 作用 | 示例 | 示例结果 | | | | set(name, value) | 给name赋值为value | redis.set('name', 'Bob 阅读全文
posted @ 2017-10-09 20:15 cnkai 阅读(29519) 评论(1) 推荐(5)
摘要:re模块 阅读全文
posted @ 2017-10-09 20:14 cnkai 阅读(381) 评论(0) 推荐(0)
摘要:连接数据库 插入数据 insert_one(), 一次插入一条记录 insert_many(), 一次插入多条记录 mongo默认会给每一条记录添加一个_id字段,用来唯一标识每一条记录。 可以使用 和`result.inserted_ids`来查看插入记录的_id编号。 查询数据 find_one 阅读全文
posted @ 2017-10-09 20:14 cnkai 阅读(2684) 评论(0) 推荐(0)
摘要:time模块 datetime模块 阅读全文
posted @ 2017-10-09 20:13 cnkai 阅读(304) 评论(0) 推荐(0)
摘要:停止子线程 如果一切正常,那么上面的例子很完美。可是,需要停止程序,直接ctrl+c,会抛出KeyboardInterrupt错误,我们修改一下主循环: 可是实际上并不好使,虽然主线程try了KeyboardInterrupt异常,但是子线程并没有退出,为了解决这个问题,可以设置子线程为守护线程,这 阅读全文
posted @ 2017-10-09 20:13 cnkai 阅读(464) 评论(0) 推荐(0)
摘要:协程嵌套 使用async可以定义协程,协程用于耗时的io操作,我们也可以封装更多的io操作过程,这样就实现了嵌套的协程,即一个协程中await了另外一个协程,如此连接起来。 如果使用的是 asyncio.gather创建协程对象,那么await的返回值就是协程运行的结果。 不在main协程函数里处理 阅读全文
posted @ 2017-10-09 20:12 cnkai 阅读(450) 评论(0) 推荐(0)
摘要:几个概念: event_loop 事件循环:程序开启一个无限的循环,程序员会把一些函数注册到事件循环上。当满足事件发生的时候,调用相应的协程函数。 coroutine 协程:协程对象,指一个使用async关键字定义的函数,它的调用不会立即执行函数,而是会返回一个协程对象。协程对象需要注册到事件循环, 阅读全文
posted @ 2017-10-09 20:12 cnkai 阅读(475) 评论(0) 推荐(0)
摘要:冒泡排序 算法思想: 对于一组需要排序的数据,对于相邻的两个数进行比较,使较大(或者较小)的数一直向后推,经过多层排序之后,使整个序列是有序的。 算法实现: 算法的实现使用了两层for循环,其中对于外层for循环来说,第一次for循环,最大的数被推到最后面,第二次for循环,次大的数被推到次后面.. 阅读全文
posted @ 2017-10-09 20:11 cnkai 阅读(380) 评论(0) 推荐(0)
摘要:发起请求 添加请求参数 自定义User Agent 自定义cookies post字符串 post文件 设置代理 设置认证代理 阅读全文
posted @ 2017-10-09 20:11 cnkai 阅读(601) 评论(0) 推荐(0)
摘要:临近毕业,租房是少不了的,为了直观的了解江苏省的租房价格信息,这次就从58同城抓取了江苏省13个市的租房信息,进行简单地分析。 本次获得信息一共是3万条左右,抓取到的原始信息会附在文末,用到的主要的分析工具是pandas。 首先来看一下我们的原始信息的样子。 首先将‘name’字段进行分割,提取出租 阅读全文
posted @ 2017-10-09 14:05 cnkai 阅读(1407) 评论(0) 推荐(0)
摘要:![](http://images2017.cnblogs.com/blog/1203446/201710/1203446-20171006134317161-546127183.png) ![](http://images2017.cnblogs.com/blog/1203446/201710/1203446-20171006134404396-682153809.png) ![](http... 阅读全文
posted @ 2017-10-06 13:48 cnkai 阅读(629) 评论(0) 推荐(0)