总访问量: PV

DataScience && DataMining && BigData

随笔分类 -  7.Mechine_Learning

第七阶段Mechine_Learning
摘要:tensorflow#-*- coding: utf-8 -*- # @Time : 2017/12/19 14:36 # @Author : Z # @Email : S # @File : 1.0testTF.py #用于表示取消编译时的错误信息*会出现编译错误 import os os.environ['TF_CPP_MIN_LOG_LEVEL'] = '2' imp... 阅读全文
posted @ 2017-12-21 14:55 CJZhaoSimons 阅读(247) 评论(0) 推荐(0) 编辑
摘要:为什么会出现这个问题? 为了提升CPU计算速度的。若你有支持cuda的GPU,则可以忽略这个问题,因为安装SSE4.1, SSE4.2, AVX, AVX2, FMA, 仅仅提升CPU的运算速度(大概有3倍)。 解决方法: 忽视警告,并屏蔽警告 开头输入如下: 2.进 tensorflow 官网,从 阅读全文
posted @ 2017-12-21 14:46 CJZhaoSimons 阅读(2826) 评论(0) 推荐(0) 编辑
摘要:面试题1:(答案)右偏分布 面试题2:(答案)C,正态分布的偏度为0,峰度为3 面试题3:(答案)C 面试题4:(答案)AC 相关系数 :考察两个事物(在数据里我们称之为变量)之间的相关程度。 如果有两个变量:X、Y,最终计算出的相关系数的含义可以有如下理解: (1)、当相关系数为0时,X和Y两变量 阅读全文
posted @ 2017-12-20 15:22 CJZhaoSimons 阅读(12655) 评论(0) 推荐(0) 编辑
摘要:需求: 一直写的代码都是从加载数据,模型训练,模型预测,模型评估走出来的,但是实际业务线上咱们肯定不能每次都来训练模型,而是应该将训练好的模型保存下来 ,如果有新数据直接套用模型就行了吧?现在问题就是怎么在实际业务中保存模型,不至于每次都来训练,在预测。 解决方案: 机器学习-训练模型的保存与恢复( 阅读全文
posted @ 2017-12-18 18:49 CJZhaoSimons 阅读(2490) 评论(0) 推荐(0) 编辑
摘要:Sklearn中解决方案 在Python的sklearn中,经常会使用分层抽样的方法,使用train_test_split方法对数据集进行切分,如若指定分层抽样则随机切分数据集的比例将会和源数据集中正负样本的比例保持一致,这是常用的一种方法。 另外在sklearn中,对数据集通常采用k则交叉验证的方 阅读全文
posted @ 2017-12-18 17:09 CJZhaoSimons 阅读(827) 评论(0) 推荐(1) 编辑
摘要:最小二乘法可以从Cost/Loss function角度去想,这是统计(机器)学习里面一个重要概念,一般建立模型就是让loss function最小,而最小二乘法可以认为是 loss function = (y_hat -y )^2的一个特例,类似的像各位说的还可以用各种距离度量来作为loss fu 阅读全文
posted @ 2017-12-18 15:12 CJZhaoSimons 阅读(4029) 评论(0) 推荐(0) 编辑
摘要:1.简便起见 比起麻烦的安装各种库,我们选择最方便的Anaconda的conda或pip(兼容支持)安装相关库。 Pycharm本身缺少numpy和matplotlib这些库,而另一个Python的开发环境Anaconda则自带了300多种常见的库。 所以想在pycharm中使用Anaconda自带 阅读全文
posted @ 2017-06-02 18:14 CJZhaoSimons 阅读(2341) 评论(0) 推荐(0) 编辑
摘要:Anaconda3(python3.6)安装tensorflow Anaconda3中安装tensorflow3是非常简单的,仅需通过 pip install tensorflow 测试代码: 下面文章是之前在Anaconda3中配置Tensorflow库的过程 Anaconda3(python3. 阅读全文
posted @ 2017-04-08 11:29 CJZhaoSimons 阅读(4317) 评论(0) 推荐(0) 编辑
摘要:Numpy类型学习 1.数组的表示 ipynb代码参考如下 In [1]: import numpy as np In [2]: #numpy核心是高维数组,库中的ndarray支持多维数组,同时提供了数值运算,可对向量矩阵进行运算 In [5]: array1=np.array(range(6)) 阅读全文
posted @ 2017-03-21 00:25 CJZhaoSimons 阅读(370) 评论(0) 推荐(0) 编辑