07 2017 档案

摘要:#-*- coding:utf-8 -*- import urllib2 import re url = 'https://book.douban.com/tag/%E5%B0%8F%E8%AF%B4' request = urllib2.Request(url) urlopen = urllib2.urlopen(request) content = urlopen.read() reg_0... 阅读全文
posted @ 2017-07-31 11:33 debuggor 阅读(180) 评论(0) 推荐(0)
摘要: 阅读全文
posted @ 2017-07-30 16:56 debuggor 阅读(267) 评论(0) 推荐(0)
摘要:1、数据结构与算法绪论 什么是数据结构? 程序设计=数据结构+算法 数据结构就是关系,即数据元素相互之间存在的一种或多种特定关系的集合。数据结构分为逻辑结构和物理结构。 逻辑机构:数据对象中数据元素之间的相互关系 物理结构:数据的逻辑结构在计算机中的存储形式。四大逻辑结构:1. 集合结构:结构中的数 阅读全文
posted @ 2017-07-29 15:59 debuggor 阅读(260) 评论(0) 推荐(0)
摘要: 阅读全文
posted @ 2017-07-29 12:14 debuggor 阅读(154) 评论(0) 推荐(0)
摘要:#!/usr/bin/env python # encoding:utf-8 import math import numpy import time import matplotlib.pyplot as plt def sigmoid(x): return 1.0 / (1 + numpy.ex 阅读全文
posted @ 2017-07-27 23:48 debuggor 阅读(364) 评论(0) 推荐(0)
摘要:1、windows 下,CMD的一些命令: dir:列出当前的所有文件 time:打印当前的时间 tree:列出当前目录下的子结构 在cmd中进入了某种模式,退出可以尝试以下命令:q 、exit()、Ctrl+c、Ctrl+z 运行程序:在cmd里面直接输入程序名称。如:notepad、calc 按 阅读全文
posted @ 2017-07-26 17:08 debuggor 阅读(1197) 评论(0) 推荐(0)
摘要:对于一个文本字符串,可以使用Python的string.split()方法将其切割。下面看看实际运行效果。 输出: 可以看到,切分的效果不错,但是标点符号也被当成了词,可以使用正则表达式来处理,其中分隔符是除单词、数字外的任意字符串。 输出为: 现在得到了一系列词组成的词表,但是里面的空字符串需要去 阅读全文
posted @ 2017-07-26 11:03 debuggor 阅读(697) 评论(0) 推荐(0)
摘要:Python中的ctypes模块可能是Python调用C方法中最简单的一种。ctypes模块提供了和C语言兼容的数据类型和函数来加载dll文件,因此在调用时不需对源文件做任何的修改。也正是如此奠定了这种方法的简单性。 示例如下 实现两数求和的C代码,保存为add.c 接下来将C文件编译为.so文件( 阅读全文
posted @ 2017-07-26 00:14 debuggor 阅读(28984) 评论(1) 推荐(0)
摘要:1、朴素贝叶斯算法介绍 一个待分类项x=(a,b,c...),判断x属于y1,y2,y3...类别中的哪一类。 贝叶斯公式: 算法定义如下: (1)、设x={a1, a2, a3, ...}为一个待分类项,而a1, a2, a3...分别为x的特征 (2)、有类别集合C={y1, y2, y3, . 阅读全文
posted @ 2017-07-25 23:01 debuggor 阅读(2313) 评论(0) 推荐(0)
摘要:Scikit-Learn(决策树)可以用于方法分类和回归。 一、分类 sklearn.tree.DecisionTreeClassifier(criterion='gini', splitter='best', max_depth=None, min_samples_split=2, min_sam 阅读全文
posted @ 2017-07-25 18:57 debuggor 阅读(2245) 评论(0) 推荐(0)
摘要:决策树c4.5算法是在决策树ID3上面演变而来。 在ID3中: 信息增益 按属性A划分数据集S的信息增益Gain(S,A)为样本集S的熵减去按属性A划分S后的样本子集的熵,即 在此基础上,C4.5计算如下: 分裂信息 利用引入属性的分裂信息来调节信息增益 信息增益率 信息增益率将分裂信息作为分母,属 阅读全文
posted @ 2017-07-25 15:44 debuggor 阅读(1518) 评论(0) 推荐(0)
摘要: 阅读全文
posted @ 2017-07-24 23:25 debuggor 阅读(254) 评论(0) 推荐(0)
摘要:1、决策树原理 1.1、定义 分类决策树模型是一种描述对实例进行分类的树形结构。决策树由结点和有向边组成。结点有两种类型:内部节点和叶节点,内部节点表示一个特征或属性,叶节点表示一个类。 举一个通俗的栗子,各位立志于脱单的单身男女在找对象的时候就已经完完全全使用了决策树的思想。假设一位母亲在给女儿介 阅读全文
posted @ 2017-07-24 21:52 debuggor 阅读(6571) 评论(0) 推荐(0)
摘要:1、K-近邻算法原理 1.1 算法特点 简单地说,k-近邻算法采用测量不同特征值之间的距离方法进行分类。 优点:精度高、对异常值不敏感、无数据输入假定 缺点:计算复杂度高、空间复杂度高 适用数据范围:数值型和标称型 1.2 工作原理 存在一个训练样本集,并且每个样本都存在标签(有监督学习)。输入没有 阅读全文
posted @ 2017-07-24 19:47 debuggor 阅读(347) 评论(0) 推荐(0)
摘要:监督学习:分类和回归属于监督学习。这类算法必须知道预测什么,即目标变量的分类信息。 常见算法:k-近邻算法、线性回归、朴素贝叶斯算法、支持向量机、决策树、Lasso最小回归系数估计、Ridge回归、局部加权线性回归 无监督学习:数据没有类别信息,不给定目标值。 常见算法:K-均值、最大期望算法、DB 阅读全文
posted @ 2017-07-24 15:22 debuggor 阅读(201) 评论(0) 推荐(0)
摘要:1、*args 的用法 *args 和 **kwargs 主要用于函数定义。 你可以将不定数量的参数传递给一个函数。 这里的不定的意思是:预先并不知道, 函数使用者会传递多少个参数给你, 所以在这个场景下使用这两个关键字。 *args 是用来发送一个非键值对的可变数量的参数列表给一个函数. 2、** 阅读全文
posted @ 2017-07-24 10:12 debuggor 阅读(234) 评论(0) 推荐(0)
摘要:一、Python 标准库概览 1、操作系统接口 os 模块提供了很多与操作系统交互的函数: 在使用一些像 os 这样的大型模块时内置的 dir() 和 help() 函数非常有用: 针对日常的文件和目录管理任务,shutil 模块提供了一个易于使用的高级接口 2、文件通配符 glob 模块提供了一个 阅读全文
posted @ 2017-07-23 23:43 debuggor 阅读(247) 评论(0) 推荐(0)
摘要:一、错误和异常 1、异常处理 try 语句按如下方式工作: 首先,执行 try 子句 (在 try 和 except 关键字之间的部分)。 如果没有异常发生, except 子句 在 try 语句执行完毕后就被忽略了。 如果在 try 子句执行过程中发生了异常,那么该子句其余的部分就会被忽略。如果异 阅读全文
posted @ 2017-07-23 19:07 debuggor 阅读(314) 评论(0) 推荐(0)
摘要:一、模块 模块是包括 Python 定义和声明的文件。文件名就是模块名加上 .py 后缀。模块的模块名(做为一个字符串)可以由全局变量 __name__ 得到。 1、 模块可以导入其他的模块。 一个(好的)习惯是将所有的 import 语句放在模块的开始(或者是脚本),这并非强制。 被导入的模块名会 阅读全文
posted @ 2017-07-23 16:21 debuggor 阅读(305) 评论(0) 推荐(0)
摘要:一、基本知识 1、一个值可以同时赋给几个变量: 2、创建复数 3、字符串 字符串可以标识在一对三引号中: """ 或 ''' 。三引号中,不需要行属转义,它们已经包含在字符串中。 字符串也可以被截取(检索) Unicode 4、列表 就像字符串索引,列表从 0 开始检索。列表可以被切片和连接 允许嵌 阅读全文
posted @ 2017-07-23 13:01 debuggor 阅读(249) 评论(0) 推荐(0)
摘要: 阅读全文
posted @ 2017-07-22 21:12 debuggor 阅读(171) 评论(0) 推荐(0)
摘要: 阅读全文
posted @ 2017-07-22 21:11 debuggor 阅读(185) 评论(0) 推荐(0)
摘要:1、softmax_cross_entropy_with_logits tf.nn.softmax_cross_entropy_with_logits(logits, labels, name=None) 解释:这个函数的作用是计算 logits 经 softmax 函数激活之后的交叉熵。 对于每个 阅读全文
posted @ 2017-07-22 20:41 debuggor 阅读(751) 评论(0) 推荐(0)
摘要:1、l2_loss函数 tf.nn.l2_loss(t, name=None) 解释:这个函数的作用是利用 L2 范数来计算张量的误差值,但是没有开方并且只取 L2 范数的值的一半,具体如下: output = sum(t ** 2) / 2 2、tensorflow实现 输入参数: t: 一个Te 阅读全文
posted @ 2017-07-22 20:07 debuggor 阅读(12831) 评论(0) 推荐(0)
摘要:1、l2_normalize函数 tf.nn.l2_normalize(x, dim, epsilon=1e-12, name=None) 解释:这个函数的作用是利用 L2 范数对指定维度 dim 进行标准化。 比如,对于一个一维的张量,指定维度 dim = 0,那么计算结果为: output = 阅读全文
posted @ 2017-07-22 19:56 debuggor 阅读(5582) 评论(0) 推荐(0)
摘要:输出结果: bias_add:[[ 2. 0.] [ 3. 1.] [ 4. 2.]]add:[[ 2. 2.] [ 3. 3.] [ 4. 4.]] 阅读全文
posted @ 2017-07-22 17:30 debuggor 阅读(6827) 评论(0) 推荐(0)
摘要:1、dropout dropout 是指在深度学习网络的训练过程中,按照一定的概率将一部分神经网络单元暂时从网络中丢弃,相当于从原始的网络中找到一个更瘦的网络,这篇博客中讲的非常详细 2、tensorflow实现 用dropout: import tensorflow as tf import nu 阅读全文
posted @ 2017-07-22 17:05 debuggor 阅读(6007) 评论(0) 推荐(0)
摘要:参考:http://www.jianshu.com/p/e112012a4b2d 阅读全文
posted @ 2017-07-22 16:05 debuggor 阅读(324) 评论(0) 推荐(0)
摘要: 阅读全文
posted @ 2017-07-22 12:20 debuggor 阅读(132) 评论(0) 推荐(0)
摘要: 阅读全文
posted @ 2017-07-22 12:19 debuggor 阅读(171) 评论(0) 推荐(0)
摘要:按照网上教程安装好了 theano 之后,import theano 出现错误。“cannot import name gof”。网上找了很多教程,都不可行。最后找到如下教程。亲测可行!终于解决了!!!! 问题的解决方案就是安装 libpython查看 conda list确实没有 libpytho 阅读全文
posted @ 2017-07-22 12:15 debuggor 阅读(1536) 评论(0) 推荐(0)
摘要:最近看起深度学习的一些知识,想要学习一个框架。在网上看了别人对这些框架的评比后,决定学习 tersorflow。之前一直以为 tersorflow 只可以在 Linux 下安装,出乎意料的是,Windows 下 Python3.5 也可以安装。so happy! 以下是自己的安装教程。注意:只有 P 阅读全文
posted @ 2017-07-22 12:14 debuggor 阅读(514) 评论(0) 推荐(0)
摘要:过拟合 在进行数据挖掘或者机器学习模型建立的时候,因为在统计学习中,假设数据满足独立同分布,即当前已产生的数据可以对未来的数据进行推测与模拟,因此都是使用历史数据建立模型,即使用已经产生的数据去训练,然后使用该模型去拟合未来的数据。但是一般独立同分布的假设往往不成立,即数据的分布可能会发生变化(di 阅读全文
posted @ 2017-07-22 11:15 debuggor 阅读(6384) 评论(0) 推荐(0)
摘要:1、softsign函数 图像 2、tensorflow softsign应用 输出结果: input:[ 0. -1. 2. -30. 30.]output:[ 0. -0.5 0.66666669 -0.96774191 0.96774191] 阅读全文
posted @ 2017-07-22 10:22 debuggor 阅读(2448) 评论(0) 推荐(0)
摘要:1、elu函数 图像: 2、tensorflow elu应用 输出结果: input:[ 0. -1. 2. -3.]output:[ 0. -0.63212055 2. -0.95021296] 阅读全文
posted @ 2017-07-22 10:16 debuggor 阅读(2522) 评论(2) 推荐(0)
摘要:1、softplus函数表达式 图像: 2、tensorflow 举例 输出结果: input:[ 0. 1. 2. 3.]output:[ 0.69314718 1.31326163 2.12692809 3.04858732] 阅读全文
posted @ 2017-07-22 10:02 debuggor 阅读(1860) 评论(0) 推荐(0)
摘要:1.sigmoid函数 S(x)=1/(1+exp(-x)) 导数为:S(x)*(1-S(x))。 这个数值不会超过0.25.。通过sigmoid函数计算的函数值在0~1之间,如果神经网络的层数很多,如果每一层的激励函数采用sigmoid函数,就会产生梯度弥散的问题。因为利用BP函数更新参数的时候, 阅读全文
posted @ 2017-07-22 00:51 debuggor 阅读(1020) 评论(0) 推荐(0)
摘要:1、tanh()函数 tanh是双曲函数中的一个,tanh()为双曲正切。 双曲正切函数的导数公式: 2、tensorflow tanh()例子 import tensorflow as tf input=tf.constant([1,2,3,4],dtype=tf.float32) #在tenso 阅读全文
posted @ 2017-07-22 00:38 debuggor 阅读(1364) 评论(0) 推荐(0)
摘要:tf.nn.conv2d(input, filter, strides, padding, use_cudnn_on_gpu=None, data_format=None, name=None) 官方教程说明: 给定四维的input和filter tensor,计算一个二维卷积 input: A T 阅读全文
posted @ 2017-07-22 00:00 debuggor 阅读(15339) 评论(0) 推荐(1)
摘要:tf.nn.conv2d是TensorFlow里面实现卷积的函数,参考文档对它的介绍并不是很详细,实际上这是搭建卷积神经网络比较核心的一个方法,非常重要 tf.nn.conv2d(input, filter, strides, padding, use_cudnn_on_gpu=None, name 阅读全文
posted @ 2017-07-21 21:14 debuggor 阅读(1952) 评论(0) 推荐(0)
摘要:1、最大池化 max pooling是CNN当中的最大值池化操作,其实用法和卷积很类似。 tf.nn.max_pool(value, ksize, strides, padding, name=None) 参数是四个,和卷积很类似: 第一个参数value:需要池化的输入,一般池化层接在卷积层后面,所 阅读全文
posted @ 2017-07-21 19:15 debuggor 阅读(1271) 评论(0) 推荐(0)
摘要:1、Relu激活函数 Relu激活函数(The Rectified Linear Unit)表达式为:f(x)=max(0,x)。 2、tensorflow实现 输出为: [[ 0. 10. 0.] [ 0. 2. 0.]] 阅读全文
posted @ 2017-07-21 18:49 debuggor 阅读(4242) 评论(0) 推荐(0)
摘要:1、函数 函数:f(z) = 1 / (1 + exp( − z)) 导数:f(z)' = f(z)(1 − f(z)) 2、tensorflow实现 输出为: [[ 5.00000000e-01 9.99954581e-01 4.53978719e-05] [ 7.31058598e-01 8.8 阅读全文
posted @ 2017-07-21 18:37 debuggor 阅读(11035) 评论(0) 推荐(0)
摘要:恢复内容开始 1、softmax函数 2、tensorflow实现例子 输出为: [[ 0.2 0.2 0.2]][[ 0.33333334 0.33333334 0.33333334]][1 3] 输出为: [[ 0.2 0.2 0.2] [ 1. 2. 3. ]][[ 0.33333334 0. 阅读全文
posted @ 2017-07-21 18:12 debuggor 阅读(271) 评论(0) 推荐(0)
摘要: 阅读全文
posted @ 2017-07-21 17:40 debuggor 阅读(136) 评论(0) 推荐(0)