随笔分类 -  算法

摘要:这里我们会用 Python 实现三个简单的卷积神经网络模型:LeNet 、AlexNet 、VGGNet,首先我们需要了解三大基础数据集:MNIST 数据集、Cifar 数据集和 ImageNet 数据集 三大基础数据集 MNIST 数据集 MNIST数据集是用作手写体识别的数据集。MNIST 数据 阅读全文
posted @ 2019-09-17 16:26 ''竹先森゜ 阅读(3932) 评论(0) 推荐(1)
摘要:卷积神经网络 卷积神经网络(CNN)是深度学习的代表算法之一 。具有表征学习能力,能够按其阶层结构对输入信息进行平移不变分类,因此也被称为“平移不变人工神经网络”。随着深度学习理论的提出和数值计算设备的改进,卷积神经网络得到了快速发展,并被应用于计算机视觉、自然语言处理等领域。 卷积是通过两个函数 阅读全文
posted @ 2019-09-17 11:08 ''竹先森゜ 阅读(5204) 评论(0) 推荐(2)
摘要:本文内容主要参考GitHub:https://github.com/isnowfy/snownlp what's the SnowNLP SnowNLP是一个python写的类库,可以方便的处理中文文本内容,是受到了TextBlob的启发而写的,由于现在大部分的自然语言处理库基本都是针对英文的,于是 阅读全文
posted @ 2019-05-31 10:10 ''竹先森゜ 阅读(46346) 评论(7) 推荐(0)
摘要:本文为本人学习pyhanlp的笔记,大多知识点来源于GitHubhttps://github.com/hankcs/HanLP/blob/master/README.md,文中的demo代码来源于该GitHub主 what's the pyhanlp pyhanlp是HanLP的Python接口,支 阅读全文
posted @ 2019-05-29 15:27 ''竹先森゜ 阅读(11920) 评论(1) 推荐(1)
摘要:jieba简介 python在数据挖掘领域的使用越来越广泛。想要使用python做文本分析,分词是必不可少的一个环节在python的第三方包里,jieba应该算得上是分词领域的佼佼者。 GitHub地址:https://github.com/fxsjy/jieba 安装方法 主要算法 基于前缀词典实 阅读全文
posted @ 2019-05-28 13:57 ''竹先森゜ 阅读(3121) 评论(0) 推荐(0)
摘要:TensorFlow 可以用来实现验证码识别的过程,这里识别的验证码是图形验证码,首先用标注好的数据来训练一个模型,然后再用模型来实现这个验证码的识别。 生成验证码 首先生成验证码,这里使用 Python 的 captcha 库来生成即可,这个库默认是没有安装的,所以需要先安装这个库,另外还需要安装 阅读全文
posted @ 2018-07-28 11:15 ''竹先森゜ 阅读(2751) 评论(0) 推荐(0)
摘要:前言 验证码是目前互联网上非常常见也是非常重要的一个事物,充当着很多系统的 防火墙 功能,但是随时OCR技术的发展,验证码暴露出来的安全问题也越来越严峻。本文介绍了一套字符验证码识别的完整流程,对于验证码安全和OCR识别技术都有一定的借鉴意义。 GitHub上有大神总结的非常好的源码及博客,链接如下 阅读全文
posted @ 2018-07-27 20:44 ''竹先森゜ 阅读(3472) 评论(0) 推荐(0)
摘要:识别数字验证码 首先我们准备素材,4张验证码图片如下: 第一步: 打开图像。 im = Image.open('temp1.jpg') 第二步: 把彩色图像转化为灰度图像。彩色图像转化为灰度图像的方法很多,这里采用RBG转化到HSI彩色空间,采用I分量。 imgry = im.convert('L' 阅读全文
posted @ 2018-07-27 20:07 ''竹先森゜ 阅读(2292) 评论(0) 推荐(0)
摘要:Tesseract 简介 Tesseract 的 OCR 引擎最先由 HP 实验室于 1985 年开始研发,至 1995 年时已经成为 OCR 业内最准确的三款识别引擎之一。然而,HP 不久便决定放弃 OCR 业务,Tesseract 也从此尘封。 数年以后,HP 意识到,与其将 Tesseract 阅读全文
posted @ 2018-07-27 19:31 ''竹先森゜ 阅读(2763) 评论(0) 推荐(0)
摘要:迷宫问题 这里有一个迷宫如图所示,求走出迷宫的路径 这里我们建一个二维列表,表示迷宫(0表示通道,1表示围墙)。 用栈解决迷宫问题 基本思路:在一个迷宫节点(x,y)上,可以进行四个方向的探查:maze[x-1][y](表示上), maze[x+1][y](下), maze[x][y-1](左), 阅读全文
posted @ 2018-02-04 23:09 ''竹先森゜ 阅读(3290) 评论(0) 推荐(0)
摘要:目录 栈 队列 链表与双向链表 哈希表 二叉搜索树 what's the 数据结构 数据结构是指相互之间存在着一种或多种关系的数据元素的集合和该集合中数据元素之间的关系组成。 简单来说,数据结构就是设计数据以何种方式组织并存储在计算机中。 比如:列表、集合与字典等都是一种数据结构。 通常情况下,精心 阅读全文
posted @ 2018-02-04 21:11 ''竹先森゜ 阅读(2454) 评论(0) 推荐(0)
摘要:贪心算法 贪心算法(又称贪婪算法)是指,在对问题求解时,总是做出在当前看来是最好的选择。也就是说,不从整体最优上加以考虑,他所做出的是在某种意义上的局部最优解。 贪心算法不是对所有问题都能得到整体最优解,关键是贪心策略的选择,选择的贪心策略必须具备无后效性,即某个状态以前的过程不会影响以后的状态,只 阅读全文
posted @ 2018-02-04 18:04 ''竹先森゜ 阅读(2805) 评论(0) 推荐(0)
摘要:what's the 树 在了解二叉树之前,首先我们得有树的概念。 树是一种数据结构又可称为树状图,如文档的目录、HTML的文档树都是树结构,它是由n(n>=1)个有限节点组成一个具有层次关系的集合。把它叫做“树”是因为它看起来像一棵倒挂的树,也就是说它是根朝上,而叶朝下的。它具有以下的特点: 每个 阅读全文
posted @ 2018-02-03 15:03 ''竹先森゜ 阅读(2462) 评论(0) 推荐(0)
摘要:目录 LOW B 三人组 冒泡排序 选择排序 插入排序 NB 三人组 快速排序 堆排序 归并排序 其他 希尔排序 计数排序 列表排序即将无需列表变为有序,Python的内置函数为sort()。应用的场景主要有:各种榜单、各种表格、给二分查找用、 其他算法用等等。 有关列表排序的算法有很多,主要分为: 阅读全文
posted @ 2018-02-01 20:27 ''竹先森゜ 阅读(4111) 评论(0) 推荐(3)
摘要:what's the 算法 算法(Algorithm)是指解题方案的准确而完整的描述,是一系列解决问题的清晰指令,算法代表着用系统的方法描述解决问题的策略机制。也就是说,能够对一定规范的输入,在有限时间内获得所要求的输出。如果一个算法有缺陷,或不适合于某个问题,执行这个算法将不会解决这个问题。不同的 阅读全文
posted @ 2018-02-01 17:35 ''竹先森゜ 阅读(2564) 评论(0) 推荐(2)