摘要: 最近在研究区块链技术,首先要从开发环境的搭建搞起,本人用docker在Ubuntu16.04下搭建以太坊的开发环境,做一下记录,希望对后来者有所参考帮助。 因为我在docker下安装,所以默认为管理员权限,接下来的命令都不会加sudo,如果后来者是直接在ubuntu下搭建的话,需要用到管理员权限。 阅读全文
posted @ 2018-06-04 09:39 KFPA 阅读(376) 评论(0) 推荐(0) 编辑
摘要: 人类的大脑很擅长于鉴别和识别物体,我们希望机器也可以做同样的事情。一个神经网络就是一个模仿人类大脑激发学习过程的框架。神经网络被用于从数据中识别隐藏的模式。正如所有的学习算啊,神经网络处理的是数字。因此,如果想要实现处理现实世界中任何包含图像、文字、传感器等的任务,就必须将其转换成数值形式,然后将其 阅读全文
posted @ 2018-03-23 14:44 KFPA 阅读(20646) 评论(4) 推荐(2) 编辑
摘要: 神经网络很萌的!0.分类 神经网络最重要的用途是分类,为了让大家对分类有个直观的认识,咱们先看几个例子:垃圾邮件识别:现在有一封电子邮件,把出现在里面的所有词汇提取出来,送进一个机器里,机器需要判断这封邮件是否是垃圾邮件。疾病判断:病人到医院去做了一大堆肝功、尿检测验,把测验结果送进一个机器里,机器 阅读全文
posted @ 2018-03-23 14:00 KFPA 阅读(466) 评论(1) 推荐(0) 编辑
摘要: sklearn.cross_validation模块的作用顾名思义就是做cross validation的。 cross validation大概的意思是:对于原始数据我们要将其一部分分为train data,一部分分为test data。train data用于训练,test data用于测试准确 阅读全文
posted @ 2017-12-16 16:17 KFPA 阅读(9571) 评论(1) 推荐(0) 编辑
摘要: 决策树分类器就像带有终止块的流程图,终止块表示分类结果。开始处理数据集时,我们首先需要测量集合中数据的不一致性,也就是熵,然后寻找最优方案划分数据集,知道数据集中的所有数据属于同一分类。ID3算法可以用于划分标称型数据集。构建决策树时,我们通常采用递归的方法将数据集转化为决策树。一般我们并不构造新的 阅读全文
posted @ 2017-11-02 10:08 KFPA 阅读(176) 评论(0) 推荐(0) 编辑
摘要: 最近在建词典,使用Trie字典树,需要把字符串分解成单个字。由于传入的字符串中可能包含中文或者英文,它们的字节数并不相同。一开始天真地认为中文就是两个字节,于是很happy地直接判断当前位置的字符的ASCII码是否处于0~127之间,如果是就提取一个字符,否则提取两个。在测试分字效果的时候,这种方法 阅读全文
posted @ 2017-10-19 16:49 KFPA 阅读(2093) 评论(0) 推荐(0) 编辑
摘要: python解析xml有很多种方法,比较流行的由SAX,DOM和ElementTree,简要介绍一下这几种方法的异同: 接下来主要介绍ElementTree,该模块实现了一个简单而有效的API来解析和创建xml数据,是的,他不仅可以解析xml而且可以修改xml哦!!! xml是什么?xml是一种固有 阅读全文
posted @ 2017-09-08 11:22 KFPA 阅读(1290) 评论(0) 推荐(0) 编辑
摘要: Items(项目) 一个item是指从目标网站上爬取的一条单独的数据。例如从京东网站上爬取的一款小米6手机的信息。大家应该对 item (项目)和 item definition(项目定义)做一个区分。Portia中对这两者的区别是item definition是对项目的定义而不是项目本身,是一个抽 阅读全文
posted @ 2017-09-04 14:22 KFPA 阅读(708) 评论(0) 推荐(0) 编辑
摘要: Portia环境部署步骤总结,portia环境部署有太多的坑,为能够重复部署,记录下部署的具体步骤供大家参考! 阅读全文
posted @ 2017-08-28 17:16 KFPA 阅读(3700) 评论(0) 推荐(1) 编辑
摘要: python利用urllib实现的爬取京东网站商品图片的爬虫 阅读全文
posted @ 2017-08-23 16:31 KFPA 阅读(2199) 评论(0) 推荐(0) 编辑