03 2018 档案
摘要:一:基本概念 1、使用图(graphs)来表示计算任务 2、在被称之为会话(Session)的上下文(context)中执行图 3、使用tensor表示数据 4、通过变量(Variable)维护状态 5、使用feed和fetch可以为任意的操作赋值或者从其中获取数据 TensorFlow是一个编程系
阅读全文
摘要:我的环境:win10+python3.6.4(64位) 一:安装python 根据自己的电脑下载python(32位或者64位)-->安装教程 安装好python后记得配置pip源,使用官方的源下载python库时速度比较慢。-->配置pip源 配置好pip源后就可以使用pip3(python3)或
阅读全文
摘要:一:准备数据 机器学习的算法要取得好效果,离不开数据。首先从网上拉一些数据用来测试。首先拉取英文数据: 我从英文小说网拉取了英文数据,对英文小说的句子进行清洗,得到我们想要的: 然后拉取中文数据:我从新闻网站获得很多的中文文章,处理数据 经过上面处理得到data.csv格式的数据,建议中文的数据量和
阅读全文
摘要:一:引言 贝叶斯方法是一个历史悠久,有着坚实的理论基础的方法,同时处理很多问题时直接而又高效,很多高级自然语言处理模型也可以从它演化而来。因此,学习贝叶斯方法,是研究自然语言处理问题的一个非常好的切入口。 二:贝叶斯公式 贝叶斯公式就这一行: 而它其实是由以下的联合概率公式推导出来的: 其中P(Y)
阅读全文
摘要:一:前言 和拉丁语系不同,亚洲语言是不用空格分开每个有意义的词的。而当我们进行自然语言处理的时候,大部分情况下,词汇是我们对句子和文章理解的基础,因此需要一个工具去把完整的文本中分解成粒度更细的词。 jieba就是这样一个非常好用的中文工具,是以分词起家的,但是功能比分词要强大很多。 二:基本分词函
阅读全文
摘要:一:简介 正则表达式是处理字符串的强大工具,拥有独特的语法和独立的处理引擎。 我们在大文本中匹配字符串时,有些情况用str自带的函数(比如find, in)可能可以完成,有些情况会稍稍复杂一些(比如说找出所有“像邮箱”的字符串),这个时候我们需要一个某种模式的工具,这个时候正则表达式就派上用场了。
阅读全文
摘要:问题描述:有一段时间下载python库的时候速度非常慢,想着提高安装python库的速度。 window10下: 一:首先进入c盘的用户目录,如我的目录为C:\Users\felix。 二:创建名为pip的文件夹,在该文件夹下创建pip.ini文件,如图: 一个是更改pip安装的源,一个是更改pip
阅读全文
摘要:一:安装jupyter 1、首先要用管理员方式打开cmd,没用管理员打开后面安装不上。 2、安装jupyter。我用的是python3,所以用pip3 install jupyter进行安装。 3、安装完后打开jupyter。cmd下输入jupyter notebook。 我第一次安装jupyter
阅读全文
摘要:1、scikit-learn决策树算法库介绍 scikit-learn决策树算法类库内部实现是使用了调优过的CART树算法,既可以做分类,又可以做回归。分类决策树的类对应的是DecisionTreeClassifier,而回归决策树的类对应的是DecisionTreeRegressor。 本实例采用
阅读全文
摘要:首先附上我觉得比较完整的决策树总结: 决策树算法(上) 决策树算法(下) 1、什么是决策树/判定树: 判定树是一个类似于流程图的树结构:其中每个节点一个属性上的测试,每个分支代表一个属性输出,而每个树叶节点代表类或者类分布。树的最顶层是根节点。 2、熵的概念 熵度量了事物的不确定性,越不确定的事物,
阅读全文
摘要:学习python快一年了,因为之前学习python全栈时,没有记录学习笔记想回顾发现没有好的记录,目前主攻python自然语言处理方面,把每天的学习记录记录下来,以供以后查看,和交流分享。~~(。・ω・。) ~~ 这一系列主要学习和回顾机器学习的数学部分。 微积分: 一:两边夹定理 二:极限存在定理
阅读全文

浙公网安备 33010602011771号