摘要: 如何有效的将文本向量化是自然语言处理(Natural Language Processing: NLP)领域非常重要的一个研究方向。传统的文本向量化可以用独热编码(one-hot encoding)、词袋模型(bag-of-words)和TF-IDF等方式,但是以上得到的文本向量可能维度都很高,在一 阅读全文
posted @ 2019-02-21 17:00 JieLongZ 阅读(994) 评论(0) 推荐(1) 编辑
摘要: 分词(Tokenization) - NLP学习(1) N-grams模型、停顿词(stopwords)和标准化处理 - NLP学习(2) 文本向量化及词袋模型 - NLP学习(3-1) 在上一篇博文中,简单地阐述了如何将文本向量化及词袋模型的。文本向量化是为了将文本转换成机器学习算法可以直接处理的 阅读全文
posted @ 2019-02-14 16:48 JieLongZ 阅读(1392) 评论(0) 推荐(1) 编辑
摘要: 之前在其他博客文章有提到如何对英文进行分词,也说后续会增加解释我们中文是如何分词的,我们都知道英文或者其他国家或者地区一些语言文字是词与词之间有空格(分隔符),这样子分词处理起来其实是要相对容易很多,但是像中文处理起来就没有那么容易,因为中文字与字之间,词与词之间都是紧密连接在一起的,所以第一件事需 阅读全文
posted @ 2019-02-12 23:39 JieLongZ 阅读(2921) 评论(0) 推荐(0) 编辑
摘要: 分词(Tokenization) - NLP学习(1) N-grams模型、停顿词(stopwords)和标准化处理 - NLP学习(2) 之前我们都了解了如何对文本进行处理:(1)如用NLTK文本处理库将文本的句子成分分成了N-Gram模型,与此同时引入了正则表达式去除一些多余的句子成分;(2)将 阅读全文
posted @ 2019-02-11 15:57 JieLongZ 阅读(2879) 评论(1) 推荐(1) 编辑
摘要: 在上一节《Tokenization - NLP(1)》的学习中,我们主要学习了如何将一串字符串分割成单独的字符,并且形成一个词汇集(vocabulary),之后我们将形成的词汇集合转换成计算机可以处理的数字信息,以方便我们做进一步文本分析。这篇博客的主题还是我们如何将文本转成成更有用的成分,让我们能 阅读全文
posted @ 2019-01-02 14:15 JieLongZ 阅读(9169) 评论(1) 推荐(1) 编辑
摘要: 自从开始使用Python做深度学习的相关项目时,大部分时候或者说基本都是在研究图像处理与分析方面,但是找工作反而碰到了很多关于自然语言处理(natural language processing: NLP)的问题,所以决定花点时间学习并且写下来,希望那些跟我一样同时在学习NLP的朋友能有一些帮助,学 阅读全文
posted @ 2018-12-26 13:19 JieLongZ 阅读(9391) 评论(0) 推荐(2) 编辑
摘要: 在这篇博文中主要介绍下机器学习中的偏差和方差。在实际运用机器学习(或深度学习)模型的过程当中,总是会难免碰到一个问题,就是常说的偏差(Bias)与方差(Variance),及其之间的权衡(Bias-Variance Tradeoff),理解了机器学习中的方差和偏差有助于进一步理解机器学习算法的运作并 阅读全文
posted @ 2018-09-01 14:58 JieLongZ 阅读(965) 评论(0) 推荐(0) 编辑
摘要: 在学习算法的过程中,二叉平衡树是一定会碰到的,这篇博文尽可能简明易懂的介绍下二叉树的相关概念,然后着重讲下什么事平衡二叉树。 (由于作图的时候忽略了箭头的问题,正常的树一般没有箭头,虽然不影响描述的过程,但是还是需要注意,所以还请读者忽略一下部分图的箭头) 一、二叉(查找)树 二叉查找树(Binar 阅读全文
posted @ 2018-08-31 19:18 JieLongZ 阅读(1434) 评论(0) 推荐(1) 编辑
摘要: 这篇博文主要会讲述基础的算法分析,对于算法分析主要是针对算法运行时间进行分析。 几个需要注意的读法:Omega(Ω),Theta(Θ)和大O符号。 一、算法分析 - 最坏情况分析法 算法分析其实主要针对两方面,但是平时更多地所讲的一个算法的好坏通常是通过算法运行时间来衡量,如若一个算法运行时间短,则 阅读全文
posted @ 2018-08-30 21:49 JieLongZ 阅读(589) 评论(0) 推荐(0) 编辑
摘要: 这篇文章将会对稳定匹配算法进行介绍及Python代码的实现,第一部分会针对稳定匹配的Gale-Shapley算法进行解析,第二部分就是用Python对该算法进行实现。 一、稳定匹配算法原理 1.1 介绍 稳定匹配(Stable Matching)问题就是假设现在有N个男生和N个女生跳舞选择伴侣,然后 阅读全文
posted @ 2018-08-12 14:52 JieLongZ 阅读(5225) 评论(0) 推荐(0) 编辑