博客园 - Donal
uuid:24b78886-0ed1-41c2-8670-e3f31dcf42c4;id=87212
2018-01-16T01:09:37Z
Donal
https://www.cnblogs.com/Donal/
feed.cnblogs.com
https://www.cnblogs.com/Donal/p/8286653.html
docker命令 - Donal
1.查看image [root@ ~]# docker imagesREPOSITORY TAG IMAGE ID CREATED SIZEk1995/scrapy-cluster cralwer-2.0.4 e3be52ca0a5a 2 days ago 159MBk1995/scrapy-clu
2018-01-15T01:15:00Z
2018-01-15T01:15:00Z
Donal
https://www.cnblogs.com/Donal/
【摘要】1.查看image [root@ ~]# docker imagesREPOSITORY TAG IMAGE ID CREATED SIZEk1995/scrapy-cluster cralwer-2.0.4 e3be52ca0a5a 2 days ago 159MBk1995/scrapy-clu <a href="https://www.cnblogs.com/Donal/p/8286653.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/Donal/p/8046445.html
NLP | 自然语言处理 - 语言模型(Language Modeling) - Donal
转:http://blog.csdn.net/lanxu_yy/article/details/29918015 为什么需要语言模型? 想象“语音识别”这样的场景,机器通过一定的算法将语音转换为文字,显然这个过程是及其容易出错的。例如,用户发音“Recognize Speech”,机器可能会正确地识
2017-12-16T06:04:00Z
2017-12-16T06:04:00Z
Donal
https://www.cnblogs.com/Donal/
【摘要】转:http://blog.csdn.net/lanxu_yy/article/details/29918015 为什么需要语言模型? 想象“语音识别”这样的场景,机器通过一定的算法将语音转换为文字,显然这个过程是及其容易出错的。例如,用户发音“Recognize Speech”,机器可能会正确地识 <a href="https://www.cnblogs.com/Donal/p/8046445.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/Donal/p/7501043.html
windows: Python安装scipy,scikit-image时提示"no lapack/blas resources found"的解决方法 - Donal
解决方案: 最后,解决我遇到的这个问题的解决方案是来自以下链接的答案: http://www.voidcn.com/blog/z6491679/article/p-5740396.html。 另外还有一个类似的回答的链接: http://www.cnblogs.com/eastmount/p/505
2017-09-10T06:39:00Z
2017-09-10T06:39:00Z
Donal
https://www.cnblogs.com/Donal/
【摘要】解决方案: 最后,解决我遇到的这个问题的解决方案是来自以下链接的答案: http://www.voidcn.com/blog/z6491679/article/p-5740396.html。 另外还有一个类似的回答的链接: http://www.cnblogs.com/eastmount/p/505 <a href="https://www.cnblogs.com/Donal/p/7501043.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/Donal/p/6906971.html
Sense2vec with spaCy and Gensim - Donal
如果你在2015年做过文本分析项目,那么你大概率用的是word2vec模型。Sense2vec是基于word2vec的一个新模型,你可以利用它来获取更详细的、与上下文相关的词向量。本文主要介绍该模型的思想以及一些简单的实现。 多义性:word2vec遇到的问题 当人们编写字典和辞典时,我们会列出每个
2017-05-26T01:32:00Z
2017-05-26T01:32:00Z
Donal
https://www.cnblogs.com/Donal/
【摘要】如果你在2015年做过文本分析项目,那么你大概率用的是word2vec模型。Sense2vec是基于word2vec的一个新模型,你可以利用它来获取更详细的、与上下文相关的词向量。本文主要介绍该模型的思想以及一些简单的实现。 多义性:word2vec遇到的问题 当人们编写字典和辞典时,我们会列出每个 <a href="https://www.cnblogs.com/Donal/p/6906971.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/Donal/p/6902048.html
python 去停用词 - Donal
Try caching the stopwords object, as shown below. Constructing this each time you call the function seems to be the bottleneck. I ran this through the
2017-05-25T01:20:00Z
2017-05-25T01:20:00Z
Donal
https://www.cnblogs.com/Donal/
【摘要】Try caching the stopwords object, as shown below. Constructing this each time you call the function seems to be the bottleneck. I ran this through the <a href="https://www.cnblogs.com/Donal/p/6902048.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/Donal/p/6900228.html
nohup command > myout.file 2>&1 & - Donal
nohup command > myout.file 2>&1 &
2017-05-24T09:55:00Z
2017-05-24T09:55:00Z
Donal
https://www.cnblogs.com/Donal/
【摘要】nohup command > myout.file 2>&1 & <a href="https://www.cnblogs.com/Donal/p/6900228.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/Donal/p/6899054.html
NLTK vs SKLearn vs Gensim vs TextBlob vs spaCy - Donal
NLTK is used primarily for general NLP tasks (tokenization, POS tagging, parsing, etc.) Sklearn is used primarily for machine learning (classification
2017-05-24T07:13:00Z
2017-05-24T07:13:00Z
Donal
https://www.cnblogs.com/Donal/
【摘要】NLTK is used primarily for general NLP tasks (tokenization, POS tagging, parsing, etc.) Sklearn is used primarily for machine learning (classification <a href="https://www.cnblogs.com/Donal/p/6899054.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/Donal/p/6898908.html
Gensim进阶教程:训练word2vec与doc2vec模型 - Donal
转自:公子天的技术博客http://www.cnblogs.com/iloveai/ 本篇博客是Gensim的进阶教程,主要介绍用于词向量建模的word2vec模型和用于长文本向量建模的doc2vec模型在Gensim中的实现。 Word2vec Word2vec并不是一个模型——它其实是2013年
2017-05-24T06:49:00Z
2017-05-24T06:49:00Z
Donal
https://www.cnblogs.com/Donal/
【摘要】转自:公子天的技术博客http://www.cnblogs.com/iloveai/ 本篇博客是Gensim的进阶教程,主要介绍用于词向量建模的word2vec模型和用于长文本向量建模的doc2vec模型在Gensim中的实现。 Word2vec Word2vec并不是一个模型——它其实是2013年 <a href="https://www.cnblogs.com/Donal/p/6898908.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/Donal/p/6898900.html
Gensim入门教程 - Donal
转自:公子天的技术博客 What is Gensim? Gensim是一款开源的第三方Python工具包,用于从原始的非结构化的文本中,无监督地学习到文本隐层的主题向量表达。它支持包括TF-IDF,LSA,LDA,和word2vec在内的多种主题模型算法,支持流式训练,并提供了诸如相似度计算,信息检
2017-05-24T06:48:00Z
2017-05-24T06:48:00Z
Donal
https://www.cnblogs.com/Donal/
【摘要】转自:公子天的技术博客 What is Gensim? Gensim是一款开源的第三方Python工具包,用于从原始的非结构化的文本中,无监督地学习到文本隐层的主题向量表达。它支持包括TF-IDF,LSA,LDA,和word2vec在内的多种主题模型算法,支持流式训练,并提供了诸如相似度计算,信息检 <a href="https://www.cnblogs.com/Donal/p/6898900.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/Donal/p/6897437.html
使用pdb调试python - Donal
方法:运行 python -m pdb myscript.py(Pdb) 会自动停在第一行,等待调试,这时你可以看看 帮助(Pdb) h说明下这几个关键 命令<断点设置 (Pdb)b 10 #断点设置在本py的第10行或(Pdb)b ots.py:20 #断点设置到 ots.py第20行删除断点(P
2017-05-24T01:52:00Z
2017-05-24T01:52:00Z
Donal
https://www.cnblogs.com/Donal/
【摘要】方法:运行 python -m pdb myscript.py(Pdb) 会自动停在第一行,等待调试,这时你可以看看 帮助(Pdb) h说明下这几个关键 命令<断点设置 (Pdb)b 10 #断点设置在本py的第10行或(Pdb)b ots.py:20 #断点设置到 ots.py第20行删除断点(P <a href="https://www.cnblogs.com/Donal/p/6897437.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/Donal/p/6897305.html
git只clone仓库中指定子目录 - Donal
基于sparse clone变通方法 [root@vm_test backup]# mkdir devops[root@vm_test backup]# cd devops/[root@vm_test devops]# git init #初始化空库Initialized empty Git rep
2017-05-24T01:24:00Z
2017-05-24T01:24:00Z
Donal
https://www.cnblogs.com/Donal/
【摘要】基于sparse clone变通方法 [root@vm_test backup]# mkdir devops[root@vm_test backup]# cd devops/[root@vm_test devops]# git init #初始化空库Initialized empty Git rep <a href="https://www.cnblogs.com/Donal/p/6897305.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/Donal/p/6873887.html
转:深度学习与自然语言处理之五:从RNN到LSTM - Donal
原文地址:http://blog.csdn.net/malefactor/article/details/50436735/ 大纲如下: 1.RNN 2.LSTM 3.GRN 4.Attention Model 5.应用 6.探讨与思考
2017-05-18T08:04:00Z
2017-05-18T08:04:00Z
Donal
https://www.cnblogs.com/Donal/
【摘要】原文地址:http://blog.csdn.net/malefactor/article/details/50436735/ 大纲如下: 1.RNN 2.LSTM 3.GRN 4.Attention Model 5.应用 6.探讨与思考 <a href="https://www.cnblogs.com/Donal/p/6873887.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/Donal/p/6380889.html
转:如何构建爬虫代理服务? - Donal
起因 做过爬虫的人应该都知道,抓的网站和数据多了,如果爬虫抓取速度过快,免不了触发网站的防爬机制,几乎用的同一招就是封IP。解决方案有2个: 1、同一IP,放慢速度(爬取速度慢) 2、使用代理IP访问(推荐) 1、同一IP,放慢速度(爬取速度慢) 2、使用代理IP访问(推荐) 第一种方案牺牲的就是时
2017-02-09T02:36:00Z
2017-02-09T02:36:00Z
Donal
https://www.cnblogs.com/Donal/
【摘要】起因 做过爬虫的人应该都知道,抓的网站和数据多了,如果爬虫抓取速度过快,免不了触发网站的防爬机制,几乎用的同一招就是封IP。解决方案有2个: 1、同一IP,放慢速度(爬取速度慢) 2、使用代理IP访问(推荐) 1、同一IP,放慢速度(爬取速度慢) 2、使用代理IP访问(推荐) 第一种方案牺牲的就是时 <a href="https://www.cnblogs.com/Donal/p/6380889.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/Donal/p/6116696.html
RHEL7下安装使用TensorFlow和kcws - Donal
0.安装依赖包 1.安装bazel Bazel是一个类似于Make的工具,是Google为其内部软件开发的特点量身定制的工具,2015年开源。 2.安装TensorFlow 3.安装kcws - 97.5%准确率的深度学习中文分词(字嵌入+Bi-LSTM+CRF)https://github.com
2016-11-30T02:39:00Z
2016-11-30T02:39:00Z
Donal
https://www.cnblogs.com/Donal/
【摘要】0.安装依赖包 1.安装bazel Bazel是一个类似于Make的工具,是Google为其内部软件开发的特点量身定制的工具,2015年开源。 2.安装TensorFlow 3.安装kcws - 97.5%准确率的深度学习中文分词(字嵌入+Bi-LSTM+CRF)https://github.com <a href="https://www.cnblogs.com/Donal/p/6116696.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/Donal/p/5669974.html
RHEL7 -- Linux搭建FTP虚拟用户 - Donal
安装vsftpd软件包[root@localhost ~]# yum install vsftpd -y [root@localhost ~]# yum install db4 db4-utils 建立vsftpd服务的宿主用户[root@localhost ~]# useradd vir -s /
2016-07-14T03:57:00Z
2016-07-14T03:57:00Z
Donal
https://www.cnblogs.com/Donal/
【摘要】安装vsftpd软件包[root@localhost ~]# yum install vsftpd -y [root@localhost ~]# yum install db4 db4-utils 建立vsftpd服务的宿主用户[root@localhost ~]# useradd vir -s / <a href="https://www.cnblogs.com/Donal/p/5669974.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/Donal/p/5669789.html
解决windows10搜索不到内容的问题 - Donal
windows 10的搜索突然搜不到程序了, 网上查询说要重建索引,方法如下: 1.按ctr+R键,输入%LocalAppData%\Packages\windows.immersivecontrolpanel_cw5n1h2txyewy\LocalState 2.右键打开Indexed文件夹的属性
2016-07-14T03:22:00Z
2016-07-14T03:22:00Z
Donal
https://www.cnblogs.com/Donal/
【摘要】windows 10的搜索突然搜不到程序了, 网上查询说要重建索引,方法如下: 1.按ctr+R键,输入%LocalAppData%\Packages\windows.immersivecontrolpanel_cw5n1h2txyewy\LocalState 2.右键打开Indexed文件夹的属性 <a href="https://www.cnblogs.com/Donal/p/5669789.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/Donal/p/5370362.html
forward和redirect 的区别 - Donal
一、使用区别 1.从地址栏显示来说 forward是服务器请求资源,服务器直接访问目标地址的URL,把那个URL的响应内容读取过来,然后把这些内容再发给浏览器.浏览器根本不知道服务器发送的内容从哪里来的,所以它的地址栏还是原来的地址.redirect是服务端根据逻辑,发送一个状态码,告诉浏览器重新去
2016-04-08T15:26:00Z
2016-04-08T15:26:00Z
Donal
https://www.cnblogs.com/Donal/
【摘要】一、使用区别 1.从地址栏显示来说 forward是服务器请求资源,服务器直接访问目标地址的URL,把那个URL的响应内容读取过来,然后把这些内容再发给浏览器.浏览器根本不知道服务器发送的内容从哪里来的,所以它的地址栏还是原来的地址.redirect是服务端根据逻辑,发送一个状态码,告诉浏览器重新去 <a href="https://www.cnblogs.com/Donal/p/5370362.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/Donal/p/5226430.html
RHEL7磁盘分区挂载和格式化 - Donal
安装大数据平台,每台机器需要挂载10个磁盘,用JBOD模式,操作系统为RHEL7.2。 写了两个脚本,format_disk.sh和mount_disk.sh实现磁盘自动分区格式化以及挂载,修改fstab。 format_disk.sh #!/bin/bash disks=(sdb sdc sdd
2016-02-29T01:48:00Z
2016-02-29T01:48:00Z
Donal
https://www.cnblogs.com/Donal/
【摘要】安装大数据平台,每台机器需要挂载10个磁盘,用JBOD模式,操作系统为RHEL7.2。 写了两个脚本,format_disk.sh和mount_disk.sh实现磁盘自动分区格式化以及挂载,修改fstab。 format_disk.sh #!/bin/bash disks=(sdb sdc sdd <a href="https://www.cnblogs.com/Donal/p/5226430.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/Donal/p/5082395.html
Spring注解 - Donal
概述注释配置相对于 XML 配置具有很多的优势:它可以充分利用 Java 的反射机制获取类结构信息,这些信息可以有效减少配置的工作。如使用 JPA 注释配置 ORM 映射时,我们就不需要指定 PO 的属性名、类型等信息,如果关系表字段和 PO 属性名、类型都一致,您甚至无需编写任务属性映射信息——因...
2015-12-28T06:17:00Z
2015-12-28T06:17:00Z
Donal
https://www.cnblogs.com/Donal/
【摘要】概述注释配置相对于 XML 配置具有很多的优势:它可以充分利用 Java 的反射机制获取类结构信息,这些信息可以有效减少配置的工作。如使用 JPA 注释配置 ORM 映射时,我们就不需要指定 PO 的属性名、类型等信息,如果关系表字段和 PO 属性名、类型都一致,您甚至无需编写任务属性映射信息——因... <a href="https://www.cnblogs.com/Donal/p/5082395.html" target="_blank">阅读全文</a>
https://www.cnblogs.com/Donal/p/5037695.html
100 open source Big Data architecture papers for data professionals - Donal
100 open source Big Data architecture papers for data professionals.Jun 18, 2015https://www.linkedin.com/pulse/100-open-source-big-data-architecture-p...
2015-12-10T15:20:00Z
2015-12-10T15:20:00Z
Donal
https://www.cnblogs.com/Donal/
【摘要】100 open source Big Data architecture papers for data professionals.Jun 18, 2015https://www.linkedin.com/pulse/100-open-source-big-data-architecture-p... <a href="https://www.cnblogs.com/Donal/p/5037695.html" target="_blank">阅读全文</a>