会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
奇小东
博客园
首页
新随笔
联系
订阅
管理
2017年2月21日
Scrapy爬虫库使用初体验
摘要: 安装pip install Scrapy 中间可能会遇到的问题: 超时,网络问题需要多次尝试 缺少vc++库,官网可以下载 缺少vc++库,官网可以下载 win32api缺失,https://sourceforge.net/projects/pywin32/?source=typ_redirect选
阅读全文
posted @ 2017-02-21 15:57 kuqs(奇小东)
阅读(817)
评论(0)
推荐(0)
2017年2月13日
Selenium+PhantomJS使用初体验
摘要: 抓取使用Ajax技术完成的网页内容时可以使用Selenium+PhantomJS技术 1.pip install selenium 2.下载Phantomjs不需要用pip 武汉科技大学首页有一块使用js异步加载的网页内容,如图 抓取这一块内容的思路是:判断这一块是否加载完毕;selenium抓取
阅读全文
posted @ 2017-02-13 20:36 kuqs(奇小东)
阅读(4371)
评论(0)
推荐(0)
2016年12月15日
用正则表达式给字符串添加空格
摘要: 自然语言处理有一种ROUGE的评测方法,使用这种评测方法时有时需要将带评测文本每个汉字之间用空格分开。 原版说明如下: The recommended ROUGE metrics are Recall and F scores ofCharacter-based ROUGE-1, ROUGE-2 a
阅读全文
posted @ 2016-12-15 15:23 kuqs(奇小东)
阅读(9478)
评论(0)
推荐(0)
2016年8月1日
正则表达式中常用符号
摘要: 一: 正则在Perl、Py森、Ruby、Java等语言中文本的正则表达式几乎是一样的 以前常用到的在网上都有现成的例子拿来用,比如电话格式、邮箱格式之类的。 但是自然语言处理中往往会根据自己的需求来制定一个表达式,如果正则的知识掌握的比较片面,在编写自然语言处理程序时可能会觉得苦恼。 在《自然语言处
阅读全文
posted @ 2016-08-01 22:05 kuqs(奇小东)
阅读(45297)
评论(2)
推荐(3)
2016年5月9日
JAVA怎么在函数内改变传入的值
摘要: 主函数main()这个静态方法无法引用非静态方法 aa(int)的。函数调用时,参数传递的方式主要有两种: 值传递和引用传递。Java使用的是值传递。值传递是把变量的值、常数或常量传递给参数。而引用传递,是把变量的所在内存中的地址传递给参数,参数通过地址找到变量的值。无论是在C、c++还是java中
阅读全文
posted @ 2016-05-09 10:20 kuqs(奇小东)
阅读(5663)
评论(0)
推荐(0)
2016年4月26日
斯坦福分词工具的试用
摘要: 下载链接 戳这里 下载后的文件夹是这样的: 然后打开eclipse,新建项目,把源文件segDemo.java拷贝进去,把jar包全丢进去(右键项目, properties,Java Build Path,Add External Jars) 导入data数据包,并且修改源码中的路径,如图所示: 然
阅读全文
posted @ 2016-04-26 16:26 kuqs(奇小东)
阅读(2277)
评论(0)
推荐(0)
2016年4月24日
linux给一个文件夹开启权限
摘要: 假如要给一个叫做xiaobang的文件夹权限,CD到这一级目录 chmod -R 777 xiaobang
阅读全文
posted @ 2016-04-24 11:01 kuqs(奇小东)
阅读(561)
评论(0)
推荐(0)
2015年7月24日
localhost与127.0.0.1之间的区别
摘要: Localhost的意思是本地服务器,而127.0.0.1是本机地址,他们的关系是通过操 作系统中的hosts文件,将Localhost解析为127.0.0.1。而实际工作中,Localhost是不经过网卡传输的,所以,它不受网络防火 墙和与网卡相关的种种限制;而127.0.0.1则要通过网卡传输数...
阅读全文
posted @ 2015-07-24 16:49 kuqs(奇小东)
阅读(381)
评论(0)
推荐(0)
公告