04 2017 档案

摘要:采集后的数据都带有'<>'html标签: <img src="http://i4.hdfimg.com/www/images/giftrans/3d/da/7b/18414.gif" border="0"/><span class='WmoJPQM2AzpQMA'>科研<span class='Wm 阅读全文
posted @ 2017-04-27 23:37 kingrain 阅读(2323) 评论(0) 推荐(0)
摘要:1、向MySQL中插入时间(年月日时分秒),在时分秒处报错。在年月日与时分秒中间有个空格。解决办法:在sql语句中时间用一个“ ”包起来就可以了。、 2、在Ubuntu的crontab中编辑定时任务,没有任何语法错误,但是定时任务不起作用。解决办法:在Python处不能直接用Python,要加上Py 阅读全文
posted @ 2017-04-26 22:22 kingrain 阅读(262) 评论(0) 推荐(0)
摘要:第1列分钟1~59第2列小时1~23(0表示子夜)第3列日1~31第4列月1~12第5列星期0~6(0表示星期天)第6列要运行的命令 下面是crontab的格式:分 时 日 月 星期 要运行的命令 这里有crontab文件条目的一些例子: 30 21 * * * /usr/local/apache/ 阅读全文
posted @ 2017-04-26 15:58 kingrain 阅读(343) 评论(0) 推荐(0)
摘要:1 rootdir = d:\data\ # 指明被遍历的文件夹 2 print rootdir 3 for parent, dirnames, filenames in os.walk(rootdir): # 三个参数:分别返回1.父目录 2.所有文件夹名字(不含路径) 3.所有文件名字 4 for dirname in dirnames: ... 阅读全文
posted @ 2017-04-26 09:42 kingrain 阅读(629) 评论(0) 推荐(0)
摘要:PDFMiner python的PDF解析器和分析器 1.官方文档:http://www.unixuser.org/~euske/python/pdfminer/index.html 2.特征 完全使用python编写。 (适用于2.4或更新版本) 解析,分析,并转换成PDF文档。 PDF-1.7规 阅读全文
posted @ 2017-04-19 21:36 kingrain 阅读(13066) 评论(0) 推荐(0)
摘要:1、Navicat下载地址:点击下载 2、pycharm激活 :点击链接地址 阅读全文
posted @ 2017-04-18 16:24 kingrain 阅读(325) 评论(0) 推荐(0)
摘要:mysql -u 用户名 -p 数据库名称 -h 数据库的ip 如:mysql -u testuser -p mydb -h 110.2.2.14 在Linux中启动mysql : service mysql start 阅读全文
posted @ 2017-04-18 15:03 kingrain 阅读(242) 评论(0) 推荐(0)
摘要:正则表达式学习链接 http://deerchao.net/tutorials/regex/regex.htm#greedyandlazy 1、删除任意空白字符(换行符,空字符等) 阅读全文
posted @ 2017-04-13 15:47 kingrain 阅读(131) 评论(0) 推荐(0)
摘要:具体实现方法如下: def addWord(theIndex,word,pagenumber): theIndex.setdefault(word, [ ]).append(pagenumber)#存在就在基础上加入列表,不存在就新建个字典key d = {"hello":[3]} #d = {} 阅读全文
posted @ 2017-04-13 10:02 kingrain 阅读(4855) 评论(0) 推荐(0)