09 2017 档案
摘要:# coding: utf-8 # ###jieba特性介绍 # 支持三种分词模式: # 精确模式,试图将句子最精确地切开,适合文本分析; # 全模式,把句子中所有的可以成词的词语都扫描出来, 速度非常快,但是不能解决歧义; # 搜索引擎模式,在精确模式的基础上,对长词再次切分,提高召回率,适合用于搜索引擎分词。 # 支持繁体分词。 # 支持自定义词典。 # MIT 授权协议。 # ###分...
阅读全文
摘要:看图: 补充: 1. 最大保护模式在生产环境下一般不常用,于备库强耦合不仅拖累主库的性能,同时在强有力保护数据完整性和一致性的同时,也使得生产业务受到拖累,受环境影响比较大 2. 在要求性能高同时对数据安全要求没那么强就可以使用最大性能模式,实际上一般业务上都是使用这种模式的比较多 3. 如何在主库
阅读全文
摘要:talk is cheap,here is the code:
阅读全文
摘要:1. sudo apt-get install mongodb 2. 登陆数据库: mongo, 3. 创建数据库:use dbname 4. 插入数据: db.dbname.insert({"name":"yourname"}) 5. 删除数据库: db.dropDatabase 6. 更新数据:
阅读全文
摘要:爬一个××网站上的东西,测算了一下协程的速度提升到底有多大,网站链接就不放了。。。 爬完用时 111.7 s。 来试试协程: 结果是: 55.6 s 也就是说在同样是单线程的情况下,采用了协程后可以使得时间缩减一半,而且仅仅是使用了python的第三方协程库实现的。 牛逼了
阅读全文
摘要:1。单进程单线程:一个人在一个桌子上吃菜。2。单进程多线程:多个人在同一个桌子上一起吃菜。3。多进程单线程:多个人每个人在自己的桌子上吃菜。 多线程的问题是多个人同时吃一道菜的时候容易发生争抢,例如两个人同时夹一个菜,一个人刚伸出筷子,结果伸到的时候已经被夹走菜了。。。此时就必须等一个人夹一口之后,
阅读全文
摘要:相信很多人和我一样,被python蛋疼的编码问题纠缠不清,比如下面的 私以为出现这种错误的原因还是对一些基本的编解码概念不够熟悉,下面就说说我的理解: 首先python刚出来的时候unicode还没有一统江湖,期间很多代码和程序压根就是直接用ascii编码,反正代码都是英文写的,而且当时那个年代写代
阅读全文
摘要:在python类中有个__str__的特殊方法,该方法可以使print打印出来的东西更美观,在类里就可以定义,如下代码: 代码中print(instance)执行后打印出来的就是str的‘xiaoming’,美观了很多,看起来也清爽了,如果没有这个方法那打印出来的就丑的一比了。 同时需要注意的是,_
阅读全文
摘要:需求: 提取文本中的中文和数字字母(大小写都要),即相当于删除所有标点符号。 其中new是原字符串
阅读全文
摘要:from bs4 import BeautifulSoup import requests import gevent from gevent import monkey, pool monkey.patch_all() jobs = [] links = [] p = pool.Pool(10) urls = [ 'http://www.google.com', # ... a...
阅读全文
摘要:range() 相当于直接构造一个列表,而xrange() 是返回一个迭代值。 range用法: range( 开始值,结束值,步长) 在需要大量迭代的时候,比较适合使用xrange()
阅读全文

浙公网安备 33010602011771号