随笔分类 -  Python

摘要:运行环境ubuntu+python3 安装pyltp 下载ltp_data_v3.4.0模型 分句 分词 添加自定义词典 自定义词典lexicon.txt import os LTP_DATA_DIR='/home/lizhenlong/pyltp/ltp_data_v3.4.0/ltp_data_ 阅读全文
posted @ 2020-02-14 21:47 娑婆迷徒 阅读(1389) 评论(0) 推荐(0)
摘要:递归 递归是基于函数,函数构成的循环,函数包含了对自身的调用,称为递归。 递归类似于循环,循环解决的问题一般都是线性的,递归不单可以解决线性问题也可以解决非线性问题。 递归优于循环,递归占用的内存比普通循环更多,因此递归的效率比普通循环要更高一些。 注意事项:递归在使用时要首先注意的是递归结束的标志 阅读全文
posted @ 2019-03-27 20:53 娑婆迷徒 阅读(206) 评论(0) 推荐(0)
摘要:八皇后问题描述:在一个8✖️8的棋盘上,任意摆放8个棋子,要求任意两个棋子不能在同一行,同一列,同一斜线上,问有多少种解法。 规则分析: 任意两个棋子不能在同一行比较好办,设置一个队列,队列里的每个元素代表一行,就能达到要求 任意两个棋子不能在同一列也比较好处理,设置的队列里每个元素的数值代表着每行 阅读全文
posted @ 2019-03-27 14:45 娑婆迷徒 阅读(2687) 评论(0) 推荐(0)
摘要:回溯算法(试探法) 在搜索尝试过程中寻找问题的解,当发现已不满足求解条件时,就“回溯”返回,尝试别的路径。回溯法是一种选优搜索法,按选优条件向前搜索,以达到目标。但当探索到某一步时,发现原先选择并不优或达不到目标,就退回一步重新选择,这种走不通就退回再走的技术为回溯法,而满足回溯条件的某个状态的点称 阅读全文
posted @ 2019-03-27 13:51 娑婆迷徒 阅读(6131) 评论(0) 推荐(0)
摘要:冒泡排序 重复地走访过要排序的元素列,依次比较两个相邻的元素,如果他们的顺序错误就把他们交换过来。走访元素的工作是重复地进行直到没有相邻元素需要交换,也就是说该元素已经排序完成。 原理: 比较相邻的元素。如果第一个比第二个大,就交换他们两个。 对每一对相邻元素做同样的工作,从开始第一对到结尾的最后一 阅读全文
posted @ 2019-03-26 15:20 娑婆迷徒 阅读(325) 评论(0) 推荐(0)
摘要:Flask框架 Flask本身想当于一个内核,其自身几乎所有功能都依靠扩展(邮件扩展Flask Mail、用户认证Flask Login),都需要用第三方的扩展来实现。其WSGI工具箱采用Werkzeug(路由模块),模板引擎则使用Jinja2。 Flask常用扩展包: Flask SQLalche 阅读全文
posted @ 2019-03-19 08:32 娑婆迷徒 阅读(182) 评论(0) 推荐(0)
摘要:多线程 多线程使用的是thread库,多进程使用的是multiprocessing库,建议不要使用多线程进行爬虫。 在Python多线程下,每个线程的执行方式: 获取GIL(Global Interpreter Lock(全局解释器锁)) 执行代码直到sleep或者是Python虚拟机将其挂起 释放 阅读全文
posted @ 2019-03-14 13:07 娑婆迷徒 阅读(5378) 评论(0) 推荐(0)
摘要: 阅读全文
posted @ 2019-03-13 08:42 娑婆迷徒 阅读(740) 评论(0) 推荐(0)
摘要:定义: User Agent是Http协议中的一部分,属于头域的组成部分,User Agent也简称UA。用较为普通的一点来说,是一种向访问网站提供你所使用的浏览器类型、操作系统及版本、CPU 类型、浏览器渲染引擎、浏览器语言、浏览器插件等信息的标识 参考 作用: 根据前面介绍的user agent 阅读全文
posted @ 2019-03-11 09:23 娑婆迷徒 阅读(611) 评论(0) 推荐(0)