摘要: 平时导出依赖一般都是 pip freeze > requirements.txt 这种方式导出的是当前python环境中所有的包,只会多不会少,有些库不是必需的也跟着导出来,冗余过重。 这个时候 pipreqs 这个库就派上用场了,它只会导出当前项目运行所依赖的包,环境中多余的库就不会导出,在迁移环 阅读全文
posted @ 2019-08-22 09:40 kakaok 阅读(6766) 评论(0) 推荐(0)
摘要: 1 GET /_cat/indices 2 3 4 GET seojoindata/_search 5 { 6 "track_total_hits": true, 7 "size": 20, 8 "query": { 9 "match_all": {} 10 }, 11 "_source": { 1 阅读全文
posted @ 2019-08-06 14:18 kakaok 阅读(8769) 评论(0) 推荐(0)
摘要: "products_name_en": { "type": "string", //字符串类型 "index": "analyzed"//分词,不分词是:not_analyzed ,设置成no,字段将不会被索引 "analyzer":"ik"//指定分词器 "boost":1.23//字段级别的分数 阅读全文
posted @ 2019-08-05 10:57 kakaok 阅读(1928) 评论(0) 推荐(0)
摘要: 开发中常用的7阶段 set_by_lua*: 流程分支处理判断变量初始化 rewrite_by_lua*: 转发、重定向、缓存等功能(例如特定请求代理到外网) access_by_lua*: IP 准入、接口权限等情况集中处理(例如配合 iptable 完成简单防火墙) content_by_lua 阅读全文
posted @ 2019-08-02 10:48 kakaok 阅读(474) 评论(0) 推荐(0)
摘要: 在OpenResty中如何引用这些变量呢? 规则很简单, 如$remote_addr, 在OpenResty里面使用就是ngx.var.remote_adddr。 阅读全文
posted @ 2019-07-25 09:55 kakaok 阅读(1699) 评论(0) 推荐(0)
摘要: 在做新闻或者其它文章采集到时候,只想采集最新发布的信息,之前采集过得就不要再采集了,从而达到增量采集到需求 scrapy-deltafetch,是一个用于解决爬虫去重问题的第三方插件。 scrapy-deltafetch通过Berkeley DB来记录爬虫每次爬取收集的request和item,当重 阅读全文
posted @ 2019-07-16 10:27 kakaok 阅读(474) 评论(0) 推荐(0)
摘要: ES数据备份找了一些方法,发现elasticdump 这个工具不错 elasticdump --input=http://192.168.0.92:9200/hs2840 --output ./hs2840_data_201905.json --type=data type:可以导出数据或者mapp 阅读全文
posted @ 2019-07-03 16:52 kakaok 阅读(1931) 评论(0) 推荐(0)
摘要: 在使用openpyxl制作excel的过程中突然发现有个错误提示 raise IllegalCharacterError openpyxl.utils.exceptions.IllegalCharacterError 平时不怎么用这个库,一时也摸不着头脑,大概猜测是有非法字符,搜索一番找到一篇文章 阅读全文
posted @ 2019-07-01 17:36 kakaok 阅读(8028) 评论(0) 推荐(0)
摘要: nginx有11个处理阶段,如下图所示: 一般我们在开发过程中常用到的阶段如下: 1.set_by_lua 做流程分支判断,判断变量初始化 2.rewrite_by_lua 转发重定向,缓存功能 3.access_by_lua ip准入,接口合法权限判断,根据iptable做防火墙的功能 4.con 阅读全文
posted @ 2019-06-28 15:19 kakaok 阅读(6353) 评论(0) 推荐(0)
摘要: 前缀匹配时,Nginx 不对 url 做编码,因此请求为 /static/20%/aa,可以被规则 ^~ /static/ /aa 匹配到(注意是空格) 多个 location 配置的情况下匹配顺序为(参考资料而来,还未实际验证,试试就知道了,不必拘泥,仅供参考): 首先精确匹配 = 其次前缀匹配  阅读全文
posted @ 2019-06-28 14:32 kakaok 阅读(1054) 评论(0) 推荐(0)