该文被密码保护。 阅读全文
posted @ 2018-04-13 22:50 哀乐之巅写年华 阅读(2) 评论(0) 推荐(0) 编辑
该文被密码保护。 阅读全文
posted @ 2018-04-13 22:43 哀乐之巅写年华 阅读(2) 评论(0) 推荐(0) 编辑
摘要: 今天在逛stackoverflow的时候,发现了contextlib这个模块的的作用!而且今天成功将这个模块应用到了项目中,简直爽的飞起!特此整理一篇博客,分享给大家! 一.引言 我们在操作文件时最常用的就是使用with上下文管理器,这样会让代码的可读性更强而且错误更少,例如: 按照上述这样写的好处 阅读全文
posted @ 2018-04-13 13:35 哀乐之巅写年华 阅读(14858) 评论(1) 推荐(9) 编辑
摘要: http://www.cnblogs.com/wupeiqi/articles/8184686.html 阅读全文
posted @ 2018-04-13 10:50 哀乐之巅写年华 阅读(97) 评论(0) 推荐(0) 编辑
该文被密码保护。 阅读全文
posted @ 2018-04-13 07:37 哀乐之巅写年华 阅读(2) 评论(0) 推荐(0) 编辑
摘要: 笔者在实际生产环境中经常遇到一些大文件的检索,例如一些书籍内容,PDF文件等。今天这篇博客主要来探讨下如何提升ES在检索大文件的一些性能,经验有限,算是一个小小的总结吧! 1、大文件是多大? ES建立索引完成全文检索的前提是将待检索的信息导入Elaticsearch。 项目中,有时候需要将一些扫描件 阅读全文
posted @ 2018-04-13 07:34 哀乐之巅写年华 阅读(1125) 评论(0) 推荐(0) 编辑
摘要: 1、前言 Elasticsearch有没有类似mysql的distinct的去重功能呢? 1)如何去重计数? 类似mysql: select distinct(count(1)) from my_table; 2)如何获取去重结果。 类似mysql:SELECT DISTINCT name,age 阅读全文
posted @ 2018-04-13 07:31 哀乐之巅写年华 阅读(10555) 评论(0) 推荐(0) 编辑
摘要: 0、引言 在关系型数据库如Mysql中,设计库表需要注意的是: 1)需要几个表; 2)每个表有哪些字段; 3)表的主键及外键的设定——便于有效关联。 表的设计遵守范式约束,考虑表的可扩展性,避免开发后期对表做大的改动。 Mysql或者Oracle中,修改数据类型相对比较简单,通过命令行或者navic 阅读全文
posted @ 2018-04-13 07:30 哀乐之巅写年华 阅读(1922) 评论(0) 推荐(0) 编辑
该文被密码保护。 阅读全文
posted @ 2018-04-13 07:27 哀乐之巅写年华 阅读(3) 评论(0) 推荐(0) 编辑
摘要: 本篇博客是对前期工作中遇到ES坑的一些小结,顺手记录下,方便日后查阅。 0、前言 为了讲解不同类型ES检索,我们将要对包含以下类型的文档集合进行检索: 首先,让我们借助 bulk API批量创建新的索引并提交数据。 1、基本匹配检索( Basic Match Query) 1.1 全文检索 有两种方 阅读全文
posted @ 2018-04-13 07:20 哀乐之巅写年华 阅读(563) 评论(0) 推荐(0) 编辑
摘要: 1、问题抛出 某个词组在Elasitcsearch中的某个document中存在,就一定通过某种匹配方式把它搜出来。 举例: 输入关键词:道路,能否搜索到这个document呢? 实际应用中可能需要: 1)检索关键词”理解”、”解放”、”道路”、“理解放大”,都能搜出这篇文档。 2)单个的字拆分“治 阅读全文
posted @ 2018-04-13 07:19 哀乐之巅写年华 阅读(2896) 评论(2) 推荐(0) 编辑
摘要: 前言 Elasticsearch中当我们设置Mapping(分词器、字段类型)完毕后,就可以按照设定的方式导入数据。 有了数据后,我们就需要对数据进行检索操作。根据实际开发需要,往往我们需要支持包含但不限于以下类型的检索: 1)精确匹配,类似mysql中的 “=”操作; 2)模糊匹配,类似mysql 阅读全文
posted @ 2018-04-13 07:16 哀乐之巅写年华 阅读(1616) 评论(0) 推荐(0) 编辑
摘要: Elasticsearch增、删、改、查操作深入详解 https://blog.csdn.net/laoyang360/article/details/51931981 阅读全文
posted @ 2018-04-13 07:15 哀乐之巅写年华 阅读(72) 评论(0) 推荐(0) 编辑
摘要: https://blog.csdn.net/laoyang360/article/details/77412668 阅读全文
posted @ 2018-04-13 07:14 哀乐之巅写年华 阅读(383) 评论(0) 推荐(0) 编辑
摘要: 众所周知,在设计爬虫时,最麻烦的一步就是对网页元素进行分析,目前流行的网页元素获取的工具有BeautifulSoup,lxml等,而据我使用的体验而言,Scrapy的元素选择器Xpath(结合正则表达式)是其中较为出色的一种,功能相对较全、使用较为方便,正因为它的丰富性,有时很多功能会忘记,所以在这 阅读全文
posted @ 2018-04-13 07:08 哀乐之巅写年华 阅读(1271) 评论(0) 推荐(0) 编辑
该文被密码保护。 阅读全文
posted @ 2018-04-13 07:06 哀乐之巅写年华 阅读(0) 评论(0) 推荐(0) 编辑
摘要: 引言 本文主要讲解Mongodb的类型转换。包括:string转double, string转int, string转Date。 0. 出现类型不一致的原因 ES导入数据到Mongo后,会出现类型统一改为String的问题。 传统关系型数据库,在设计表处,右键就可以完成修改表类型。 但是非关系型数据 阅读全文
posted @ 2018-04-13 07:04 哀乐之巅写年华 阅读(8147) 评论(0) 推荐(0) 编辑