摘要: 系列文章列表 Query DSL Query DSL 概要,MatchAllQuery,全文查询简述 Match Query Match Phrase Query 和 Match Phrase Prefix Query Multi Match Query Java Rest Client API E 阅读全文
posted @ 2018-11-24 18:50 ReyCG 阅读(2004) 评论(0) 推荐(1)
摘要: 今天再读庄子的《逍遥游》,其中鲲鹏之扶摇直上九万里之气势,蜩(tiao)与学鸠之渺小之对比,令人印象深刻,并对鲲鹏之志心生向往。而郭象在注《庄子》卷中却说,"苟足于其性,则虽大鹏无以自贵于小鸟,小鸟无羡于天池,而荣愿有余矣。故小大虽殊,逍遥一也。"观看自身,虽然不是什么领导,老总,但也完全不必感到为职业生涯忧虑,只要热爱程序员这个工作,享受编码的乐趣,做到 80 岁又有何妨... 阅读全文
posted @ 2018-11-24 15:32 ReyCG 阅读(20005) 评论(0) 推荐(11)
摘要: 昨天是感恩节,上幼儿园的女儿在老师的叮嘱下,晚上为我和老婆洗了脚(形式上的^_^),还给我们每人端了一杯水。看着孩子一天天的长大,懂事,感觉很开心。话说咱们程序员这么辛苦是为了什么?不就是为了老婆,孩子,热炕头,有一个温暖幸福的家庭,再捎带着用代码改变一下世界吗?想到这里,顿时觉得学习,创作博客的劲头也的更足了。哈哈,扯远了,书归正传,今天我们来聊聊 Match Query。 阅读全文
posted @ 2018-11-23 07:26 ReyCG 阅读(18634) 评论(4) 推荐(12)
摘要: [TOC] 引言 虽然之前做过 elasticsearch 的项目,但是没有对整个项目的知识点进行过系统的整理。这次趁着对 elasticsearch 版本的升级的机会(从2.2 升级到 6.3) ,又专门花时间对涉及到的知识点重新梳理了一遍。 俗话说, 好记性不如烂笔头 。为了加深对 elasti 阅读全文
posted @ 2018-11-22 11:42 ReyCG 阅读(5168) 评论(0) 推荐(4)
摘要: 子曰,温故而知新,可以为师也。学习的过程就是不断的回顾,总结,总结,再总结。首先,一起来回顾下上篇 search API中的内容。 阅读全文
posted @ 2018-11-21 09:37 ReyCG 阅读(11581) 评论(2) 推荐(9)
摘要: 一直对 elasticsearch 中的 date 类型认识比较模糊,而且在使用中又比较常见,这次决定多花些时间,彻底弄懂它,希望能对用到的同学提供帮助。 阅读全文
posted @ 2018-11-19 15:16 ReyCG 阅读(7020) 评论(0) 推荐(1)
摘要: 这次我们继续探险,来搞定 python 中的模块(module)。**兵马未动,粮草先行**,开工之前先看看基础是否补齐了。 阅读全文
posted @ 2018-11-19 06:53 ReyCG 阅读(1340) 评论(0) 推荐(2)
摘要: [TOC] 引言 你一定听说过 JSON 吧。JSON 是当前最常用的数据传输格式之一,纯文本,容易使用,方便阅读,最重要的是在多个场合都被大量被使用。 既然 JSON 这么好,那就让我们继续探险,去掌握 python 中对 JSON 的常用操作吧, okay, let's go! 基础知识 庄子曰 阅读全文
posted @ 2018-11-16 11:46 ReyCG 阅读(3522) 评论(0) 推荐(5)
摘要: [TOC] 前言 在 "上篇文章" 中,全面讲解了 python 3 中 的面向对象,今天我会继续探险,去掌握 python 3 中的文件操作, let's go 让我们出发吧! 文件 什么是文件? 一谈到文件,就会涉及到一个的重要的概念, 持久化 。什么是持久化? 持久化是将程序数据在 "持久" 阅读全文
posted @ 2018-11-14 07:01 ReyCG 阅读(965) 评论(0) 推荐(3)
摘要: [TOC] 引言 在 "上一篇" 中主要介绍了 Document API,本节中讲解 Search APIs Java High Level REST Client 支持下面的 Search API: "Search API" "Search Scroll API" "Clear Scroll AP 阅读全文
posted @ 2018-11-12 15:38 ReyCG 阅读(39848) 评论(1) 推荐(33)
摘要: [TOC] 引言 业余时间搞 python 爬虫爬取数据,完善我的 "小程序" ;工作时间还是要努力完成领导分配的任务,做我的 Java 老本行的。 这不,现在就有个需求,集团要将 elasticsearch 版本从 2.2 升级到 6.3, 由于之前做项目使用 来完成 es 数据的增删改查,现在一 阅读全文
posted @ 2018-11-09 08:26 ReyCG 阅读(24682) 评论(1) 推荐(15)
摘要: [TOC] 前言 想学爬虫还是 python 专业啊,之前一直在用 java, 现在决定尝尝鲜,使用 python及爬虫框架来完成网络数据采集。 编程语言之间都是相通的 ,比如都需要模块化,引入其他文件来实现功能,使用列表等容器来处理数据,都要使用 或 来解析和传输数据。 你会发现 通过类比的方式, 阅读全文
posted @ 2018-11-07 10:50 ReyCG 阅读(986) 评论(0) 推荐(1)
摘要: [TOC] 引言 想学爬虫还是 python 专业啊,之前一直在用 java, 现在决定尝尝鲜,使用 python及爬虫框架来完成网络数据采集。 编程语言之间都是相通的 ,比如都需要模块化,引入其他文件来实现功能,使用列表等容器来处理数据,都要使用 或 来解析和传输数据。 你会发现通过 类比 的方式 阅读全文
posted @ 2018-11-05 09:15 ReyCG 阅读(2126) 评论(2) 推荐(6)
摘要: 什么是迭代? 迭代就是重复运行一段代码语句块的能力。分为两种方式 1. 使用递归函数 2. 使用循环( 或 循环) 假设有个需求,要按照降序打印10以下(包括10),0 以上的整数,用递归和循环都可以实现,但都要重复运行一段代码语句,就是迭代。 递归函数实现 先看使用递归函数如何实现 从上面代码中我 阅读全文
posted @ 2018-11-03 19:57 ReyCG 阅读(5131) 评论(0) 推荐(0)
摘要: 1. 引言 在爬取汽车销量数据时需要爬取 html 保存在本地后再做分析,由于一些页面的 gzip 编码格式, 获取后要先解压缩,否则看到的是一片乱码。在网络上仔细搜索了下,终于在这里找到了一个优雅的方案。 2. 使用的开源库 3. 实现代码 4. 注意 1. 如果在执行时报下面错误,说明返回 ht 阅读全文
posted @ 2018-10-30 11:29 ReyCG 阅读(1245) 评论(0) 推荐(0)
摘要: 1. 引言 在上篇博客汽车销量查询小助手(小程序)开发心路历程 我分享了整个小程序的开发历程,感谢有那么多同学阅读和关注。 后面就会将小程序中的各个功能块以代码片段的方式给大家分享出来,所有的代码都在我的 github (https://github.com/ReyCG/carsales-snipp 阅读全文
posted @ 2018-10-25 08:44 ReyCG 阅读(1934) 评论(0) 推荐(3)
摘要: 偶然的机会,在旁边公园带孩子的时候,结识了邻居家孩子的爸爸。他是做汽车维修的,聊天的时候,得知我是做软件开发的。 他告诉我,他每个月都会对上个月的汽车销量进行手动的汇总, copy 到 excel 中,然后利用 excel 的绘图功能, 查看最近几个月的趋势图。反复这样做,感觉很麻烦。问我能不能使用 阅读全文
posted @ 2018-10-23 08:58 ReyCG 阅读(2999) 评论(10) 推荐(8)
摘要: 方法 方法是打包在某个名字下的小程序。在使用方法时,也就是调用方法时就会执行 这个小程序。方法将一组活动组合起来并赋予一个名字,这就是组织程序的最基本方式。 scala 中方法的基本形式为 类和对象 scala 不仅仅是面向对象语言,还是函数式语言。在函数式语言中,我们会考虑动词,即 希望执行的动作 阅读全文
posted @ 2018-06-08 15:22 ReyCG 阅读(342) 评论(0) 推荐(0)
摘要: 数据仓库系统是以面向主题,面向决策的数据存储为基础,在企业内部实现的从数据采集,处理,存储到决策支持的 端到端的解决方案。 什么是元数据? 元数据 Metadata 可以定义为描述应用系统或业务流程中数据结构或意义的数据或文档,是关于数据的数据。 在数据仓库系统中,元数据可以分成两类: 技术元数据和 阅读全文
posted @ 2018-06-01 11:50 ReyCG 阅读(454) 评论(0) 推荐(0)
摘要: 1. 引言 元数据是数据仓库中的一个重要组成部分,元数据管理系统则是构建,管理,维护和使用数据仓库系统的核心部件。 2. 基础知识 2.1 元数据的定义 元数据是指来自企业内外的所有物理数据和知识,包括物理数据的格式,技术和业务过程,数据的规则和约束以及 企业所使用数据的结构。 元数据其实就是知识, 阅读全文
posted @ 2018-06-01 10:22 ReyCG 阅读(2857) 评论(0) 推荐(0)