摘要: 概述 score在ES中有着很重要的作用,有了它才有了rank,是验证文档相关性的关键数据,score越大代表匹配到的文档相关性越大 官方解释 查询的时候可以用explain来展示score的计算过程,也可以增加format=yaml来讲json转成yaml方便阅读 类似xxx/_search?ex 阅读全文
posted @ 2017-06-07 19:54 ulysses_you 阅读(4370) 评论(0) 推荐(1) 编辑
摘要: 定义 串的存储结构 顺序存储结构 当长度超过了预分配的空间,需要重新动态分配新的空间 链式存储结构 一个节点对应一个字符会造成资源浪费,所以一个节点可以放多个字符(相当于链式的每个节点内置了一个顺序存储结构),具体存几个字符需要按实际情况,否则会影响串的处理效率 匹配算法 朴素模式匹配算法 .... 阅读全文
posted @ 2017-06-06 08:32 ulysses_you 阅读(264) 评论(0) 推荐(0) 编辑
摘要: 栈 定义 栈是一种特殊的线性表 操作 存储结构 从存储结构来看,分为顺序栈和链栈,同线性表的划分 应用 递归-菲波那切数列 后缀表达式-逆波兰表示 队列 定义 队列也是一种特殊的线性表 操作 队列是一种先进先出的线性表 FIFIO,允许插入的一端是队尾,允许删除的一端是队头 存储结构 从存储结构来看 阅读全文
posted @ 2017-06-05 08:57 ulysses_you 阅读(221) 评论(0) 推荐(0) 编辑
摘要: 线性表是什么 零个或多个数据元素的有序序列 线性存储结构 例如 java中的数组,每次都申请固定长度内存空间,并且长度不可变 而arraylist则是长度可变的数组,这是java在底层对数组进行封装,当长度超过原有长度,则会新建一个新的数组,把原有的数组复制过来。当然新的数组的长度也基于默认的扩展算 阅读全文
posted @ 2017-06-01 08:53 ulysses_you 阅读(201) 评论(0) 推荐(0) 编辑
摘要: 高斯求和 计算1+2+...+100 算法的概念就不多说了 强调一点就是,没有通用的算法,就像永远没有银弹,所有的算法都有自己的适用领域 评判算法好坏的方法 复杂度用大O表示,又分为时间复杂度和空间复杂度,一般情况没有声明是时间复杂度或者空间复杂度都默认是时间复杂度。 常见的例如O(n),描述的是针 阅读全文
posted @ 2017-05-31 08:25 ulysses_you 阅读(158) 评论(0) 推荐(0) 编辑
摘要: 内容参考《大话数据结构》 什么是数据结构 数据结构是数据元素之间存在的一种或多种关系的集合 逻辑结构 1.集合结构 集合内各数据元素平等,只是属于一个集合 集合中的数据元素都是无序的 集合中的数据元素只能出现一次{1,2,3},而不是{1,2,1} 例如java中的set,python没有value 阅读全文
posted @ 2017-05-26 18:54 ulysses_you 阅读(295) 评论(0) 推荐(0) 编辑
摘要: linux环境 centOS6.8 本文采用tar包的方式部署es 准备jdk8的环境 5.4.0的es依赖jdk8及以上版本 下载linux版的jdk jdk-8u121-linux-x64.tar.gz 启动es 不能用root用户启动(es自带的安全机制),只能用其他用户启动 这里遇到了一个坑 阅读全文
posted @ 2017-05-24 07:59 ulysses_you 阅读(483) 评论(0) 推荐(1) 编辑
摘要: 作为springBoot的开篇系列,RestTemplate只能表示我只是个意外 what RestTemplate是spring提供的用于访问rest服务的客户端(其实类似Apache的HttpClient,封装度更高一点)。默认是基于java.net包实现的,没有连接池的概念,也可以设置Apac 阅读全文
posted @ 2017-05-22 19:01 ulysses_you 阅读(1511) 评论(0) 推荐(0) 编辑
摘要: 抓取网页 python核心库 urllib2 实现对静态网页的抓取,不得不说,“人生苦短,我用python”这句话还是有道理的,要是用java来写,这估计得20行代码 (对不住了博客园了,就拿你开刀吧) 实现对动态网页的抓取,采用post请求,如果想用get方法,只需要把参数接在url后面,不需要d 阅读全文
posted @ 2017-05-18 18:53 ulysses_you 阅读(489) 评论(0) 推荐(0) 编辑
摘要: 概述 Word2vec是一款由谷歌发布开源的自然语言处理算法,其目的是把words转换成vectors,从而可以用数学的方法来分析words之间的关系。Spark其该算法进行了封装,并在mllib中实现。 整体流程是spark离线训练模型,可以是1小时1训练也可以1天1训练,根据具体业务来判断,sp 阅读全文
posted @ 2017-05-16 21:17 ulysses_you 阅读(3392) 评论(0) 推荐(0) 编辑