摘要:
初步搭建Springboot工程 1.通过SpringIO创建骨架工程 生成骨架工程的在线工具:https://start.spring.io/ 通过勾选配置可以生成demo工程。 勾选的4个依赖分别功能是: Spring Web WEB Build web, including RESTful, 阅读全文
摘要:
倒排索引常用于加快搜索速度。使用场景如下: index content 1 A,B,C 2 A,D 3 B,E 4 C,D 在上表中,寻找哪些行有D是比较麻烦的一件事,需要遍历,无法通过简单搜索完成。如果我们能把此表转换成如下形式: character indexs A 1,2 B 1,3 C 1, 阅读全文
摘要:
pySpark RDD基本用法 RDD的全称是:Resilient Distributed Dataset (弹性分布式数据集),它有几个关键的特性: RDD是只读的,表示它的不可变性。 可以并行的操作分区集合上的所有元素。 每个RDD的内部,有5个主要特性: A list of partition 阅读全文