09 2018 档案

摘要:引言: flink是面向数据流处理和批处理的分布式开源计算框架。2016年阿里巴巴引入flink框架,改造为blink,将其运用到搜索及推荐的离线实时计算中,成功解决了搜索、推荐实时大数据量计算的痛点。2017年5月,集团整合了所有流计算产品,决定以blink引擎为基础,打造一款全球领先的实时计算引 阅读全文

posted @ 2018-09-30 14:30 cuiyubo 阅读(349) 评论(0) 推荐(0)

摘要:pyecharts是一款将python与echarts结合的强大的数据可视化工具,本文将为你阐述pyecharts的使用细则 前言 我们都知道python上的一款可视化工具matplotlib,而前些阵子做一个Spark项目的时候用到了百度开源的一个可视化JS工具-Echarts,可视化类型非常多, 阅读全文

posted @ 2018-09-30 14:29 cuiyubo 阅读(340) 评论(0) 推荐(0)

摘要:随着链接开放数据源(如DBpedia)的出现以及谷歌在2012年提出知识图谱的概念,全球掀起了研究知识图谱的热潮,涌现出了大量的知识图谱构建技术[1-5],并构建了各种知识图谱,这些知识图谱要么是开放的,要么是公司私有的,如Freebase[2]、维基数据(Wikidata)[3]、DBpedia[ 阅读全文

posted @ 2018-09-17 09:57 cuiyubo 阅读(480) 评论(0) 推荐(0)

摘要:全局唯一的 ID 几乎是所有系统都会遇到的刚需。这个 id 在搜索, 存储数据, 加快检索速度 等等很多方面都有着重要的意义。工业上有多种策略来获取这个全局唯一的id,针对常见的几种场景,我在这里进行简单的总结和对比。 简单分析一下需求 [1] 所谓全局唯一的 id 其实往往对应是生成唯一记录标识的 阅读全文

posted @ 2018-09-09 22:42 cuiyubo 阅读(255) 评论(0) 推荐(0)

摘要:对于知识图谱的关注可以分为两个方面:知识图谱的构建和基于知识图谱数据结构的应用。知识图谱的构建主要关注如何整合结构化、非结构化的数据,实现用统一的语义数据结构如三元组RDF形式的数据存储。基于知识图谱的应用主要关注如何从这种语义数据结构中挖掘、发现、推演出相关的隐藏知识或新知识或者实现更上层的应用如 阅读全文

posted @ 2018-09-02 11:17 cuiyubo 阅读(1003) 评论(0) 推荐(0)

导航