随笔档案「2018年9月」 - cuiyubo

blink测试技术介绍

摘要：引言： flink是面向数据流处理和批处理的分布式开源计算框架。2016年阿里巴巴引入flink框架，改造为blink，将其运用到搜索及推荐的离线实时计算中，成功解决了搜索、推荐实时大数据量计算的痛点。2017年5月，集团整合了所有流计算产品，决定以blink引擎为基础，打造一款全球领先的实时计算引阅读全文

posted @ 2018-09-30 14:30 cuiyubo 阅读(359) 评论(0) 推荐(0)

Python中的可视化神器！你知道是啥吗？没错就是pyecharts！

摘要：pyecharts是一款将python与echarts结合的强大的数据可视化工具，本文将为你阐述pyecharts的使用细则前言我们都知道python上的一款可视化工具matplotlib,而前些阵子做一个Spark项目的时候用到了百度开源的一个可视化JS工具-Echarts，可视化类型非常多，阅读全文

posted @ 2018-09-30 14:29 cuiyubo 阅读(343) 评论(0) 推荐(0)

知识图谱精化研究综述

摘要：随着链接开放数据源（如DBpedia）的出现以及谷歌在2012年提出知识图谱的概念，全球掀起了研究知识图谱的热潮，涌现出了大量的知识图谱构建技术[1-5]，并构建了各种知识图谱，这些知识图谱要么是开放的，要么是公司私有的，如Freebase[2]、维基数据(Wikidata)[3]、DBpedia[ 阅读全文

posted @ 2018-09-17 09:57 cuiyubo 阅读(491) 评论(0) 推荐(0)

常见分布式全局唯一ID生成策略

摘要：全局唯一的 ID 几乎是所有系统都会遇到的刚需。这个 id 在搜索, 存储数据, 加快检索速度等等很多方面都有着重要的意义。工业上有多种策略来获取这个全局唯一的id，针对常见的几种场景，我在这里进行简单的总结和对比。简单分析一下需求 [1] 所谓全局唯一的 id 其实往往对应是生成唯一记录标识的阅读全文

posted @ 2018-09-09 22:42 cuiyubo 阅读(256) 评论(0) 推荐(0)

机器不学习：基于知识图谱推理的关系推演

摘要：对于知识图谱的关注可以分为两个方面：知识图谱的构建和基于知识图谱数据结构的应用。知识图谱的构建主要关注如何整合结构化、非结构化的数据，实现用统一的语义数据结构如三元组RDF形式的数据存储。基于知识图谱的应用主要关注如何从这种语义数据结构中挖掘、发现、推演出相关的隐藏知识或新知识或者实现更上层的应用如阅读全文

posted @ 2018-09-02 11:17 cuiyubo 阅读(1007) 评论(0) 推荐(0)

cuiyubo

09 2018 档案

导航

公告