2018年9月30日

摘要: 引言: flink是面向数据流处理和批处理的分布式开源计算框架。2016年阿里巴巴引入flink框架,改造为blink,将其运用到搜索及推荐的离线实时计算中,成功解决了搜索、推荐实时大数据量计算的痛点。2017年5月,集团整合了所有流计算产品,决定以blink引擎为基础,打造一款全球领先的实时计算引 阅读全文
posted @ 2018-09-30 14:30 cuiyubo 阅读(275) 评论(0) 推荐(0) 编辑
摘要: pyecharts是一款将python与echarts结合的强大的数据可视化工具,本文将为你阐述pyecharts的使用细则 前言 我们都知道python上的一款可视化工具matplotlib,而前些阵子做一个Spark项目的时候用到了百度开源的一个可视化JS工具-Echarts,可视化类型非常多, 阅读全文
posted @ 2018-09-30 14:29 cuiyubo 阅读(291) 评论(0) 推荐(0) 编辑

2018年9月17日

摘要: 随着链接开放数据源(如DBpedia)的出现以及谷歌在2012年提出知识图谱的概念,全球掀起了研究知识图谱的热潮,涌现出了大量的知识图谱构建技术[1-5],并构建了各种知识图谱,这些知识图谱要么是开放的,要么是公司私有的,如Freebase[2]、维基数据(Wikidata)[3]、DBpedia[ 阅读全文
posted @ 2018-09-17 09:57 cuiyubo 阅读(395) 评论(0) 推荐(0) 编辑

2018年9月9日

摘要: 全局唯一的 ID 几乎是所有系统都会遇到的刚需。这个 id 在搜索, 存储数据, 加快检索速度 等等很多方面都有着重要的意义。工业上有多种策略来获取这个全局唯一的id,针对常见的几种场景,我在这里进行简单的总结和对比。 简单分析一下需求 [1] 所谓全局唯一的 id 其实往往对应是生成唯一记录标识的 阅读全文
posted @ 2018-09-09 22:42 cuiyubo 阅读(232) 评论(0) 推荐(0) 编辑

2018年9月2日

摘要: 对于知识图谱的关注可以分为两个方面:知识图谱的构建和基于知识图谱数据结构的应用。知识图谱的构建主要关注如何整合结构化、非结构化的数据,实现用统一的语义数据结构如三元组RDF形式的数据存储。基于知识图谱的应用主要关注如何从这种语义数据结构中挖掘、发现、推演出相关的隐藏知识或新知识或者实现更上层的应用如 阅读全文
posted @ 2018-09-02 11:17 cuiyubo 阅读(907) 评论(0) 推荐(0) 编辑

2018年8月27日

摘要: 一. 知识图谱和金融领域简述 什么是知识图谱? 借鉴其中一个理解: 知识图谱主要的目标是用来描述真实世界中间存在的各种实体和概念,以及它们之间的关联关系。 具体理论知识就不在此赘述,对于这个抽象的概念会有一篇文章来列举一个代表性的例子。 知识图谱起源于语义网络,最初由Google提出用与优化搜索结果 阅读全文
posted @ 2018-08-27 10:02 cuiyubo 阅读(4318) 评论(0) 推荐(0) 编辑

2018年8月19日

摘要: 第一阶段,基于User-Video图游历算法,2008年[1]。 在这个阶段,YouTube认为应该给用户推荐曾经观看过视频的同类视频,或者说拥有同一标签的视频。然而此时,YouTube的视频已是数千万量级,拥有标签的部分却非常小,所以如何有效的扩大视频标签,被其认为是推荐的核心问题。解决方案的核心 阅读全文
posted @ 2018-08-19 21:42 cuiyubo 阅读(327) 评论(0) 推荐(0) 编辑

2018年8月12日

摘要: 一、Apache Jena简介 Apache Jena(后文简称Jena),是一个开源的Java语义网框架(open source Semantic Web Framework for Java),用于构建语义网和链接数据应用。下面是Jena的架构图: 本次实践我们会用到的组件有:TDB、rule 阅读全文
posted @ 2018-08-12 21:03 cuiyubo 阅读(1064) 评论(0) 推荐(0) 编辑

2018年6月19日

摘要: 计规范是一种将移动端常用控件标准化、统一化的的文档 今天整理了一篇设计规范的文章概论,讲诉中会以ios做介绍,安卓由于开源,平台相对教多不做单一阐述,实际操作的时候,我们不管是做一代还是二次的迭代产品,均需要一个规程的文档,这样才能更好的进行协作和研发、以及为以后的工作做好基石,规范是参考,有一个大 阅读全文
posted @ 2018-06-19 11:24 cuiyubo 阅读(191) 评论(0) 推荐(0) 编辑

2018年6月11日

摘要: 这次给大家带来的是4 幅思维导图,梳理了 Python 爬虫部分核心知识点:网络基础知识,Requests,BeautifulSoup,urllib 和 Scrapy 爬虫框架。 爬虫是一个非常有趣的主题,本文正是通过爬虫完成了课题所需数据的原始积累。第一次抓到数据时,感觉世界都明亮了呢~ 当然,由 阅读全文
posted @ 2018-06-11 11:48 cuiyubo 阅读(833) 评论(1) 推荐(0) 编辑

导航