一、直播介绍 5月30日,袋鼠云一站式全自动化运维管家ChengYing(承影)正式开源,我们深知将开源不是结束,而恰恰是开始,如何让更多的小伙伴们更好的了解ChengYing、使用ChengYing、建设ChengYing,是开源项目团队的同学一直在思考的问题。 为了更好的帮助大家了解ChengY ...
原文链接:走好数据中台最后一公里,数据服务API是数据中台的标配 视频回顾:点击这里 课件获取:点击这里 一、数据服务API建设背景 在数字化转型的时代背景下,新需求的大量增长、新技术的不断迭代,“互联网化、数字化”进程的不断深入,越来越多的业务被迁移到互联网上,产生大量的业务交互和对外服务需求,对 ...
ClickHouse核心架构设计是怎么样的?ClickHouse核心架构模块分为两个部分:ClickHouse执行过程架构和ClickHouse数据存储架构,下面分别详细介绍。 ClickHouse执行过程架构 总的来说,结合目前搜集到的一些资料,可以看到目前ClickHouse核心架构由下图构成, ...
原文链接:基于开源大数据调度系统Taier的Web前端架构选型及技术实践 课件获取:关注公众号**“数栈研习社”,后台私信“Taier”**获得直播课件 视频回放:点击这里 Taier开源项目地址:github丨gitee 上两期,我们为大家分享了Taier入门及控制台的介绍,本期我们为大家分享Ta ...
**导读:**在公司内部,业务线经常面临数据有哪些、质量如何、是否可用、能产生多大价值的困惑,并且,随着数据量的增加,计算和存储资源面临瓶颈。本次将围绕数据治理重点关注的计算、存储等方面,分享数据治理的产品实践。通过分享,一方面可以了解当前业务线主要面临的待治理的数据问题;另一方面,从计算、存储等主 ...
分享嘉宾:叶聪 腾讯 技术专家 编辑整理:张智跃 内容来源:DataFun AI Talk「智能技术前沿实践分享」 出品社区:DataFun 导读: 本次分享系统介绍计算机视觉的基础知识,如何利用这些识别算法实现一个应用,同时进行部署、推广这一整套流程。主要包括以下六个部分: 1、朋友圈爆款活动背后 ...
导读: 本文主要介绍了快手的精排模型实践,包括快手的推荐系统,以及结合快手业务展开的各种模型实战和探索,全文围绕以下几大方面展开: 快手推荐系统 CTR模型——PPNet 多domain多任务学习框架 短期行为序列建模 长期行为序列建模 千亿特征,万亿参数模型 总结和展望 -- 01 快手推荐系统 ...
分享嘉宾:张政 京东 算法工程师 编辑整理:AMS 周金星 出品平台:DataFunTalk 导读: 内容生态建设是近几年互联网快速发展的关键动因,也是AI化的重点方向之一。本文主要分享在京东广告业务下内容理解体系的建设情况,从标签化、内容准入、质量美学评价等多个角度探讨内容理解能力的应用;同时整体 ...
导读: 本文主要介绍哔哩哔哩在数据湖与数据仓库一体架构下,探索查询加速以及索引增强的一些实践。主要内容包括: 什么是湖仓一体架构 哔哩哔哩目前的湖仓一体架构 湖仓一体架构下,数据的排序组织优化 湖仓一体架构下,索引增强与优化的实践探索 -- 01 什么是湖仓一体 当我们讲湖仓一体时,涉及到数据湖和数 ...
原文链接:实时开发平台建设实践,深入释放实时数据价值 视频回顾:点击这里 课件获取:点击这里 一、实时数仓建设背景 随着整体行业的数字化转型不断深入以及技术能力的不断提高,传统的 T+1 式(隔日)的离线大数据模式越来越无法满足新兴业务的发展需求,开展实时化的大数据业务,是企业深入挖掘数据价值的一条 ...
一、课程介绍 数据服务API作为数据统一服务平台建设的最上层,能够将数据仓库数据以服务化、接口化的方式提供给数据使用方,屏蔽底层数据存储、计算的诸多细节,简化和加强数据的使用。 随着企业“互联网化、数字化”进程的不断深入,越来越多的业务被迁移到互联网上,产生大量的业务交互和对外服务需求,对API接口 ...
导读: 首先简单介绍一下网易杭州研究院情况简介,如下图所示: 我们公司主要从事平台技术开发和建设方面,工作的重点方向主要在解决用户在数据治理中的各种问题,让用户能更高效地管理自己的数据,进而产生更大的价值,比如如何整合现有功能流程,节省用户使用成本;增加新平台不断调研,丰富平台功能;新平台功能、性能 ...
导读: 作为一种基础的数据结构,图数据的应用场景无处不在,如社交、风控、搜广推、生物信息学中的蛋白质分析等。如何高效地对海量的图数据进行存储、查询、计算及分析,是当前业界热门的方向。本文将介绍字节跳动自研的图数据库ByteGraph及其在字节内部的应用和挑战。 本文将围绕以下五点展开: 了解图数据库 ...
**导读:**本文是OPPO商业数据研发负责人&技术专家邱盛昌老师带来的“OPPO商业化数据体系建设实践”的分享。整体内容围绕着下图中垂直划分的六个部分展开,分别为:数据平台、数据接入、数据开发、数据治理、数据应用和数据分析,这个图也概括了典型的数据体系的所有内容。 -- 01 数据平台 数据平台由 ...
第一步:下载数据库 通过shell工具,采用xftp功能 第二步:解压数据包 mkdir mysql (在解压之前创建文件夹) tar -xvf mysql-8.0.28-1.el8.x86_64.rpm-bundle.tar -C mysql 可以将解压的文件放入到mysql文件夹中 第三步:安装 ...
1.下载安装包 1.1 下载elasticsearch 7.13.3 curl -L -O https://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-7.13.3-linux-x86_64.tar.gz 1.2 解压文件 t ...
分享嘉宾:罗景 58同城 高级架构师 编辑整理:洪鹏飞 内容来源:DataFun AI Talk《连接效率优化实践》 出品社区:DataFun **导读:**本次分享由以下几个部分构成—— 58的业务背景 综合排序框架 效率优化框架 基础数据流程(数据) 策略优化路径(算法) 效率优化平台(工程) ...
导读: 大家好,今天主要分享数据分析平台的平台演进以及我们在上面沉淀的一些数据分析方法是如何应用的。 具体分以下四部分: Part1:主要介绍下我所在的部门,数据平台部主要是做什么的,大概涉及到哪些业务,在整个数据流程当中数据平台部负责哪些东西; Part2:既然我们讲数据分析平台,那么数据分析是什 ...
乱序问题 在业务编写 FlinkSQL 时, 非常常见的就是乱序相关问题, 在出现问题时,非常难以排查,且无法稳定复现,这样无论是业务方,还是平台方,都处于一种非常尴尬的地步。 在实时 join 中, 如果是 Regular Join, 则使用的是 Hash Join 方式, 左表和右表根据 Joi ...
导读: 验证码作为网络安全的第一道屏障,其重要程度不言而喻。当前,卷积神经网络的高速发展使得许多验证码的安全性大大降低,一些新型验证码甚至选择牺牲可用性从而保证安全性。针对对抗样本技术的研究,给验证码领域带来了新的契机,并已应用于验证码反识别当中,为这场旷日持久攻防对抗注入了新的活力。 分享内容包括 ...