刷新
走好数据中台最后一公里,为什么说数据服务API是数据中台的标配?

博主头像 原文链接:走好数据中台最后一公里,数据服务API是数据中台的标配 视频回顾:点击这里 课件获取:点击这里 一、数据服务API建设背景 在数字化转型的时代背景下,新需求的大量增长、新技术的不断迭代,“互联网化、数字化”进程的不断深入,越来越多的业务被迁移到互联网上,产生大量的业务交互和对外服务需求,对 ...

云娜:从计算、存储角度,谈网易数据治理工具产品实践

博主头像 **导读:**在公司内部,业务线经常面临数据有哪些、质量如何、是否可用、能产生多大价值的困惑,并且,随着数据量的增加,计算和存储资源面临瓶颈。本次将围绕数据治理重点关注的计算、存储等方面,分享数据治理的产品实践。通过分享,一方面可以了解当前业务线主要面临的待治理的数据问题;另一方面,从计算、存储等主 ...

腾讯叶聪:朋友圈爆款背后的计算机视觉技术与应用

博主头像 分享嘉宾:叶聪 腾讯 技术专家 编辑整理:张智跃 内容来源:DataFun AI Talk「智能技术前沿实践分享」 出品社区:DataFun 导读: 本次分享系统介绍计算机视觉的基础知识,如何利用这些识别算法实现一个应用,同时进行部署、推广这一整套流程。主要包括以下六个部分: 1、朋友圈爆款活动背后 ...

牛亚男:基于多Domain多任务学习框架和Transformer,搭建快精排模型

博主头像 导读: 本文主要介绍了快手的精排模型实践,包括快手的推荐系统,以及结合快手业务展开的各种模型实战和探索,全文围绕以下几大方面展开: 快手推荐系统 CTR模型——PPNet 多domain多任务学习框架 短期行为序列建模 长期行为序列建模 千亿特征,万亿参数模型 总结和展望 -- 01 快手推荐系统 ...

京东张政:内容理解在广告场景下的实践和探索

博主头像 分享嘉宾:张政 京东 算法工程师 编辑整理:AMS 周金星 出品平台:DataFunTalk 导读: 内容生态建设是近几年互联网快速发展的关键动因,也是AI化的重点方向之一。本文主要分享在京东广告业务下内容理解体系的建设情况,从标签化、内容准入、质量美学评价等多个角度探讨内容理解能力的应用;同时整体 ...

李呈祥:bilibili在湖仓一体查询加速上的实践与探索

博主头像 导读: 本文主要介绍哔哩哔哩在数据湖与数据仓库一体架构下,探索查询加速以及索引增强的一些实践。主要内容包括: 什么是湖仓一体架构 哔哩哔哩目前的湖仓一体架构 湖仓一体架构下,数据的排序组织优化 湖仓一体架构下,索引增强与优化的实践探索 -- 01 什么是湖仓一体 当我们讲湖仓一体时,涉及到数据湖和数 ...

实时开发平台建设实践,深入释放实时数据价值丨04期直播回顾

博主头像 原文链接:实时开发平台建设实践,深入释放实时数据价值 视频回顾:点击这里 课件获取:点击这里 一、实时数仓建设背景 随着整体行业的数字化转型不断深入以及技术能力的不断提高,传统的 T+1 式(隔日)的离线大数据模式越来越无法满足新兴业务的发展需求,开展实时化的大数据业务,是企业深入挖掘数据价值的一条 ...

走好数据中台最后一公里,为什么说数据服务API是数据中台的标配?

博主头像 一、课程介绍 数据服务API作为数据统一服务平台建设的最上层,能够将数据仓库数据以服务化、接口化的方式提供给数据使用方,屏蔽底层数据存储、计算的诸多细节,简化和加强数据的使用。 随着企业“互联网化、数字化”进程的不断深入,越来越多的业务被迁移到互联网上,产生大量的业务交互和对外服务需求,对API接口 ...

蒋鸿翔:网易数据基础平台建设

博主头像 导读: 首先简单介绍一下网易杭州研究院情况简介,如下图所示: 我们公司主要从事平台技术开发和建设方面,工作的重点方向主要在解决用户在数据治理中的各种问题,让用户能更高效地管理自己的数据,进而产生更大的价值,比如如何整合现有功能流程,节省用户使用成本;增加新平台不断调研,丰富平台功能;新平台功能、性能 ...

陈宏智:字节跳动自研万亿级图数据库ByteGraph及其应用与挑战

博主头像 导读: 作为一种基础的数据结构,图数据的应用场景无处不在,如社交、风控、搜广推、生物信息学中的蛋白质分析等。如何高效地对海量的图数据进行存储、查询、计算及分析,是当前业界热门的方向。本文将介绍字节跳动自研的图数据库ByteGraph及其在字节内部的应用和挑战。 本文将围绕以下五点展开: 了解图数据库 ...

邱盛昌:OPPO商业化数据体系建设实战

博主头像 **导读:**本文是OPPO商业数据研发负责人&技术专家邱盛昌老师带来的“OPPO商业化数据体系建设实践”的分享。整体内容围绕着下图中垂直划分的六个部分展开,分别为:数据平台、数据接入、数据开发、数据治理、数据应用和数据分析,这个图也概括了典型的数据体系的所有内容。 -- 01 数据平台 数据平台由 ...

每日一练 数据库linux安装

博主头像 第一步:下载数据库 通过shell工具,采用xftp功能 第二步:解压数据包 mkdir mysql (在解压之前创建文件夹) tar -xvf mysql-8.0.28-1.el8.x86_64.rpm-bundle.tar -C mysql 可以将解压的文件放入到mysql文件夹中 第三步:安装 ...

罗景:连接效率优化实践

博主头像 分享嘉宾:罗景 58同城 高级架构师 编辑整理:洪鹏飞 内容来源:DataFun AI Talk《连接效率优化实践》 出品社区:DataFun **导读:**本次分享由以下几个部分构成—— 58的业务背景 综合排序框架 效率优化框架 基础数据流程(数据) 策略优化路径(算法) 效率优化平台(工程) ...

蚂蚁金服杨军:蚂蚁数据分析平台的演进及数据分析方法的应用

博主头像 导读: 大家好,今天主要分享数据分析平台的平台演进以及我们在上面沉淀的一些数据分析方法是如何应用的。 具体分以下四部分: Part1:主要介绍下我所在的部门,数据平台部主要是做什么的,大概涉及到哪些业务,在整个数据流程当中数据平台部负责哪些东西; Part2:既然我们讲数据分析平台,那么数据分析是什 ...

FlinkSQL 之乱序问题

博主头像 乱序问题 在业务编写 FlinkSQL 时, 非常常见的就是乱序相关问题, 在出现问题时,非常难以排查,且无法稳定复现,这样无论是业务方,还是平台方,都处于一种非常尴尬的地步。 在实时 join 中, 如果是 Regular Join, 则使用的是 Hash Join 方式, 左表和右表根据 Joi ...

苏涛:对抗样本技术在互联网安全领域的应用

博主头像 导读: 验证码作为网络安全的第一道屏障,其重要程度不言而喻。当前,卷积神经网络的高速发展使得许多验证码的安全性大大降低,一些新型验证码甚至选择牺牲可用性从而保证安全性。针对对抗样本技术的研究,给验证码领域带来了新的契机,并已应用于验证码反识别当中,为这场旷日持久攻防对抗注入了新的活力。 分享内容包括 ...

123···14>