刷新
Uber Eats优食如何删除上亿张商品重复图片数据

博主头像 背景 在 Uber Eats 优食的规模上,图像处理是运营的必要条件。该平台管理着数亿张产品图片,每小时有数百万次更新流经系统。每张图像都有成本:网络带宽、处理时间、存储空间和 CDN 占用空间。随着 Uber Eats 优食从餐厅扩展到杂货、酒类和家居用品,形象渠道开始紧张。例如,单一产品(例如一 ...

数据治理之数据质量评估维度及方法

博主头像 本文分享自天翼云开发者社区《数据治理之数据质量评估维度及方法》,作者:i****n 从某种程度上来说“数据=金钱”,数据质量的好坏直接决定着数据价值高低,直接或简介影响一个企业的决策方向。数据质量管理是指在数据创建、加工、使用和迁移等过程中,通过开展数据质量定义、过程控制、监测、问题分析和整改、评估 ...

读用数据说服:如何设计、呈现和捍卫你的数据08数据呈现和反对意见

博主头像 1. 数据呈现 1.1. 数据自己会说话,但事实并非如此 1.1.1. 数据不会说话,当然更不能解释它对你的业务有何意义 1.1.2. 数据自己不会说话,必须由你让它说话 1.2. 在最好的情况下,数据导向的演示文稿能够促进交互,丰富讨论,得出优质决策 1.3. TOP-T框架,这是一种数据向幻灯片 ...

Hive自定义函数(UDF)开发和应用流程

博主头像 目录引言一、Hive自定义函数的类型二、准备环境和工具三、实际案例开发编译四、前方有坑请注意五、总结 引言 Hive作为大数据领域的核心计算引擎,凭借其强大的SQL支持和丰富的内置函数,早已成为数据开发者的效率利器。然而在实际业务场景中,面对复杂的数据处理需求时,仅仅依赖内置函数往往力不从心,当需要 ...

数据治理之数据资产健康度量

博主头像 本文分享自天翼云开发者社区《数据治理之数据资产健康度量》,作者:徐****东 随着数据量的不断增加,数据治理已经成为了企业管理里不可或缺的一环。数据治理可以帮助我们更好地进行数据的管理和使用,从而提升数据的质量和价值,同时也能够保证数据的安全和合规。 一、数据治理面临的问题 数据治理中主要面临的问题 ...

数据治理之构建数据资产目录

博主头像 本文分享自天翼云开发者社区《数据治理之构建数据资产目录》,作者:徐****东 一、引言 现如今,数据已经成为企业实现业务价值的关键。随着大数据技术的发展,企业对于数据的收集、分析和利用越来越重视。其中,数据资产化已经成为企业数据管理的重要趋势,它能帮助企业更好地发掘和利用数据中的价值,从而提升业务效 ...

读用数据说服:如何设计、呈现和捍卫你的数据04简化增效

博主头像 1. 简化增效 1.1. 就算数据图设计得很用心,但如果过于复杂,那也无法说服受众 1.2. 让你的数据图像透明的窗户一样,让受众看清底层的数据 1.3. 最大化数据墨水比,建立信息层级 2. 数据墨水 2.1. 将数据墨水比最大化 2.1.1. 高效的数据图是清晰的 2.1.1.1. 纸页上的每一 ...

读用数据说服:如何设计、呈现和捍卫你的数据02选择数据图(上)

博主头像 1. 选择数据图类型 1.1. 数据图借助了我们发现数据关系的能力 1.2. 数据图将数据分块并凸显重要的对照关系,从而将数据关系可视化 1.3. 确定底层关系是选择适当数据图类型的关键 1.3.1. 首先要确定你想要强调的底层数据关系,然后让这个关系指导你选择数据图 1.4. 数据图涵盖了大部分场 ...

读用数据说服:如何设计、呈现和捍卫你的数据01数据图

博主头像 1. 挑战 1.1. 多元认知的挑战 1.1.1. 注意力集中在第一个出现的念头上 1.1.1.1. 这个观察自身思维的过程叫作元认知 1.1.1.2. 它是学习掌握解码过程的一项重要技能 1.1.2. 编码是一个大脑的事,意图清晰,而解码是多个大脑的事 1.1.3. 为了实现高效沟通,你需要理解这 ...

读商战数据挖掘:你需要了解的数据科学与分析思维12总结

博主头像 1. 总结 1.1. 不能简明地解释一件事,说明你对它理解得不够 1.1.1. 爱因斯坦 1.2. 对数据科学实践最好的描述是分析工程和探索的结合 1.3. 商业中会存在我们需要解决的问题,而该问题很少能直接与基础的数据挖掘任务相对应 1.4. 缺少分析工程的结果是,数据挖掘的结论很可能无法用于解决 ...

<1234···6>