刷新
Agentic AI要终结数据库和SaaS?大厂掌门人公开互撕,焦虑的CEO们押上了不同的技术路线

博主头像 作者 | Tina Agent 正在成为 2025 年 AI 世界最炙手可热的关键词之一。 无论是大模型厂商、AI 初创公司,还是企业级应用团队,几乎都在讨论“多智能体协作”“自动化决策流程”以及“具备工具调用能力的 AI 系统”。 谷歌、英伟达等科技巨头纷纷布局,上个月亚马逊还成立了一个专注于 A ...

读数据科学伦理:概念、技术和警世故事03伦理数据的收集

博主头像 1. 伦理数据的收集 1.1. 隐私保护技术,如加密、模糊处理和差分隐私,这些技术着眼于保持隐私与个人数据的收集和存储之间的平衡 1.2. 有偏差的数据科学模型通常是由所收集的数据的偏差造成的 1.3. 重视伦理的数据收集实践是人体实验 1.4. 所有的数据科学项目都离不开数据 1.4.1. 就隐私 ...

读数据科学伦理:概念、技术和警世故事02FAT流程框架

博主头像 1. 概述 1.1. 任何一种框架或核查表都会很快过时(因此需要定期更新)​:数据源、技术、应用程序和伦理考量都在不断地变化 1.2. 将FAT流程框架作为通用的指导准则 2. 三个属性 2.1. 公平、责任和透明(FAT) 2.1.1. 前两个准则用于评定伦理概念,比如隐私、歧视和可解释性 2.1 ...

读数据科学伦理:概念、技术和警世故事01数据科学伦理导读

博主头像 1. 数据科学伦理的兴起 1.1. 数据科学实践包括:获取数据、​(预)处理数据、分析数据、对数据进行建模、评估结果,然后使用模型或结果学习知识、支持论点或做决策 1.2. 数据科学家 1.2.1. 被誉为21世纪最具吸引力的职业 1.2.2. 不仅要在现有数据集上调用预先定义库,还要在数据科学项目 ...

读数据自助服务实践指南:数据开放与洞察提效20成本管理服务

博主头像 1. 成本管理服务 1.1. 为了利用云中可用的无限资源,企业需要无限的预算 1.1.1. 成本管理对于确保数据平台的有限预算与业务优先级的有效配合至关重要 1.1.2. 由于有众多选择,所以成本管理就像黑盒,需要不断优化成本,以适应日常工作中变化的工作负载 1.2. 操作阶段的最后一部分是成本管理 ...

SeaTunnel二次开发进阶:企业级复杂场景下的亿万级数据处理与智能容错机制

博主头像 作者:史德昇 随着数据来源的不断复杂化及业务需求的快速演进,通用的数据集成框架在实际落地过程中往往面临诸多挑战:数据结构不规范、字段缺失、敏感信息混杂、数据语义不清等问题频繁出现。为了更好地应对这些复杂场景,某上市网络安全龙头企业基于 Apache SeaTunnel 进行了二次开发,构建了一套可扩 ...

读数据自助服务实践指南:数据开放与洞察提效18模型部署服务

博主头像 1. 模型部署服务 1.1. 编写一次性脚本来部署模型并不困难 1.2. 针对模型训练类型(在线与离线)​、模型推理类型(在线与离线)​、模型格式(PAML、PFA、ONNX等)​、终端类型(Web服务、IoT、嵌入式浏览器等)以及性能要求(由预测/秒和延迟定义)的不同组合,管理这些脚本非常困难 1 ...

从零开始学Flink:开启实时计算的魔法之旅

博主头像 本文介绍了大数据的核心特征与技术演进,并深入剖析了Apache Flink作为实时计算引擎的三大核心优势:时间管理(Watermark机制)、状态管理(算子状态与键控状态)以及容错机制(精确一次语义)。通过对比批处理与流处理架构,展示了Flink如何在电商、金融、推荐系统等实际场景中实现毫秒级的数据... ...

读数据自助服务实践指南:数据开放与洞察提效15A_B测试服务

博主头像 1. A/B测试服务 1.1. 部署多个模型并将其呈现给不同的客户集 1.2. 基于客户使用的行为数据来选出更好的模型 1.3. A/B测试(也称为桶式测试、拆分测试或受控实验)是一个从产品变化、新特性或与产品增长相关的假设等方面来评估用户满意度的标准方法,并被广泛用于制定数据驱动的决策 1.4.  ...

Kafka如何快速的入个门呢?

博主头像 Kafka是什么? Kafka是Apache基金所维护的一个中间件项目,它是一个开源的分布式事件流平台,广泛用于构建高性能的数据管道、流式分析、数据集成以及关键业务应用。 这里面有几个点需要说明一下,开源自然不用讲 分布式简单的理解为通过网络通信实现多台服务器部署,联动提供服务,保证容错和提高效率。 ...

<1···567···18>