1 2 3 4 5 ··· 9 下一页
摘要: DAS Agent是基于大模型技术,融合了阿里云10万+工单和专家经验的智能数据库运维大脑,专注于解决云数据库的日常运维及稳定性问题。通过融合AI,构建了覆盖问题发现、诊断、优化的全链路自治能力,为您提供高效、精准的数据库稳定性保障。 我们考虑一个场景,某大型集团客户有多个公司,负责不同的业务,其云 阅读全文
posted @ 2026-01-09 11:39 数据库知识分享者小北 阅读(2) 评论(0) 推荐(0)
摘要: 导读 在大模型推理迈向“智能体时代”的今天,KVCache 已从性能优化手段升级为系统级基础设施,“显存内缓存”模式在长上下文、多轮交互等场景下难以为继,而“以存代算”的多级 KVCache 架构虽突破了容量瓶颈,却引入了一个由模型结构、硬件平台、推理引擎与缓存策略等因素交织而成的高维配置空间。如何 阅读全文
posted @ 2026-01-07 15:56 数据库知识分享者小北 阅读(3) 评论(0) 推荐(0)
摘要: 在数字化转型的过程中,许多企业发现传统自建 MySQL 数据库在高可用性和弹性扩展方面的不足,导致服务稳定性和性能受到限制。面对业务增长和高并发需求,企业急需一种高性能、可靠的数据库解决方案来提升数据处理能力和系统架构的灵活性。 本方案将基于云原生数据库 PolarDB 分布式版 (PolarDB 阅读全文
posted @ 2026-01-05 17:26 数据库知识分享者小北 阅读(9) 评论(0) 推荐(0)
摘要: 导读 【重磅】阿里云 Tair KVCache 团队联合阿里巴巴智能引擎、基础设施与稳定性工程团队即将开源企业级全局 KVCache 管理服务 Tair KVCache Manager,本文详细介绍该服务的架构设计与实现细节。 随着 Agentic AI兴起,以推理引擎为中心的传统单机分层方案已无法 阅读全文
posted @ 2025-12-31 17:22 数据库知识分享者小北 阅读(16) 评论(0) 推荐(0)
摘要: 导读 接着上一节内容对KV Cache存储方案的深入解读,本文介绍了阿里云 Tair KVCache 团队与SGLang 社区在推理框架上的提效——支持混合架构模型的工程化实践。 在大模型长文本与智能体化趋势下,Transformer 面临显存与计算瓶颈,而高效的 Mamba 模型语义召回受限。混合 阅读全文
posted @ 2025-12-24 13:43 数据库知识分享者小北 阅读(18) 评论(0) 推荐(0)
摘要: 云原生数据仓库 AnalyticDB PostgreSQL 版 Supabase 是基于开源 Supabase 深度增强打造的全托管应用开发平台。平台延续原生 Supabase 的开发体验,提供数据库、用户鉴权、边缘函数等核心功能,并结合阿里云基础设置提供更高性能、更强安全性和更完善的生态支持。 一 阅读全文
posted @ 2025-12-23 13:19 数据库知识分享者小北 阅读(28) 评论(0) 推荐(0)
摘要: 导读 接着上一节内容,本文系统介绍了阿里云 Tair KVCache 团队与服务器研发存储软硬件结合团队对 3FS(高性能 KVCache 底座)开展的全方位工程化升级实践。 面向 AI 大模型推理中高吞吐、低延迟、强稳定性的核心诉求,团队从性能调优、产品化增强与云原生管理三大维度推进深度优化: 在 阅读全文
posted @ 2025-12-19 13:34 数据库知识分享者小北 阅读(28) 评论(0) 推荐(0)
摘要: AnalyticDB PostgreSQL 版 Supabase 是基于开源 Supabase 深度增强的全托管应用开发平台。它提供数据库、用户鉴权、边缘函数等核心功能,并结合阿里云基础设施,提升性能和安全性。与开源自托管方案相比,该平台具备全面的托管能力,支持按需选择计算与存储规格,原生支持支付宝 阅读全文
posted @ 2025-12-18 14:59 数据库知识分享者小北 阅读(29) 评论(0) 推荐(0)
摘要: 导读 在大型语言模型(LLM)推理中,KVCache 是提升效率的核心机制:通过缓存 Transformer 自注意力层的历史 Key-Value 对,避免重复计算,显著降低单次推理开销。然而,在“智能体式推理”(Agentic Inference)这一新兴范式下——模型需持续感知环境、进行多轮决策 阅读全文
posted @ 2025-12-15 13:23 数据库知识分享者小北 阅读(83) 评论(0) 推荐(0)
摘要: 本文介绍如何使用Dify、云原生数据仓库AnalyticDB PostgreSQL版的Supabase和LLM构建一个AI客服系统,帮助在线服装店高效处理售后咨询、订单查询和个性化回复。通过结合Dify的工作流能力、Supabase的实时数据存储与LLM的自然语言理解能力,实现快速自动化响应,显著减 阅读全文
posted @ 2025-12-09 13:26 数据库知识分享者小北 阅读(26) 评论(0) 推荐(0)
1 2 3 4 5 ··· 9 下一页