大模型 - 第6页 - 网站分类

RAG应用性能优化入门指南

从“能用”到“好用”的RAG之旅检索增强生成（Retrieval-Augmented Generation, RAG）技术正深刻地改变着我们与信息交互的方式，它为构建知识问答系统、智能对话代理、文档处理和工作流自动化等应用提供了强大的动力。通过RAG，我们可以让强大的语言模型（LLM）理解并运用那 ...

语音识别服务funasr搭建

本文讨论语音识别功能，使用的是阿里的开源语音识别项目FunASR，含两种部署方式，社区windows版和docker容器化部署，windows社区版的可以用于本地开发使用，生产环境建议使用容器版。 1、windows社区版部署 1.1、环境安装软件需要Visual Studio 2022 c++环 ...

GPT-5.2安全报告讨论

一场复杂的辩论 OpenAI于12月11日发布的关于其最新模型GPT-5.2的系统安全报告，一经问世便在业内引发了广泛而复杂的争议。这份报告详细地呈现了新模型在各项安全与能力指标上的表现，但其数据却同时引出了两种截然相反的解读。这使得我们不得不直面一个核心问题：“我们究竟是看到了一个在安全和能力上取 ...

AI大模型电商Ecom-Bench评测解读

阿里巴巴通义实验室推出的 EcomBench，这是一个专门为评估人工智能智能体在真实电商场景中表现而设计的基准测试。研究者认为现有的 AI 测试过于偏向学术理论，因此通过人工参与的方式，从亚马逊等平台提取真实的用户需求，构建了涵盖营销策略、成本定价和法律咨询等七大领域的实战考题。测试结果显示，尽管 ...

企业级AI智能体（Agent）市场分析

企业级AI智能体（Agent）市场分析报告：从应用场景到落地挑战的深度洞察AI智能体——从辅助工具到自主生产力的范式转移一场深刻的范式转移正在重塑人工智能的版图，其核心驱动力便是AI智能体（AI Agent）。它不再是亦步亦趋的辅助工具，而是正在崛起为一种能够自主规划与执行的全新生产力，彻底改写着人 ...

经同意的语音克隆

在这篇博客文章中，我们介绍了“语音同意验证机制 (voice consent gate)”的概念，支持通过明确同意来进行语音克隆。我们还提供了一个示例 Space 应用和相关代码，帮助大家快速上手这一想法。近年来，逼真的语音生成技术已经达到了令人惊讶的水平。在某些情况下，生成出来的合成语音几 ...

阿里Z-Image图像生成模型容器部署

背景 Z-Image是阿里巴巴通义实验室开发的一款开源图像生成模型，详细介结可以看这儿《Z-Image图像生成模型发布与竞品》。Z-Image系列高性能生成模型，其中包括用于快速推理的Z-Image-Turbo和专业的图像编辑模型Z-Image-Edit。这些模型基于可扩展单流扩散转换器 (S3- ...

从日志解析到通用工程LLM

导言在当今的工程领域，我们普遍面临一个核心挑战：如何从海量的、非结构化的数据（如日志、配置文件、告警信息）中高效提取价值。这些数据是诊断系统故障、洞察系统行为的“救命稻草”，但其杂乱无章的格式对机器而言形同“天书”。大语言模型（LLM）的出现，以其前所未有的语义理解能力，为破解这一难题带来了希望。 ...

大语言模型~Ollama本地模型和java一起体验LLM

语言模型语言模型（language model,LM）通过计算单词序列的概率进行语言建模，其主要作用是基于给定的上下文，预测序列中下一个词的概率分布。随着计算能力的提升和数据量的增长，LM的发展经历了从统计语言模型（statistical language model , SLM）到神经语言模型（ ...

Table-RAG破解海量表格检索难题

破解海量表格检索难题一.概述在当今的商业与科研领域，结构化数据——尤其是那些动辄包含数十万、数百万单元格的大型表格——构成了我们决策与洞察的基石。然而，一个令人困惑的现实是，即便强大如GPT系列的大型语言模型（LLM），在面对这些海量、规整的数据时，也常常会“迷航”。它们就像一位才华横溢的语言学家 ...

单GPU运行N个专家模型：Multi-LoRA的低成本实战——从法律专家到代码专家

对于个人或小公司有部署使用本地大模型的需求，但由于业务需求直接部署一个开源的通用大模型又不满足需求。这时常见的解决方案是使用RAG方案或微调模型方案。微调是使用领域知识训练模型，使模型其具备相应的领域知识能力。微调后模型可独立生成相应的领域知识，无需再通过RAG方案问答时通过上下文提供对应的领域知识 ...

Requirements Engineering with AI for Consistency and Testing解读

REACT（Requirements Engineering with AI for Consistency and Testing）的目标：利用大型语言模型（LLMs）将模糊的自然语言需求转化为结构化形式；自动检测需求之间的一致性、冲突和歧义；自动生成形式化规范和基于需求的测试用例，提高早期验证 ...

以AI验证AI安全工程突破

以AI验证AI：务实的进化还是危险的豪赌？前言《Fighting AI with AI: Leveraging Foundation Models for Assuring AI-Enabled Safety-Critical Systems》探讨了在航空航天和自动驾驶等安全关键系统中，使用深度神 ...

2026年成都品牌主，如何选择AI优化搜索（AI GEO）合作伙伴，附压箱底选购技巧

近期，在与多位成都消费品领域的企业家交流中，一个共识逐渐清晰：当消费者开始习惯向AI助手询问“成都本地有哪些设计感强的家具品牌”或“小户型厨房用什么厨电更巴适”时，传统的营销打法正在失效。品牌突然面临一个紧迫的挑战：在AI驱动的全新决策入口中，自己仿佛成了一个“隐形者”。这一困境源于数字营销环境的 ...

UModel统一模型AIOps规模化难题

UModel统一模型AIOps规模化难题一.AIOps规模化落地面临的长期瓶颈1.1 引言尽管AIOps（智能运维）作为IT运维“自动驾驶”的愿景已提出多年，其规模化落地却始终步履维艰，受困于数据与认知层面的根本性瓶颈。当前，大模型技术的突破性进展正为解决这些长期挑战带来前所未有的历史机遇。我们将 ...

解密Prompt系列66. 视觉Token爆炸→DeepSeek-OCR光学压缩

很多人认为：图像Token的信息密度和效率远不如文本。但 DeepSeek-OCR的核心价值就是它通过一套巧妙的*串行视觉压缩架构*，实现1个视觉Token近乎无损地承载10个文本Token的惊人效率。本文我们借着DeepSeek-OCR回顾下多模态的底层技术演进。 ...

AI手机之深入浅出ADAGRPO三大核心策略

AI手机之深入浅出ADAGRPO三大核心略为何训练“手机AI助手”如此困难？随着视觉语言模型的飞速发展，能够自主操作手机图形用户界面（GUI）的通用智能体——也就是我们常说的“手机AI助手”——的前景变得日益广阔。想象一下，未来你只需用一句话，AI就能帮你完成打开App、预订酒店、设置日历提醒等一 ...

AI编程工具策略

AI编程工具的实用选型指南展示了不同工具在开发流程中的分工和定位：1. Claude Code（新项目首选）覆盖完整开发流程：规划→设计→任务拆解→实现写UI：用 Gemini 3 Pro写逻辑：用 Claude Sonnet 4.5解决Bug：用 GPT 5.1解读：即使是"首选工具"，仍会根据任 ...

白嫖最新ChatGPT和主流AI大模型，国内无限制使用

本文介绍8个免费使用ChatGPT等一众顶尖大模型的网站，因为涉及到技术限制等因素，正文中不直接给出网址 GPT网站获取及加速方法：https://pan.baidu.com/s/1F8j0gp9bU8AK4gfhMSfITQ?pwd=c25u 1.网站一用邮箱注册后即可使用，支持Deepseek ...

HiAgent与BiSheng对比Dify选型

HiAgent 架构与战略价值1. 核心定义与证据实质：HiAgent 不是一个单纯的学术概念，而是火山引擎（Volcengine）推出的企业级 AI 应用开发框架（SDK）。架构逻辑：它采用了“大一统（Unified）”的设计思路，试图在底层将 LangChain 的灵活性、MCP（Model C ...