大模型 - 第17页 - 网站分类

Trae中Qwen3-Coder-Plus模型

背景 Qwen3-Coder 是由阿里巴巴云 Qwen 团队开发的一个开源大型语言模型系列，专注于代码生成与智能编程。它的核心产品是 Qwen3-Coder-480B-A35B-Instruct，一个拥有480亿参数的混合专家模型（MoE），激活参数为35亿。它支持256K令牌的原生上下文长度，并可 ...

华为HCIE-AI笔试题解析

HCIE-AI笔试题 1.以下关于Google论文中标准transformer structure优点描述正确的有哪些选项?（多选） A.可以获取输入的全局依赖信息。 B.Transformer的Encoder和Decoder可以并行独立计算，训练效率高。 C.计算资源利用率高，特征学习能力强。 D ...

企业AI应用关注点

现象如某B端电商公司运营业务2年，日常工作都是微信，没有文档管理，知识管理。太多传统中心企业数据管理过程缺失，没有完备的信息系统，文档积累缺失。数据散落在微信群中缺少文档化知识管理缺乏，知识不可传递。落地方案笔者目前的思考如下在企业知识管理体系中，实现内部数据向结构化知识的转化是核心环节。这一过 ...

LangChain与LlamaIndex对比

引言检索增强生成（RAG）把信息检索与生成式模型结合，在问答、摘要及其他 NLP 任务中极具威力。实现 RAG 最常用的两大框架是 LangChain 与 LlamaIndex。二者都可处理文档摄取、切分、索引，并把各步骤串联成流畅的 RAG 工作流。但哪一个更契合你的项目？本文将围绕 RAG 的 ...

大模型的监督微调

1.Chat Template '1. 指令微调在预训练（LoRA微调）之后' # 预训练使大模型成为“领域专家” # 指令微调令大模型学会表达每一个大模型的指令微调都不一样；所以一定要根据官方发布的格式做指令微调 '2. Chat_Template的源代码' # Chat_Template.p ...

【7.23 直播】手把手教你零基础玩转 IoTDB 时序大模型！

想使用时序数据库 IoTDB 自研时序大模型成果，但不知从何下手？这场直播带你从零开始，1 小时搞定下载、部署到微调实战！ 7 月 23 日（周三）19:00，我们特别邀请天谋科技研发工程师、Apache IoTDB Committer 陈荣钊，带来一场干货满满的时序大模型入门分享！ ...

大模型预训练

1.分组 '1. 两种训练方法' 从零开始预训练：BV1xhYtewEum 4分30秒二次特定预训练：BV1xhYtewEum 2.创建LLM '1. 创建模型核心流程' (1)加载模型->(2)将模型放入显卡->(3)输入文本并分词-> (4)将分词放入显卡->(5)设置label->(6)模型 ...

快速使用开发者空间AI Agent打造你的私人营养师

本文分享自华为云社区《快速使用华为开发者空间AI Agent打造你的私人营养师》，作者：社区云活动助手本篇讲带你快速使用Agent部署，教你把“今天吃什么”现成MCP模板一键装进Agent，5分钟完成安装-配置-发布三连，现场就能在浏览器里跟AI营养师聊菜单。华为开发者空间的Agent到底是什么 ...

Trae国际版Grok4大模型初试

背景 Grok 4是xAI公司自2023年推出首代大模型以来的第四次重要迭代，被官方宣称是“最新、最强大的旗舰模型”，马斯克更是称其为“世界上最智能AI”。该模型在GBQA（博士级问题集）、AMC 25（美国数学邀请赛）、Live Coding Benchmark（编程能力测试）、HMMT（哈佛-M ...

搭建 Claude Code 镜像服务，打造高可控、安全稳定的 AI 编程助手

搭建 Claude Code 镜像服务，打造高可控、安全稳定的 AI 编程助手 —— 推荐项目 claude-relay-service 原创不易，欢迎点赞、收藏、关注！近期热度迅速攀升的 AI 编码助手 Claude Code（Anthropic Claude），正在成为开发者们探索生产力 ...

Claude Code下Kimi-k2模型初试

背景 Kimi-k2模型官方介绍，于2025年7月11日发布的 MoE架构基础模型，总参数达1万亿（激活参数320亿），主要强化代码生成与通用Agent任务处理能力。 ‌ ‌代码能力‌：在 SWE Bench Verified 、 Tau2 等测试中表现优于 DeepSeek V3 、 Qwen3 ...

给 DolphinScheduler 加一个 SQL Copilot 聊天助手，这个主意怎么样？

DolphinScheduler 准备引入 Copilot 聊天助手啦！借助大语言模型（如 OpenAI），帮助用户智能编写 SQL、优化代码、答疑解惑，大幅提升开发体验。 ...

HF Papers 直播｜ AI for Science 专场

AIGC热点大赛# 由 Hugging Face × OpenMMLab × ModelScope × 知乎 × 机智流等联合发起的【AI Insight Talk】系列直播活动第三场即将开始！ AI 科学家时代正加速到来，但科研智能体真的做好准备了吗？真实科研场景中，多模态智能体能否在推理、规划 ...

亚马逊Kiro编程小试第一轮

亚马逊Kiro编程小试第一轮背景亚马逊Kiro是2025年7月推出的AI编程工具，其核心定位是通过“规范驱动开发”革新软件工程流程，实现从需求定义到代码部署的全流程智能化协作。Kiro可以免费使用Claude4版本Version: 0.1.0 (user setup) VSCode Version ...

R²AIN SUITE AI赋能的一体化企业提效解决方案

为了在快速发展的时代浪潮中抢占先机，众多企业积极拥抱生成式 AI，麦肯锡数据显示，生成式人工智能的投资增长迅速，2017 - 2022 年风险投资和其他私人外部投资年均复合增长率为 74%。 ...

5分钟带你搞懂从0打造一个ChatGPT

前言欧阳上一次写文章还是4个月前，之所以断更有两个原因：换工作和业余时间ALL IN AI了。不管你是否承认，AI时代已经来了，依然埋头研究前端的那一亩三分地和源码在未来可能就是蒸汽时代被淘汰的纺织女工。今年大家多多少少都有接触到AI相关的项目了，从前端的角度来看以前是调用后端的接口，现在改成了 ...

一些Cursor实践经验

一些Cursor实践经验来自社区供参考，同理Trae等IDE也是适用的。其他Tips 还有一款面向 Cursor 用户的轻量级桌面工具：Prompt Picker 基于 Tauri v2 + React 打造，启动飞快、内存占用极低，让你随时「一键输入」自己最常用的 Prompt。核心功能：悬浮置 ...

AI编程之CodeBuddy的小试

背景腾讯云 CodeBuddy 是由腾讯云开发的一款 AI 驱动的智能编程助手，基于腾讯混元大模型与 DeepSeek 混合模型构建，专为开发者设计，旨在提升编码效率、优化代码质量。笔者其他相关文章《AI工具CodeBuddy解读开源项目源代码与框架》，《CodeBuddy的RAG知识库尝试 ...

解决Dify的Ollama插件添加模型时保存成功但模型为空的问题

最近组里安排了点调研Dify任务。我跟着基于Docker+DeepSeek+Dify ：搭建企业级本地私有化知识库超详细教程一步一步走，前面都挺顺利，但在Dify的Ollama中引入大模型这一步卡住了：按照原文，我添加了本地安装的deepseek-r1:1.5b，点击“保存”，提示“保存成功”但模型 ...

从moved、ask到智能客户端：一次彻底搞懂RedisCluster的数据路由

本文已收录在Github，关注我，紧跟本系列专栏文章，咱们下篇再续！魔都架构师 | 全网30W技术追随者大厂分布式系统/数据中台实战专家主导交易系统百万级流量调优 & 车联网平台架构 AIGC应用开发先行者 | 区块链落地实践者以技术驱动创新，我们的征途是改变世 ...