随笔分类 - Artificial Intelligence
GLM4.5在线版快速开发实践
摘要:背景1. GLM4.5 GLM(General Language Model,通用语言模型)是大语言模型(LLM)的一种技术路线,以支持多模态、长文本理解和复杂推理为特点。GLM4.5的代码生成能力基于对海量代码语料(如GitHub开源项目、技术文档、问答社区)的学习,支持主流编程语言(
阅读全文
CodeGeeX体验GLM4.5模型与实践
摘要:背景各模型概要性能评估Ghost Comments看那些右箭头,就是动态注释,没有真实写入文件代码BUG修复总体一般,没有智能体的特色,只有CodeGeeX问答模式。增加注释速度快,但不生成方法头部的注释解释代码文字解释后,生成了流程图实战代码扩展性修改PK提示词@workspace #codeba
阅读全文
AI营销应用与出海
摘要:反思脑图FAQ问:在复合的增长手段之下,如何确定哪一种手段更有效,是否存在数据安慰剂的问题?对于自杀式增长的现象,你们怎么看?答:这是一个有效的问题,我们现在面临的情况是,在复合增长手段中,很难判断哪一种手段更为有效,甚至可能存在数据安慰剂的现象。自杀式增长指的是投入后看到销售同步增长,但不确定这种
阅读全文
CodeBuddy IDE小试-单元测试篇
摘要:CodeBuddy IDE内置模型单元测试unittest基于Claude4.0 Sonnet生成单元测试,目录与位置没有问题。但存在一些引用的问题,我们基于Qwen3-coder模型进行修复CodeBuddy帮助我生成了中文方法名,不确定是不是我切换中文语言, following:@Testvoi
阅读全文
12 MCP Servers的介绍
摘要:12 MCP Servers的介绍 MCP(模型上下文协议)是一项开放标准,简化了AI模型(特别是大语言模型LLMs)与外部数据源、工具和服务之间的交互方式。MCP服务器充当这些AI模型与外部工具之间的桥梁。以下是一些主流的MCP服务器:文件系统MCP服务器允许大语言模型直接访问本地文件系统,进行读
阅读全文
GAIA基准测试介绍
摘要:背景 GAIA 是一个针对通用 AI 助手的基准测试,由 466 个经人类设计和注释的问题组成,这些问题有时会附带文件(如图像或电子表格),涵盖日常个人任务、科学和常识等多种助手使用场景。论文在这儿数据集https://huggingface.co/datasets/gaia-benchmark/G
阅读全文
AI应用与教育行业
摘要:背景 1. 技术驱动变革 智能教育(也称为人工智能教育)正通过人工智能技术优化教育过程,提高教育质量,成为行业新方向。 个性化教育和教育信息化已成为当前主流发展趋势,教师职业素养也在不断提升。 2. 在线教育发展 在信息科技和互联网技术的推动下,中国的在线教育行业正在经历深刻变革,这种新型教育方式已
阅读全文
TongYiLingMa插件下Qwen3-Coder
摘要:增加功能通义灵码插件已安装修复BUG解读工程简单工程,提示词来自《AI工具CodeBuddy解读开源项目源代码与框架》复杂工程以开源项目大型工程解读,强制指定Qwen3-Coder模型,以4000个+JAVA源代码文件,2次对话完成,输出如下1. 框架全景图ThingsBoard 是一个开源的物联网
阅读全文
Trae中Qwen3-Coder-Plus模型
摘要:背景 Qwen3-Coder 是由阿里巴巴云 Qwen 团队开发的一个开源大型语言模型系列,专注于代码生成与智能编程。它的核心产品是 Qwen3-Coder-480B-A35B-Instruct,一个拥有480亿参数的混合专家模型(MoE),激活参数为35亿。它支持256K令牌的原生上下文长度,并可
阅读全文
企业AI应用关注点
摘要:现象如某B端电商公司运营业务2年,日常工作都是微信,没有文档管理,知识管理。太多传统中心企业数据管理过程缺失,没有完备的信息系统,文档积累缺失。数据散落在微信群中缺少文档化知识管理缺乏,知识不可传递。落地方案 笔者目前的思考如下 在企业知识管理体系中,实现内部数据向结构化知识的转化是核心环节。这一过
阅读全文
LangChain与LlamaIndex对比
摘要:引言 检索增强生成(RAG)把信息检索与生成式模型结合,在问答、摘要及其他 NLP 任务中极具威力。实现 RAG 最常用的两大框架是 LangChain 与 LlamaIndex。二者都可处理文档摄取、切分、索引,并把各步骤串联成流畅的 RAG 工作流。但哪一个更契合你的项目?本文将围绕 RAG 的
阅读全文
Trae国际版Grok4大模型初试
摘要:背景 Grok 4是xAI公司自2023年推出首代大模型以来的第四次重要迭代,被官方宣称是“最新、最强大的旗舰模型”,马斯克更是称其为“世界上最智能AI”。该模型在GBQA(博士级问题集)、AMC 25(美国数学邀请赛)、Live Coding Benchmark(编程能力测试)、HMMT(哈佛-M
阅读全文
Claude Code下Kimi-k2模型初试
摘要:背景 Kimi-k2模型官方介绍,于2025年7月11日发布的 MoE架构 基础模型,总参数达1万亿(激活参数320亿),主要强化代码生成与通用Agent任务处理能力。 代码能力:在 SWE Bench Verified 、 Tau2 等测试中表现优于 DeepSeek V3 、 Qwen3
阅读全文
亚马逊Kiro编程小试第一轮
摘要:亚马逊Kiro编程小试第一轮背景 亚马逊Kiro是2025年7月推出的AI编程工具,其核心定位是通过“规范驱动开发”革新软件工程流程,实现从需求定义到代码部署的全流程智能化协作。Kiro可以免费使用Claude4版本Version: 0.1.0 (user setup) VSCode Version
阅读全文
一些Cursor实践经验
摘要:一些Cursor实践经验来自社区供参考,同理Trae等IDE也是适用的。其他Tips 还有一款面向 Cursor 用户的轻量级桌面工具:Prompt Picker 基于 Tauri v2 + React 打造,启动飞快、内存占用极低,让你随时「一键输入」自己最常用的 Prompt。 核心功能:悬浮置
阅读全文
AI编程之CodeBuddy的小试
摘要:背景 腾讯云 CodeBuddy 是由腾讯云开发的一款 AI 驱动的智能编程助手,基于 腾讯混元大模型 与 DeepSeek 混合模型 构建,专为开发者设计,旨在提升编码效率、优化代码质量。笔者其他相关文章《AI工具CodeBuddy解读开源项目源代码与框架》,《CodeBuddy的RAG知识库尝试
阅读全文
AWS使用提示词与RAG来减少大模型幻觉
摘要:概览 大型语言模型(LLM)是生成内容的强大工具。这些LLM的生成能力伴随着诸多优缺点。我们经常遇到的主要问题之一是生成内容的事实准确性。这些模型具有高度的幻觉倾向,有时会生成不存在或错误的内容。生成的内容往往极具说服力,看起来像是事实正确的有效信息。作为开发者,我们有责任确保系统完美运行并生成简洁
阅读全文
AI工具CodeBuddy解读开源项目源代码与框架
摘要:背景 过去笔者写过文章《通义灵码-实现开源项目分析》,现在我们在AI迭代下进一步前进。软件工程师解读项目中源代码与技术框架的痛点:不熟悉的代码库:当接手一个新项目或加入一个新的团队时,工程师可能会面对一个庞大且复杂的代码库。这可能导致理解上的困难。 缺乏文档或过时的文档:好的文档对于理解代码至关重要
阅读全文
Trae智能复杂项目重构实践
摘要:Trae智能复杂项目重构实践背景 之前在前文《基于CodeBuddy自定义Agent知识库重构实践》 IDEA下CodeBuddy+Deepseek R1 V0528尝试,与TonyYiLingMa+Qwen3-thinking模型勉强下完成单个子模块重构任务,存在过多编译不通过的情况。今天我们尝试
阅读全文
基于CodeBuddy自定义Agent知识库重构实践
摘要:知识库智能体配置提示词选择智能体我们在IDEA中CodeBuddy对话记录如下智能体OOP专家工程解读以https://thingsboard.io/ 开源项目为例Deepseek R1 0528 推理内容非常不错:我们被要求分析当前工程的OOD设计思想。根据提供的代码片段和文件结构,我们可以观察到
阅读全文
浙公网安备 33010602011771号