大模型 - 第26页 - 网站分类

"ExeCoder: Empowering Large Language Models with Executability Representation for Code Translation" 论文笔记

介绍 (1) 发表：EMNLP'25 (2) 背景高级 LLM 的正确翻译率较低，导致不同类型的执行错误。本文认为此问题的根本原因是 LLM 的预训练任务和代码翻译任务要求之间的差异。与自然语言不通，编程语言具有其他信息，这些信息表明了代码的执行状态，现有 LLM 仅学习代码的上下文语义，忽略了这 ...

微信自动化神器！用Trae+wxauto-mcp解放双手

微信自动化神器！用Trae+wxauto-mcp解放双手你是否想象过，微信消息能自动收发？多个账号能一键管理？今天要给大家介绍的wxauto-mcp，就是这样一个能让微信自动化的神奇工具！它基于wxauto库开发，相当于给微信装了个「智能小助手」，帮你处理消息、节省时间～ ✨ 注意：这个工具 ...

读大语言模型04提示词的力量

1. 面对面测试 1.1. ChatGPT已经接受了用户数十亿次的“面对面测试”，而用户对其表现的评价也各不相同 1.2. LaMDA不仅能够理解社会概念，还具备心智理论建模能力，而后者被一些人认为是意识产生的关键 1.3. 作为对话伙伴，语言模型还称不上可靠 1.3.1. 它偶尔还会出现拼写错误 ...

零基础用Trae开发VS Code插件，其实很简单

零基础用Trae开发VS Code插件，其实很简单先聊聊Trae：AI编程助手到底是什么？不知道你有没有听说过Trae这个工具？简单来说，它就是一个能帮你写代码的AI助手。想象一下：你只需要把需求说清楚，它就能自动生成完整的代码；遇到bug了，你直接问它，它还能帮你调试、修复，甚至自动写测试用 ...

15分钟速通yolo12，从环境搭建到推理图片，最后训练自己的数据集

项目演示视频： 15分钟速通yolo12，从环境搭建到推理图片，最后训练自己的数据集_哔哩哔哩_bilibili 1 环境搭建 1.1 python安装 python我们这里使用了3.10，python的下载地址：Python Release Python 3.10.11 | Python.or ...

读大语言模型03聊天机器人（下）

1. 法律 1.1. 法律研究：大语言模型能够快速处理和分析海量法律文献，包括案例、法规和规章制度等，显著提升传统法律研究的效率 1.2. 合同处理：在合同分析和起草方面，大语言模型可以帮助识别存在问题的条款，提供措辞建议，并确保内容符合法律法规要求 1.2.1. 还能生成常见法律文书的初稿，为律师 ...

基于AI互联网系统架构分析与评估

背景过去笔者写过关于系统设计原则回顾的文章，今天我们让GPT5帮助分析现有项目架构评估，选用工程项目是WeKnora 是腾讯(Tencent)企业级知识库管理系统. 在Code Buddy IDE 选择GPT5模型，Craft模式。提示词"基于以下26条互联网系统架构设计原则，对当前工程输出系统进 ...

读大语言模型02聊天机器人（上）

1. GPT 1.1. generative pretrained transformer，即“生成式预训练变换模型” 1.2. “生成式”表明大语言模型不只是像普通深度学习网络那样输出简单的标签，而是能够逐词生成文本内容 1.2.1. 这类模型也常被称为聊天机器人 1.3. “预训练”意味着模型 ...

AI项目管理-项目延期率压降至10%以内可验证成果

背景在网络上看到某公司岗位招聘要求：“精通敏捷开发，有将项目延期率压降至10%以内的可验证成果。”今天我们让AI来帮助解答下，大家看下，其实这个要求也是有上下文的。GLM 4.5DeepSeek不连网Qwen3深入研究doubao 1.6 研究报告KIMI-K2Grok V4Gemini 2.5 P ...

读大语言模型01导论

1. 导论 1.1. 自2022年ChatGPT惊艳问世以来，大语言模型领域的发展可谓日新月异 1.1.1. 震惊世界的DeepSeek，以及百度的文心大模型、阿里巴巴的Qwen大模型等 1.2. OpenAI于2022年11月面向公众发布了ChatGPT。ChatGPT是一种新型的AI（人工智能) ...

开源知识库项目WeKnora技术拆解

背景 WeKnora 是腾讯(Tencent)开发的一套企业级知识库管理系统，主要用于构建和管理基于大语言模型(LLM)的知识增强应用。从代码结构和功能实现来看，这是一个功能完备的知识管理服务平台，具有以下核心特点：核心功能多源知识导入支持从文件上传(PDF、TXT、DOCX、Markdown等文档 ...

AI促进研发管理案例

精细化需求管理1. 业务部门在需求管理中占据主导地位，严格收集并精细化管理甲方或客户的需求，确保与业务紧密相关。2. 如广告部门等业务单元能够根据客户强相关性，精细管理客户需求，为后续产品开发提供准确方向。3. 客户需求管理成熟后，转化为产品产研需求，通过不同层级如EPIC史诗级、特性、用户故事等， ...

如何辨别人工智能AI何时对你撒谎

你怎么知道别人在骗你呢？嗯，你要么知道他们说的是错的，要么你有一种感觉。是什么让你有这种感觉？你的直觉，来自你以前被骗过的时候，或者是一个迹象，比如坐立不安、低头、看向别处，或者只是行为异常。好吧，但如果说谎的人是说谎高手呢？那就难多了！他们在行为上没有任何差异，而且对他们告诉你的事情很有信心。人工 ...

langgraph开发Deep Research智能体-项目搭建

前言大家都说2025年是AI Agent元年，自然agent智能体开发也非常热门。很多公司的所谓的智能体其实是通过扣子、dify这种平台配出来的。就像是通过低代码平台配置出来的web页面一样，虽然能用，但是如果你的需求很复杂，往往平台就无法满足你的需求。作为程序员所以我们还是得需要自己动手来实现智 ...

"SWE-agent: Agent-Computer Interfaces Enable Automated Software Engineering" 论文笔记

介绍 (1) 发表：NIPS'24 (2) 背景考虑直接与 Linux 终端直接互动的 Agent 的简单设置，我们发现 LM Agent 很难在这种环境下可靠地采取行动。例如，它无法提供简单的命令来编辑一个小文件段，并且如果用户进行无效编辑，则不会提供任何反馈。这些缺陷大大阻碍了性能，激发了对代 ...

读AI繁荣01AI之屋

1. AI是驱动第四次工业革命的通用技术 1.1. AI不仅被用作科学家的实验工具，而且开始广泛渗透到日常生活中，重塑着我们的工作、教育、社交、健康乃至情感体验 1.2. 着眼于构建公平、透明且负责任的AI系统，确保技术进步惠及每一个人，尤其是那些在传统社会结构中常被忽视的群体 1.3. AI不再是 ...

GLM4.5V视觉模型小试牛刀

背景GLM4.5V 是智谱AI于2025年8月11日发布的开源视觉推理模型，基于新一代旗舰文本基座模型 GLM-4.5-Air 开发，延续了 GLM-4.1V-Thinking 技术路线。参数规模：总参数 106B，激活参数 12B。性能表现：在 41 个公开视觉多模态任务中，综合效果达到同级别开 ...

欢迎 GPT OSS —— 来自 OpenAI 的全新开放模型家族！

欢迎 GPT OSS —— 来自 OpenAI 的全新开放模型家族！ GPT OSS 是 OpenAI 推出的重量级开放模型，面向强推理、智能体任务以及多样化开发场景。该系列包含两款模型：拥有 117B 参数的 gpt‑oss‑120b 和拥有 21B 参数的 gpt‑oss‑20b。二者皆采用 ...

"ExpeRepair: Dual-Memory Enhanced LLM-based Repository-Level Program Repair" 论文笔记

介绍 (1) 发表：Arxiv 06.12 (2) 挑战主要探讨了基于 LLM 的 APR 的两个主要类别：代理和程序。尽管这两个范式都表现出希望，但它们依然表现出两个重要的局限性：忽视历史修复经验：现有方法都忽略了从同一存储库中先前解决的问题中积累的宝贵历史经验，而实际上，软件项目在其演变过程 ...

GPT5模型工程重构实践

背景OpenAI于‌北京时间2025年8月8日凌晨1时‌举行了线上发布会，正式推出GPT-5。CodeBuddy IDE，主打“产品-设计-研发部署”全流程一体化，旨在降低开发门槛，尤其适合独立开发者和非技术背景的用户。CodeBuddy整合了PRD、TRD、DRD文档生成、Figma设计稿转网页、 ...