人工智能- - TTGF

不懂 Attention 不算懂 AI？十大奠基论文（一）：一文读懂《Attention Is All You Need》

摘要：摘要《Attention Is All You Need》论文开创性地提出Transformer架构，彻底改变了自然语言处理领域的技术路径。该论文解决了传统RNN/CNN模型的三大痛点：通过自注意力机制实现全局语义捕捉，摆脱了序列处理的低效性；多头注意力设计支持并行计算，大幅提升训练效率；缩放点积注意力有效解决长距离依赖问题。Transformer的核心创新包括：1）完全基于注意力机制取代循环结构；2）编码器-解码器堆叠架构；3）残差连接和层归一化优化训练稳定性。这一架构为GPT、BERT等大模型奠定了基阅读全文

posted @ 2025-11-14 16:19 TTGF 阅读(1147) 评论(0) 推荐(1)

AI 十大论文精讲（二）：GPT-3 论文全景解析——大模型 + 提示词如何解锁 “举一反三” 能力？

摘要：摘要 2020年发表的《Language Models are Few-Shot Learners》(GPT-3论文)开创了AI新时代。该论文突破性地证明：当Transformer模型参数规模扩大到1750亿时，仅通过文本交互即可实现任务无关的少样本学习。GPT-3采用"预训练+提示词"的新范式，无需微调就能在翻译、问答等40+任务上展现强大性能。论文系统验证了模型在语言建模、闭卷问答等9类任务中的表现，其中在LAMBADA长文本任务上准确率达86.4%，较此前最优提升18.4%。这一研阅读全文

posted @ 2025-11-17 14:42 TTGF 阅读(559) 评论(0) 推荐(1)

AI 十大论文精讲（四）：0.01% 参数实现全量大模型微调效果？LoRA 的低秩适配之谜

摘要：摘要：论文《LoRA: Low-Rank Adaptation of Large Language Models》提出了一种高效的大模型微调方法，通过冻结预训练权重并插入可训练的低秩矩阵（$\Delta W = B \cdot A$），显著降低参数规模（仅为原模型的0.01%-0.2%）。实验表明，LoRA在GLUE和生成任务上性能媲美甚至超越全量微调，同时实现无推理延迟、显存占用降低2/3等优势。该技术解决了传统微调资源消耗大的问题，成为大模型适配的主流方案，兼容多种Transformer架构，推动了大阅读全文

posted @ 2025-11-17 14:43 TTGF 阅读(169) 评论(0) 推荐(0)

AI 十大论文精讲（三）：RLHF 范式奠基 ——InstructGPT 如何让大模型 “听懂人话”

摘要：本文解读OpenAI关键论文《Training Language Models to Follow Instructions with Human Feedback》，该研究提出了人类反馈强化学习(RLHF)框架，解决大模型与人类意图对齐的问题。论文通过三步法：有监督微调、奖励模型训练和强化学习优化，使1.3B的InstructGPT在人类评估中胜过175B的GPT-3，输出偏好率达85%。模型在真实性、安全性和指令遵循方面显著提升，幻觉率从41%降至21%，毒性输出减少25%。阅读全文

posted @ 2025-11-18 14:03 TTGF 阅读(432) 评论(0) 推荐(0)

AI 十大论文精讲（五）：RAG——让大模型 “告别幻觉、实时更新” 的检索增强生成秘籍

摘要：摘要：《检索增强生成(RAG)在知识密集型NLP任务中的应用》这篇论文提出了一种创新方法，通过结合检索与生成技术，解决了传统语言模型在知识密集型任务中的四大痛点：知识更新成本高、缺乏可解释性、容易产生幻觉以及知识存储效率低。RAG框架将预训练检索器（基于DPR）与生成器（基于BART）结合，并利用外部知识库（如维基百科），实现了端到端的“先检索后生成”流程。论文提出的两种变体——RAG-Sequence（固定文档生成）和RAG-Token（动态切换文档）——分别适用于不同任务场景。实验证明，RAG在开放域阅读全文

posted @ 2025-11-18 14:04 TTGF 阅读(411) 评论(0) 推荐(0)

AI 十大论文精讲（六）：拆解 LLM 智能体的 “通用密码”

摘要：复旦NLP团队2023年发表的综述《The Rise and Potential of Large Language Model Based Agents》系统构建了LLM智能体的通用框架，提出以"大脑（LLM决策）-感知（多模态理解）-行动（工具调用）"为核心的技术范式，突破传统智能体的任务局限性。文章涵盖单智能体、多智能体协作、人机交互及智能体社群四大应用场景，并指出工具SKMA体系、安全护栏、结果检查三大落地关键。通过效用、社交性、价值观、进化能力四维评估体系，以及AGI 阅读全文

posted @ 2025-11-24 17:09 TTGF 阅读(956) 评论(0) 推荐(0)

AI 十大论文精讲（七）：Switch Routing 如何破解 MoE 的路由、通信与稳定性三大痛点

摘要：《Switch Transformers：用简单高效的稀疏化实现万亿参数模型》论文解读本文深入解析了Google提出的Switch Transformers架构，该论文通过创新的稀疏化设计解决传统MoE模型的路由复杂性和训练不稳定性问题。核心创新在于简化路由机制（单专家选择）、优化负载均衡策略（辅助损失函数+专家容量设计）和开发三重并行架构（数据+模型+专家并行）。实验表明，稀疏模型在相同计算预算下，预训练速度提升4-7倍，下游任务性能显著优于密集模型，如1.6万亿参数的Switch-C在TriviaQA 阅读全文

posted @ 2025-11-24 17:09 TTGF 阅读(190) 评论(0) 推荐(0)

人工智能：用Gemini3一分钟生成手势控制3D粒子交互系统

摘要：@目录前言一、Gemini3 Build界面准备二、精准提示词设计（核心步骤）提示词设计逻辑解析：三、效果演示（生成后功能实测）1. 手势控制粒子缩放与扩散2. 多模型切换功能3. 颜色自定义功能4. 简洁现代的界面与全屏控制预览与导出方式：四、扩展方向：总结前言 Gemini3横空出世，网上对其阅读全文

posted @ 2025-11-28 19:56 TTGF 阅读(5017) 评论(0) 推荐(2)

人工智能：用Gemini 3一键生成3D粒子电子手部映射应用

摘要：@目录前言核心提示词（直接复制使用）效果演示（Gemini 3生成后实际表现）1. 权限处理效果2. 摄像头画面与手部标注3. 3D粒子手跟随效果4. 淡出与再生效果总结前言 Gemini3横空出世，网上对其的评价颇为一致，都认为其是近期以来的最佳大模型，并且很多博主通过Gemini3很快的做出了阅读全文

posted @ 2025-11-29 21:23 TTGF 阅读(2183) 评论(0) 推荐(1)

人工智能：一分钟将Gemini生成应用部署到本地计算机的保姆级教程

摘要：@目录引言准备工作：环境搭建步骤一：获取应用代码步骤二：安装项目依赖步骤三：启动开发服务器步骤四：授权与使用项目结构解析常见问题与解决方案总结引言前几篇博客中我们介绍了用gemini3搭建了几个非常有意思的app，但是只在网页上运行肯定是满足不了我们的需求的，这篇博客讲教大家如何把app部署到自阅读全文

posted @ 2025-12-03 13:17 TTGF 阅读(5339) 评论(0) 推荐(1)

机器视觉：Vision Transformer——打破CNN垄断的视觉革命先锋

摘要：引言在计算机视觉（CV）领域的漫长发展中，卷积神经网络（CNN）凭借其固有的平移等变性和局部归纳偏置，长期占据绝对主导地位。从LeNet到ResNet，再到EfficientNet，CNN的网络结构迭代不断推动着视觉任务性能的突破。然而，2020年一款全新模型的出现，彻底打破了这一格局——它将自然阅读全文

posted @ 2025-12-03 13:18 TTGF 阅读(757) 评论(0) 推荐(0)

人工智能：用 Gemini3 一键生成视觉炸裂的粒子躲避游戏！流体粒子 + 渐变流光全实现

摘要：@目录前言一、Gemini3快速上手：从输入到生成游戏的核心步骤1. 访问与登录Gemini3并进入Build界面二、创造并精准输入提示词（核心）三、生成代码并调试运行四、效果演示：沉浸式粒子躲避体验1. 开始界面：随机变换颜色的迷幻霓虹初始界面2. 视觉表现：动态流体背景+彩虹轨迹2. 核心玩阅读全文

posted @ 2025-12-06 19:56 TTGF 阅读(1817) 评论(0) 推荐(2)

解决Gemini无法进入显示 “Google Al Studio 和 Gemini AP| 的可用区域” 的问题

摘要：随着AI技术的普及，Google AI Studio中的Gemini模型成为不少开发者和创作者的常用工具。但很多用户在访问时会遇到一个棘手问题——无法成功进入平台，页面仅显示“Google AI Studio 和 Gemini API 的可用区域”列表，导致无法正常使用服务。这种情况并非单一原因导致，我结合自身排查经历和大量用户反馈，整理出三种核心场景及对应的全方位解决方法，帮你快速突破访问障碍。阅读全文

posted @ 2026-01-01 15:59 TTGF 阅读(13190) 评论(1) 推荐(0)

PDF 转 Markdown 神器：MinerU 2.5 (1.2B) 部署全攻略

摘要：摘要：MinerU 2.5-2509-1.2B 是由 OpenDataLab 推出的开源 PDF 提取工具，支持精准的布局分析、公式识别和表格提取。本文详细介绍了在 Linux 系统下的部署流程：首先确保满足硬件要求（8核CPU、8GB以上显存GPU）；然后通过 Conda 创建 Python 3.10 环境并安装 magic-pdf 核心包；接着从 ModelScope 下载预训练模型权重；配置关键路径后，即可通过命令行或 Web UI 进行 PDF 转换。文章还提供了常见问题的解决方案，如显存溢出处理等阅读全文

posted @ 2026-01-11 15:16 TTGF 阅读(5066) 评论(0) 推荐(0)

GLM-4V-9B 视觉多模态模型本地部署教程【保姆级教程】

摘要：本文详细介绍了如何在Linux服务器上本地部署智谱AI开源的GLM-4V-9B多模态视觉模型。主要内容包括：环境准备（Ubuntu系统、24GB显存等）、模型下载（推荐使用ModelScope加速）、核心部署代码实现图文对话功能，并提供了显存优化方案（4-bit量化）和高并发推理方案（vLLM部署）。文章还包含常见问题排查指南，帮助用户快速解决部署过程中的典型错误。通过本地部署该模型，可有效保护数据隐私并降低长期使用成本，适用于智能办公、医疗影像等多个场景。阅读全文

posted @ 2026-01-11 15:19 TTGF 阅读(1265) 评论(0) 推荐(0)

【实战教程】Flux.1-dev 360° 全景驾驶舱：从零到一的“零坑”部署指南

摘要：本文介绍了如何在单卡24G显存环境下运行Flux.1-dev文生图大模型。首先需完成Hugging Face授权并获取Token，然后通过ModelScope镜像站快速下载35GB模型文件。关键步骤包括：1）安装必要依赖库；2）使用顺序CPU卸载技术（enable_sequential_cpu_offload）解决显存不足问题；3）编写优化后的推理脚本。文中提供了完整的代码示例和常见错误解决方案，特别适合国内用户在有限显存条件下运行这一开源最强文生图模型。阅读全文

posted @ 2026-01-12 16:55 TTGF 阅读(966) 评论(0) 推荐(0)

【零基础教程】从零部署 NewBie-image-Exp0.1：避开所有源码坑点

摘要：本文介绍了NewBie-image-Exp0.1动漫图像生成模型的部署教程。该模型基于Next-DiT架构，具有3.5B参数，支持XML结构化提示词。文章详细说明了硬件要求（16GB显存、Linux/Windows系统、Python 3.10+等环境）和依赖安装方法，特别针对网络受限环境提供了本地安装技巧。重点解决了源码中的"浮点数索引"、"维度不匹配"等核心Bug，并提供了自动修复脚本。最后给出了手动组装组件的推理脚本实现方案，帮助用户稳定运行模型生成图像。阅读全文

posted @ 2026-01-12 16:56 TTGF 阅读(276) 评论(0) 推荐(0)

零门槛部署本地 AI 助手：Clawdbot/Meltbot 部署深度保姆级教程

摘要：Clawdbot是一个多功能智能体（Agent），具备文件操作、代码执行、联网搜索等能力。本文详细介绍了其安装配置流程：环境准备：全新安装Node.js（v22+/v24+）或彻底卸载旧版后安装新版，需确保环境变量配置正确；权限设置：在PowerShell中解锁脚本执行权限；一键安装：通过官方脚本自动部署主程序；初始化向导：选择QuickStart模式，配置基础技能（Skills）和API（如Qwen或OpenAI），暂跳过高级选项。完成上述步骤后即可启动Clawdbot，后续可扩展远程控制等功能阅读全文

posted @ 2026-01-29 00:14 TTGF 阅读(3680) 评论(5) 推荐(3)

从“千问送奶茶”看AI Agent落地：火爆、崩塌与进化方向

摘要：阿里通义千问APP在2026年春节期间推出"30亿免单送奶茶"活动，通过AI Agent技术实现"一句话点单"的便捷体验，3小时内订单突破百万。活动成功验证了AI从聊天工具向"主动办事助手"的转型，但也暴露了系统在高并发下的技术短板：API网关崩溃、数据库过载和GPU显存溢出等问题。该活动展现了阿里在大模型技术、生态整合（高德、支付宝等）和成本控制（自研芯片）方面的独特优势，为AI Agent的商业化落地提供了重要参考，同时也揭示了工程化能力仍需突阅读全文

posted @ 2026-02-08 01:56 TTGF 阅读(1776) 评论(2) 推荐(0)

CyberArcanum 赛博秘仪：当AI与塔罗相遇，我用代码重构了一场数字时代的占卜仪式

摘要：摘要： CyberArcanum 赛博秘仪是一款融合神秘学仪式感与前沿技术的数字塔罗工具，旨在通过AI和交互设计重构传统占卜体验。其核心创新包括：手势选牌：基于Google MediaPipe实现手部动作交互，用户通过挥动和握拳完成选牌仪式，全程本地处理保障隐私；沉浸式流程：从输入困惑到AI解牌，每个环节（如暗金界面、3D翻牌动效）强化仪式感，避免传统数字塔罗的"点击抽卡"简化；深度对话：集成DeepSeek API提供个性化流式解读，支持多轮追问，使AI成为引导自我探索的&quo 阅读全文

posted @ 2026-03-02 17:02 TTGF 阅读(393) 评论(0) 推荐(0)

动动嘴就能建模？Blender全流程部署AI建模插件教程 | 零门槛实现AI驱动3D创作

摘要：一句自然语言就能实现 Blender AI 建模！本文提供保姆级 blender-mcp 插件全流程部署教程，从 uv 包管理器安装、插件配置，到 Cursor MCP 服务设置、双向连接测试，步骤清晰可落地，还包含常见排错指南与即用型 Prompt 示例，零门槛解锁 AI 驱动的 3D 全流程创作（建模、场景搭建、材质渲染、动画制作）。阅读全文

posted @ 2026-04-27 03:21 TTGF 阅读(5317) 评论(0) 推荐(3)

解锁 AI 办公：配置 AI 操控 WPS 全攻略

摘要：本文介绍了如何在Windows系统中配置lc2panda/wps-skills项目，实现Cursor与WPS Office的联动操作。主要内容包括：系统架构说明：由Cursor端的MCP工具、WPS加载项和Windows COM自动化通道三部分组成，实现AI对WPS文档的实时控制。详细安装步骤：环境要求检查获取项目源码执行一键安装脚本手动配置Cursor的MCP连接关键配置修改：调整logger.ts文件中的日志输出方式，确保MCP能正常连接。注意事项：WPS加载项目录创建、Node.js路阅读全文

posted @ 2026-05-08 14:32 TTGF 阅读(1358) 评论(0) 推荐(1)

AI摆摊：在 muShanghai × 观猹 AI 练摊集市的一次高密度体验

摘要：AI集市体验报告：5分钟玩转创意AI应用本文记录了作者在muShanghai × 观猹联合举办的AI集市上的体验。重点推荐了多个创新AI产品：Star CoPlay将AI融入《星露谷》游戏体验；NeonLingo实现无痛英语学习；Ordine框架支持多Agent工作流编排；谱乐AI简化音乐创作流程；Sonicite智能编排声音场景。其他亮点包括融资顾问FaSkill、Agent系统ColaOS、PPT生成工具MindShow等。这些产品展现了AI从概念到落地的实用价值，特别注重"5分钟上手"的用户体验。完阅读全文

posted @ 2026-05-17 03:47 TTGF 阅读(253) 评论(0) 推荐(1)

把 TeXstudio / LaTeX 工程交给 AI：texstudio-mcp 功能详解

摘要：texstudio-mcp 是一个专为 LaTeX 项目和 TeXstudio 环境设计的 MCP（模型上下文协议）服务器。它在 AI 助手（如 Cursor）与 LaTeX 工具链之间搭建了桥梁，提供了一系列强大的工具，包括：源码读写与编辑、自动化构建流程（latexmk/bibtex/biber）、基于 SyncTeX 的 PDF 预览分析、以及 TeXstudio 配置读取。通过该服务，AI 可以深度感知本地工具链状态，从而协助用户高效地进行文档编写、错误调试及文献管理。阅读全文

posted @ 2026-05-23 18:52 TTGF 阅读(334) 评论(0) 推荐(0)

来不及学 AI 就不用学了？——从 AI 到 Agent，再到 Harness Engineering 与 Loop Engineering ：一条被产品化加速的技术演进线

摘要：本文系统梳理了AI领域从LLM到Agent的技术演进脉络，旨在澄清各类流行概念的本质关系。文章指出：LLM本质是文本生成器，而Agent通过"思考-行动-观察"循环（ReAct模式）赋予模型行动能力。关键组件包括CLI（通用接口）、MCP（标准化协议）、Skills（可复用操作手册）和持久记忆层。作者强调Harness（运行时管理）才是Agent能力的核心，而非模型本身。通过对OpenClaw、Workflow工具链等案例的分析，揭示了不同概念间的嵌套关系，帮助读者辨别技术实质与营销词汇。阅读全文

posted @ 2026-06-26 18:56 TTGF 阅读(86) 评论(0) 推荐(0)

机器学习基础一文速通：理清概念——实践代码任务

摘要：本文为期末周复习时候顺手整理，内容较长大家可以根据目录进行快速查阅。感谢支持！文章中涉及资料及实践用数据可以私信博主获取，或直接联系邮箱：chenai_tgf@163.com 阅读全文

posted @ 2026-06-29 23:04 TTGF 阅读(19) 评论(0) 推荐(0)

ChenAI-TGF

合集-人工智能

公告