AI - 随笔分类 - LexLuc

熵减的博弈：构建AI产品的科学方法论与生存实录

摘要：AI产品, 大模型应用, Agent架构, 提示词工程, Lenny's Podcast 为什么大多数AI产品都会失败？基于Lenny's Podcast对OpenAI与Google专家的深度访谈，本文深度拆解AI产品构建的核心方法论。从“Prompt与Agent”的架构决策矩阵，到“代理权与控制权”的动态博弈，揭示如何跨越从Demo到生产环境的死亡谷，以及为何“痛苦的脏活”才是大模型时代真正的护城河。阅读全文

posted @ 2026-01-21 14:21 LexLuc 阅读(17) 评论(0) 推荐(0)

论文阅读笔记：SAM 3 —— 迈向语义通用的视觉分割新范式

摘要：标题： SAM 3: Segment Anything with Concepts 机构： Meta FAIR 领域：计算机视觉、多模态学习、交互式分割论文地址： arXiv:2511.16719 阅读时间： 2026-01-15 一、核心动机：从几何引导到语义引导 (Motivation) 阅读全文

posted @ 2026-01-16 02:37 LexLuc 阅读(165) 评论(0) 推荐(0)

AI 时代，“职场分工”终将消亡

摘要：如果说 2023 年是 AI 的觉醒元年，那么过去两年（2024-2025）则是企业组织架构的“重塑之年”。这不仅仅是“机器换人”那么简单。如果你仔细观察那些走在最前沿的知名企业，你会发现一个更深刻的趋势：曾经泾渭分明的职业标签正在失效。 “营销”与“制作”合体了，“业务”与“技术”打通了，就连“ 阅读全文

posted @ 2025-12-20 00:15 LexLuc 阅读(43) 评论(0) 推荐(0)

深入理解 Claude Code 的 MCP Server 配置机制

摘要：在使用 Claude Code 的过程中，我遇到这样的问题： 👉 “我安装了一个 MCP Server，但它到底把配置文件放哪儿去了？” 👉 “我能不能让团队共享同一个 MCP 配置？” 别急，这篇文章就带你从零搞清楚——Claude Code 的 MCP（Model Context Proto 阅读全文

posted @ 2025-10-25 01:40 LexLuc 阅读(1309) 评论(0) 推荐(0)

ChatGPT-4o 更新生图能力：原生多模态的图文生图技术详解：自回归路线的逆袭

摘要：一种新的图像生成范式正在崛起，它不再依赖传统的扩散过程，而是用语言的方式“写”出图像。 2025年3月，OpenAI 在更新 GPT-4o 的同时，低调上线了其“原生图像生成”功能。这一功能被嵌入到 GPT-4o 的多模态架构中，与文本、音频等能力无缝协同，带来了显著提升的图像生成质量、可控性和交互阅读全文

posted @ 2025-03-28 20:21 LexLuc 阅读(1426) 评论(0) 推荐(0)

KV Cache：加速LLM推理的关键

摘要：1. KV 缓存是什么？ KV 缓存（KV Cache）是一种优化大语言模型（LLM, Large Language Models）推理速度的关键技术。最近爆火的DeepSeek，其首创的MLA技术，使得KV Cache降低了93%，在大语言模型的训练和推理上有效降低了对高性能GPU的性能要求（比如阅读全文

posted @ 2025-02-15 02:18 LexLuc 阅读(3952) 评论(0) 推荐(0)

ComfyUI 实战：从0上手跑通一个工作流

摘要：ComfyUI 上手, 工作流, 图生图, 自定义节点, VAE, ControlNet, LoRA 阅读全文

posted @ 2024-10-03 01:39 LexLuc 阅读(1108) 评论(0) 推荐(0)

利用LLM生成人工合成数据

摘要：LLM，合成数据，生成文本数据，生成格式化数据，Kmeans， elbow 阅读全文

posted @ 2024-08-19 01:45 LexLuc 阅读(898) 评论(0) 推荐(0)

提示工程 Prompt Engineering 技巧总结

摘要：基础版 Few-shot Prompt Role-play Prompt Personality-added Prompt Multi-rounded Prompt Chain-of-Thought Prompt Self-Reflection Prompt 进阶版 Task break-down 阅读全文

posted @ 2023-11-29 16:25 LexLuc 阅读(449) 评论(0) 推荐(0)

GPT-4 Turbo KeyNote

摘要：long context: context length 128k, more accurate over a long context control JSON Mode Function calling, call many functions at once Reproducible outp 阅读全文

posted @ 2023-11-08 01:53 LexLuc 阅读(56) 评论(0) 推荐(0)

StarCoder训练与微调

摘要：# BASE模型模型大小：15.5B 训练数据量：800GB (1T token) 硬件资源：512张 Tesla A100 训练时长：24天 # 微调模型微调模型：ZeRO-3 硬件资源：8张 Tesla A100 训练时长：3小时 # 有用链接 https://github.com/bigc 阅读全文

posted @ 2023-07-08 21:00 LexLuc 阅读(808) 评论(0) 推荐(0)

BigCode StarCoder系列模型

摘要：# StarCoderBase HF: https://huggingface.co/bigcode/starcoderbase Training dataset: [The Stack v1.2](https://huggingface.co/datasets/bigcode/the-stack) 阅读全文

posted @ 2023-07-03 16:54 LexLuc 阅读(113) 评论(0) 推荐(0)

Lex个人随想乡

Attention before pay attention

随笔分类 - AI