随笔分类 -  AI

摘要:在使用 Claude Code 的过程中,我遇到这样的问题: 👉 “我安装了一个 MCP Server,但它到底把配置文件放哪儿去了?” 👉 “我能不能让团队共享同一个 MCP 配置?” 别急,这篇文章就带你从零搞清楚——Claude Code 的 MCP(Model Context Proto 阅读全文
posted @ 2025-10-25 01:40 LexLuc 阅读(9) 评论(0) 推荐(0)
摘要:一种新的图像生成范式正在崛起,它不再依赖传统的扩散过程,而是用语言的方式“写”出图像。 2025年3月,OpenAI 在更新 GPT-4o 的同时,低调上线了其“原生图像生成”功能。这一功能被嵌入到 GPT-4o 的多模态架构中,与文本、音频等能力无缝协同,带来了显著提升的图像生成质量、可控性和交互 阅读全文
posted @ 2025-03-28 20:21 LexLuc 阅读(1232) 评论(0) 推荐(0)
摘要:1. KV 缓存是什么? KV 缓存(KV Cache)是一种优化大语言模型(LLM, Large Language Models)推理速度的关键技术。最近爆火的DeepSeek,其首创的MLA技术,使得KV Cache降低了93%,在大语言模型的训练和推理上有效降低了对高性能GPU的性能要求(比如 阅读全文
posted @ 2025-02-15 02:18 LexLuc 阅读(3125) 评论(0) 推荐(0)
摘要:ComfyUI 上手, 工作流, 图生图, 自定义节点, VAE, ControlNet, LoRA 阅读全文
posted @ 2024-10-03 01:39 LexLuc 阅读(937) 评论(0) 推荐(0)
摘要:LLM,合成数据,生成文本数据,生成格式化数据,Kmeans, elbow 阅读全文
posted @ 2024-08-19 01:45 LexLuc 阅读(749) 评论(0) 推荐(0)
摘要:基础版 Few-shot Prompt Role-play Prompt Personality-added Prompt Multi-rounded Prompt Chain-of-Thought Prompt Self-Reflection Prompt 进阶版 Task break-down 阅读全文
posted @ 2023-11-29 16:25 LexLuc 阅读(378) 评论(0) 推荐(0)
摘要:long context: context length 128k, more accurate over a long context control JSON Mode Function calling, call many functions at once Reproducible outp 阅读全文
posted @ 2023-11-08 01:53 LexLuc 阅读(44) 评论(0) 推荐(0)
摘要:# BASE模型 模型大小:15.5B 训练数据量:800GB (1T token) 硬件资源:512张 Tesla A100 训练时长:24天 # 微调模型 微调模型:ZeRO-3 硬件资源:8张 Tesla A100 训练时长:3小时 # 有用链接 https://github.com/bigc 阅读全文
posted @ 2023-07-08 21:00 LexLuc 阅读(787) 评论(0) 推荐(0)
摘要:# StarCoderBase HF: https://huggingface.co/bigcode/starcoderbase Training dataset: [The Stack v1.2](https://huggingface.co/datasets/bigcode/the-stack) 阅读全文
posted @ 2023-07-03 16:54 LexLuc 阅读(91) 评论(0) 推荐(0)