Xu_Lin

[置顶] 博客导航

摘要： | 本站链接 | 标签 | 归档 | 笔记 | 随笔 | 杂的文 | 留言板 | 相册 | :postbox:关于 | | : : | : : | : : | : : | : : | : : | : : | : : | : : | | Code | modelscope | huggingface 阅读全文

posted @ 2021-01-20 16:03 Xu_Lin 阅读(162) 评论(0) 推荐(1)

2026年5月11日

Codex API安装与配置指南

摘要： Codex 安装与配置指南 OpenAI Codex 完整使用说明书概述本指南将引导您完成 Codex 的注册、安装与配置全流程，分为以下三个主要步骤：注册账号并获取 API 密钥安装 Codex 命令行工具配置 Codex 连接自定义服务 ⚠️ 提示：如果您已安装 Codex，可跳过第二阅读全文

posted @ 2026-05-11 23:58 Xu_Lin 阅读(270) 评论(0) 推荐(0)

2026年4月28日

YOLO十年进化：从速度与激情到未来与前沿

摘要： YOLO十年进化：从速度与激情到未来与前沿 YOLO十年进化：从速度与激情到未来与前沿一、YOLO十年进化全景速览自2015年YOLOv1横空出世，将目标检测重塑为单一的回归问题并首次实现真正的实时性能以来，YOLO系列模型开启了一段持续十年、波澜壮阔的技术演进之旅。这段旅程并非简单的版本迭加，阅读全文

posted @ 2026-04-28 16:33 Xu_Lin 阅读(102) 评论(0) 推荐(1)

PEFT高效微调方法深度对比：LoRA、LoHA、DoRA、AdaLoRA及衍生变体

摘要：在参数高效微调（PEFT）领域，LoRA 及其衍生方法通过低秩矩阵分解大幅降低了大模型微调成本。LoRA 是基础方法，以低秩乘积逼近权重更新，简单高效；LoHA 与 LoKr 分别利用 Hadamard 积与 Kronecker 积重构更新矩阵，在相同参数量下获得更高的理论秩；DoRA 将权重分解为阅读全文

posted @ 2026-04-28 16:16 Xu_Lin 阅读(90) 评论(0) 推荐(0)

2026年4月24日

从DeekSeek V3到V4：技术路线演进、性能提升与创新突破

摘要：从DeekSeek V3到V4：技术路线演进、性能提升与创新突破一、DeepSeek-V3 核心架构与训练策略 DeepSeek-V3 是一个拥有 671B（6710亿）总参数的混合专家（MoE）模型，其核心设计遵循高总参、低激活的经济高效原则，每个 Token 仅激活 37B（370亿）阅读全文

posted @ 2026-04-24 15:41 Xu_Lin 阅读(106) 评论(0) 推荐(0)

2026年1月1日

goodbye2025，一个AI工程师的年终总结

摘要：其他待更新 LLamafactory贡献 https://github.com/hiyouga/LlamaFactory/releases/tag/v0.9.4 以上阅读全文

posted @ 2026-01-01 00:49 Xu_Lin 阅读(54) 评论(0) 推荐(0)

2025年10月11日

【vLLM】使用vLLM部署Qwen3-VL-30B-A3B-Instruct

摘要：环境与设备配置：H20*8(96G) MODEL_ID=Qwen/Qwen3-VL-30B-A3B-Instruct MODEL_NAME=Qwen3-VL-30B-A3B-Instruct python3 -m vllm.entrypoints.openai.api_server \ --mode 阅读全文

posted @ 2025-10-11 18:29 Xu_Lin 阅读(2681) 评论(3) 推荐(0)

2025年8月13日

强化学习相关框架汇总

摘要： 1、https://github.com/yaof20/Flash-RL 🔗 GitHub：https://github.com/yaof20/Flash-RL 🔗 Blog：https://fengyao.notion.site/flash-rl 2、verl by 字节：https://gi 阅读全文

posted @ 2025-08-13 15:55 Xu_Lin 阅读(262) 评论(0) 推荐(0)

2025年8月6日

【VLMEvalKit】使用VLMEvalKit进行多模态大语言模型的评测

摘要：项目快速启动 1.运行环境首先，确保你的开发环境已安装 Git 和 Python 3.7 及以上版本。接下来，通过以下命令克隆安装项目：建议Python使用3.7及以上，这里用的是3.11；建议预先安装Pytorch、Transformers、flash-attn等基础Python库，避免冲突阅读全文

posted @ 2025-08-06 00:00 Xu_Lin 阅读(930) 评论(0) 推荐(0)

2025年8月1日

【vibe coding】AI IDE配置(更新中)

摘要：【vibe coding】AI IDE配置 Cursor windsurf Trae codeBunny Argument Claude-code gemini-cli qwen-code iflow cursor windsurf trae codebunny gemini-cli qwen if 阅读全文

posted @ 2025-08-01 17:54 Xu_Lin 阅读(113) 评论(0) 推荐(0)

2025年7月31日

多模态相关问题详解

摘要： 1. 对于不具备多模态能力的大模型，有哪些方式可以让之得到多模态感知能力？哪一种效果最好？常见方式有： Adapter/Prompt Tuning（适配器/提示微调）在原有大模型（如LLM）前面加上专门的多模态适配器（如视觉编码器），将图片、音频等模态的信息编码为文本token或embeddin 阅读全文

posted @ 2025-07-31 19:49 Xu_Lin 阅读(605) 评论(0) 推荐(0)

2025年6月27日

openseek-学习与复现记录

摘要： OpenSeek 致力于联合全球开源社区，推动算法、数据和系统方面的协作创新，目标是开发超越 DeepSeek 的下一代模型。 📌 项目概况 OpenSeek 是由北京人工智能研究院（BAAI）发起的开源项目，旨在联合全球开源社区，推动算法、数据和系统方面的协作创新，开发超越 DeepSeek 阅读全文

posted @ 2025-06-27 16:09 Xu_Lin 阅读(151) 评论(0) 推荐(0)

2025年6月20日

视觉语言模型vlm-2025:更好、更快、更强

摘要：视觉语言模型 2025：更好、更快、更强动机视觉语言模型（VLMs）已成为当今人工智能领域的热门话题。自2024年4月的前一篇博客文章以来，该领域发生了巨大变化。模型变得更小但更强大，出现了新的架构和能力（推理、代理、长视频理解等）。与此同时，诸如多模态检索增强生成（RAG）和多模态代理等全新范阅读全文

posted @ 2025-06-20 17:34 Xu_Lin 阅读(2788) 评论(0) 推荐(1)

2025年6月4日

【百面大模型】第二章-大模型的数据

摘要：二、大模型的数据 2.1用来训练大模型的开源数据集有哪些(9)？训练大语言模型（LLM）和其他大模型（如图文多模态模型）需要海量、多样化的高质量数据。开源社区贡献了许多宝贵的数据集，覆盖文本、代码、多模态等不同领域。以下是一些重要且常用的开源数据集分类整理： 🧀 一、大规模通用文本数据集（预训练阅读全文

posted @ 2025-06-04 21:03 Xu_Lin 阅读(935) 评论(0) 推荐(0)

2025年6月2日

【agent】Lemon AI安装部署及初体验

摘要： Lemon提供macOS和Windows桌面应用程序，可在我们的官方网站上下载：www.lemonai.cc。 Lemon是一个开源的通用AI Agent，能够自动化从需求规划到结果交付的整个过程。它能够独立思考和系统规划，在虚拟环境中灵活调用各种工具，如编写和执行代码，智能浏览网页，操作Web应用阅读全文

posted @ 2025-06-02 21:36 Xu_Lin 阅读(599) 评论(0) 推荐(0)

2025年5月26日

【百面大模型】第一章-语义表达

摘要：一、语义表达 1.1词向量如何建模语义信息？稀疏词向量和稠密词向量有什么区别(1)？词向量（Word Embedding）通过将自然语言中的词语映射到低维连续向量空间中，从而建模语义信息。其核心思想是：语义相似的词语在向量空间中距离更近，并通过向量间的几何关系（如方向、距离）反映语义关联。以下是词阅读全文

posted @ 2025-05-26 11:51 Xu_Lin 阅读(1012) 评论(0) 推荐(1)

2025年5月22日

【大模型30讲】问题与答案汇总

摘要：在深度学习领域，我们经常用到嵌入向量、表征和潜空间这些术语，这些概念之间有哪些共性，又有哪些不同呢？ 1-1.假设我们正在训练一个包含五个卷积层和三个全连接层的卷积网络，这个神经网络的设计与AlexNet相似。我们可以将这些全连接层视为多层感知机中的两个隐藏层和一个输出层。在这个神经网络的哪些层上，阅读全文

posted @ 2025-05-22 12:04 Xu_Lin 阅读(462) 评论(0) 推荐(0)

2025年5月6日

进程管理

摘要：清理进程 ps aux | grep '/usr/local/python/bin/python3.8' | grep -v grep | awk '{print $2}' | xargs kill -9 阅读全文

posted @ 2025-05-06 10:37 Xu_Lin 阅读(26) 评论(0) 推荐(0)

2025年4月26日

【多模态学习】多模态大语言模型（MM-LLMs）的研究相关调研

摘要：多模态大语言模型的总结结构与原理结构示意图多模态输入 → 特征提取与对齐 → 语义理解与推理 → 多模态输出生成 MLLM架构组件模型组件作用及介绍模态编码器（Modality Encoder) 将不同模态的输入（如图像、音频、视频）编码为特征表示。常用的视觉编码器包括CLIP ViT、阅读全文

posted @ 2025-04-26 17:32 Xu_Lin 阅读(1166) 评论(0) 推荐(0)

2025年3月19日

Grounding与Embedding：多模态人工智能中的关键概念

摘要： Grounding与Embedding：多模态人工智能中的关键概念在多模态人工智能领域，Grounding和Embedding是两个至关重要的概念。它们在模型中扮演着不同的角色，共同协作以实现对多模态数据的深入理解和处理。 Grounding：语言与视觉的桥接 Grounding，通常指将抽象、符阅读全文

posted @ 2025-03-19 22:41 Xu_Lin 阅读(581) 评论(0) 推荐(1)

多模态大模型调研及学习(更新中)

摘要：多模态大语言模型的发展与未来展望目录引言历史发展当前状态技术架构应用场景挑战与限制未来趋势结论参考文献引言人工智能领域正经历着前所未有的变革，而多模态大语言模型（Multimodal Large Language Models，MLLMs）作为这一变革的核心驱动力，正在重塑我阅读全文

posted @ 2025-03-19 19:49 Xu_Lin 阅读(4360) 评论(2) 推荐(1)

Do more; Learn more; Be more

公告