Big-Yellow-J

2025年5月25日

摘要：前面已经介绍了简单的视觉编码器，这里主要介绍多模态中使用比较多的两种backbone：1、Clip；2、SAM。对于这两个backbone简单介绍基本原理，主要是讨论使用这个backbone。 1、CV中常用Backbone-2：ConvNeXt模型详解 2、CV中常用Backbone(Resnet 阅读全文

posted @ 2025-05-25 21:24 Big-Yellow-J 阅读(343) 评论(0) 推荐(0)

2025年5月18日

深入浅出了解生成模型-2：VAE模型原理以及代码实战

摘要： From: https://www.big-yellow-j.top/posts/2025/05/11/VAE.html 前文已经介绍了GAN的基本原理以及代码操作，本文主要介绍VAE其基本原理以及代码实战 VAE or AE 介绍VAE之前了解两个概念：AE（AutoEncoder，自编码器）和V 阅读全文

posted @ 2025-05-18 21:25 Big-Yellow-J 阅读(1221) 评论(0) 推荐(0)

2025年5月11日

深入浅出了解生成模型-1：GAN模型原理以及代码实战

摘要：更加好排版：https://www.big-yellow-j.top/posts/2025/05/08/GAN.html 日常使用比较多的生成模型比如GPT/Qwen等这些大多都是“文生文”模型（当然GPT有自己的大一统模型可以“文生图”）但是网上流行很多AI生成图像，而这些生成图像模型大多都离不开阅读全文

posted @ 2025-05-11 12:53 Big-Yellow-J 阅读(680) 评论(1) 推荐(0)

2025年5月1日

CV中常用Backbone-2：ConvNeXt模型详解及其代码

摘要：这里介绍新的一个Backbone：ConvNeXt，主要来自两篇比较老的来自Meta论文： 1、《**A ConvNet for the 2020s**》 > arXiv:2201.03545 2、《**ConvNeXt V2: Co-designing and Scaling ConvNets with Masked Autoencoders**》 > arXiv:2301.00808 两篇论文讲的都是一个模型：*ConvNeXt*。这也是证明一点：Vit效果好并不是attention本身而是因为transform的超大感受野和各种trick。因此作者也是不断借鉴Vit的操作（用斜体表示）阅读全文

posted @ 2025-05-01 14:50 Big-Yellow-J 阅读(1914) 评论(0) 推荐(1)

2025年4月27日

多视觉编码器协同与高低分辨率特征融合技术综述

摘要：本文主要介绍（论文发表时间：24.03-25.01）在多模态中使用多个视觉编码器如何进行特征融合操作（之所以用多视觉编码器，主要用途在于：有些视觉编码器可能只能提取到部分信息，就想通过另外一个编码器去捕捉之前编码器所没有捕捉得到的信息；另外一种情况就是：同时输入两类输入图像：1、高分辨率图像；2、低阅读全文

posted @ 2025-04-27 22:56 Big-Yellow-J 阅读(429) 评论(0) 推荐(1)

2025年4月22日

强化学习框架：OpenRLHF源码解读，模型处理

摘要：本文主要介绍了在 **OpenRLHF**中模型框架设计，主要分为3类模型：1、`actor model`；2、`critic model`；3、`reward model`这三类模型中分别起到作用：1、直接更具prompt输出response；2、输出token的评分（`action_values = values[:, -3:]`）；3、返回整句输出评分（找出最后一个有效 token 的索引，然后从 value 向量中提取该位置的值作为 reward。）阅读全文

posted @ 2025-04-22 22:40 Big-Yellow-J 阅读(702) 评论(0) 推荐(0)

2025年3月26日

Python进阶知识：多进程/多线程/装饰器

摘要：本文写作于2025.3.20，恰好作者正好在外面实习，于此同时在实际工作中遇到这些知识点，因此就进行一个简短汇总方便后续回顾，内容同步更新（显示问题可以直接看）：https://www.big-yellow-j.top/posts/2025/03/22/PythonThreading.html可以直阅读全文

posted @ 2025-03-26 22:38 Big-Yellow-J 阅读(140) 评论(0) 推荐(0)

2025年3月2日

Kimi/DeepSeek最新论文MoBA与NSA阅读

摘要： From:https://www.big-yellow-j.top/posts/2025/02/21/Kimi-DS-Paper.html DeepSeek最新论文：Native Sparse Attention: Hardware-Aligned and Natively Trainable Sp 阅读全文

posted @ 2025-03-02 15:07 Big-Yellow-J 阅读(350) 评论(0) 推荐(0)

深度学习常用的Attention操作（MHA/Casual Attention）以及内存优化管理(Flash Attention/Page Attention)

摘要： From:https://www.big-yellow-j.top/posts/2025/02/17/Attention.html Attention操作以及内存优化管理一、Attention操作关于 Multi Head Attention网上有较多的解释了，这里主要记录如下几点 1、对于注意阅读全文

posted @ 2025-03-02 15:07 Big-Yellow-J 阅读(937) 评论(0) 推荐(0)

常见的各类LLM基座模型（GPT、DeepSeek、Qwen等）模型解析以及对比

摘要： From： https://www.big-yellow-j.top/posts/2025/02/15/LLM.html 各类LLM模型技术汇总只去对比整体框架，对所采用的激活函数，归一化处理，位置编码等参考： 1、位置编码：https://www.big-yellow-j.top/posts/2 阅读全文

posted @ 2025-03-02 15:07 Big-Yellow-J 阅读(3293) 评论(0) 推荐(2)

公告