幻影星全能的木豆

2024年7月19日

摘要：目录万字长文总结多模态大模型最新进展😊Flamingo1. Visual processing and the Perceiver Resampler2. GATED XATTN-DENSE details3. Multi-visual input support4. 训练细节😃BLIP-21. 阅读全文

posted @ 2024-07-19 00:28 幻影星全能的木豆阅读(926) 评论(0) 推荐(0)

2024年7月18日

完整的多模态LLM的训练流程

摘要：目录一、模型结构选择二、数据预处理三、模型预训练四、模型评估五、使模型和人类对齐六、LLM融合多模态6.0 多模态LLM架构6.1 一阶段预训练6.2 二阶段微调6.2.1 构造图像-指令遵循数据集6.2.2 训练方式6.2.3 质量评估6.3 链接外部工具6.3.1 构造<指令, API>数据6. 阅读全文

posted @ 2024-07-18 23:04 幻影星全能的木豆阅读(2578) 评论(0) 推荐(1)

超长上下文扩展：LongLoRA & LongQLoRA

摘要：学习链接 https://blog.csdn.net/v_JULY_v/article/details/135375799 目录从LongLoRA到LongQLoRA(含源码剖析)：超长上下文大模型的高效微调方法第一部分 LongLora：超长上下文大模型的高效微调方法1.1 从PI、LoRA到Lo 阅读全文

posted @ 2024-07-18 14:19 幻影星全能的木豆阅读(617) 评论(0) 推荐(0)

大模型长度扩展：直接外推, PI, NTK-aware, NTK-by-parts, Dynamic NTK, ALiBi, YaRN, S2-Attention

摘要：目录第一部分背景知识：从进制表示谈到直接外推、线性内插、进制转换1.1 从进制表示到直接外推1.1.1 进制表示1.1.2 直接外推1.2 从线性内插到进制转换1.2.1 线性内插1.2.2 进制转换第二部分从RoPE、直接外推到位置内插Position Interpolation2.1 旋转位阅读全文

posted @ 2024-07-18 11:40 幻影星全能的木豆阅读(4672) 评论(0) 推荐(3)

2024年7月17日

RoPE旋转位置编码代码实现梳理

摘要： RoPE 流程总结 & RoPE介绍通过绝对位置编码起到相对位置编码的效果，寻找一个函数\(f, g\)，使得 \(<f_{q}\left(x_{m}, m\right), f_{k}\left(x_{n}, n\right)>=g\left(x_{m}, x_{n}, m-n\right)\) 阅读全文

posted @ 2024-07-17 15:53 幻影星全能的木豆阅读(1899) 评论(0) 推荐(0)

2024年7月15日

面试准备【LLM】

摘要：目录其他注意力过拟合的表现有哪些？BN 训练和测试的区别在哪里？梯度下降的公式？反向传播优化器 & Adam均方误差损失交叉熵损失梯度消失问题梯度爆炸问题权重正则化过拟合分词器BERT掩码语言建模 (MLM)下一个句子预测 Next Sentence Prediction(NSP)BERT微调BER 阅读全文

posted @ 2024-07-15 19:15 幻影星全能的木豆阅读(314) 评论(1) 推荐(1)

2024年7月11日

MetaGPT-main-源码学习

摘要：学习最新版本的MetaGPT官方教程(v0.8.1 maybe) 学习教程：https://docs.deepwisdom.ai/main/zh/guide/tutorials/concepts.html v0.8.1 改动(相比v0.4) 智能体入门 1.）在《智能体入门》章节，v0.8.1版本在阅读全文

posted @ 2024-07-11 21:52 幻影星全能的木豆阅读(671) 评论(0) 推荐(0)

MetaGPT-v0.4-源码学习

摘要：撰写中阅读全文

posted @ 2024-07-11 21:50 幻影星全能的木豆阅读(58) 评论(0) 推荐(0)

AutoGPT-v0.1.0-源码学习

摘要： AutoGPT介绍 AutoGPT：单智能体，一个prompt驱动的调用很多工具安装v0.1.0版本，全python项目，安装简单，便于查看源码学习核心思想。项目地址：https://github.com/Significant-Gravitas/AutoGPT/tree/v0.1.0 Auto 阅读全文

posted @ 2024-07-11 21:42 幻影星全能的木豆阅读(266) 评论(0) 推荐(0)

mudou

公告