// // // //

LLM、transformer、HuggingFace

LLM

大语言模型一览

prompt 技巧汇总

模型框架

LLM 架构、Attention矩阵，分析 LLM 采用 decode-only

batch norm、layer norm、RMSNorm、DeepNorm

GLM and ChatGLM 架构解析与微调逻辑

大模型结构优化-MQA/GQA

量化与低成本部署

大模型量化及低成本部署

llama.cpp量化部署与 chatglm.cpp、qwen.cpp

大模型私有化部署框架

微调

大模型微调-综述

大模型微调 - LoRA 系列与 PEFT

大模型微调 - Prompt系列：Prefix Tuning、Prompt Tuning、P-Tuning v1、P-Tuning v2 原理

大模型微调 - PEFT 实战

llama2 量化并微调实战

行业大模型微调全流程【1】- 基本流程

行业大模型微调全流程【2】- 基础流程及源码剖析

行业大模型训练典型案例及分析 - MedicalGPT

行业大模型微调经验总结

垂直领域 LLM微调全流程

LLM微调 SFT指令数据生成

LLM微调案例

大模型训练基本流程

ChatGLM 微调细节1-构建数据集

LoRA 实战 - 利用 lora 微调 CNN

Prompt Learning 完成下游任务：基于bert的情感分类

大模型微调 - 工具型框架

大模型训练所需算力估计

大模型相关知识（未整理）

RAG

RAG-基础知识与技术

RAG-reranker 和提高召回利用率

大模型下的文本解析

RAG - 多模态问答、unstructured 文本解析（包括表格和图片OCR）

多模态文档处理工具收集（都是未验证的）

RAG - 材料很漂亮

Embedding

Embedding 模型一览选择及使用

embedding - bi encode AND cross encode

embedding 之 sentence_transformers 原理及用法

embedding 生成数据集，训练指标，基于 llama_index 微调

优质的 embedding 资源

BGE-智源 embedding 模型

Embedding工作原理 - 材料漂亮

Agent

Function Calling 原理与实战

DataBase

neo4j 基础语法

向量数据库及 LangChain 用法

其他

前端神器 - gradio 日常使用注意点

OCR

OCR工具 - tesseract

开源 OCR - 未测试

Attention and transformer

注意力机制【1】-入门篇

注意力机制【2】- CV中的注意力机制

注意力机制【3】-Self Attention

注意力机制【4】-多头注意力机制

注意力机制【5】Scaled Dot-Product Attention 和 mask attention

注意力机制【6】多种 attention 分析汇总

多头注意力机制中head_mask的作用

注意力机制深度剖析 - 位置、适用任务分析，不合适的注意力反而效果变差

transformer 和 Sinusoidal Positional Encoding

Bert -基本原理

Bert - 应用指南

transformer 架构优化

past_key_value 的作用

视觉位置编码

旋转位置编码 RoPE 和长度外推

batch normalization和layer normalization区别

从零开始基于transformers库搭建Llama

系列模型

相关知识

对比学习及 SimCLR

多模态基石CLIP原理与代码解读

HuggingFaceTools

### transformers

transformers库-Models

transformers库-tokenizer分词器

tokenizer - subword算法 BPE、WordPiece、ULM

tokenizer 中 attention_mask 在处理多个序列时的作用

transformers库-BERT中的Tokenizer

### TRL

TRL ：一款利用强化学习训练Transformer模型的框架

参考资料：

发表于 2023-12-30 14:29 努力的孔子阅读(34) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部