半截山上的小猫

2025年10月24日

摘要： 📘今日学习总结 tokenization分词算法 BPE分词（Byte-Pair Encoding） BPE 算法从一组基本符号（例如字母和边界字符）开始，迭代地寻找语料库中的两个相邻词元，并将它们替换为新的词元，这一过程被称为合并。合并的选择标准是计算两个连续词元的共现频率，也就是每次迭代中，阅读全文

posted @ 2025-10-24 20:36 半截山上的小猫阅读(35) 评论(0) 推荐(0)

2025年10月23日

LLM学习笔记DAY10

摘要： 📘 大语言模型全面学习笔记一、大语言模型评测体系 1.1 常见评测指标任务类型评测指标说明分类任务精确率、召回率、F1 基于混淆矩阵计算语言建模困惑度（PPL）衡量文本建模概率文本生成 BLEU、ROUGE 衡量与参考文本的重叠度问答任务准确率、EM、F1 判断答案正确性阅读全文

posted @ 2025-10-23 18:42 半截山上的小猫阅读(24) 评论(0) 推荐(0)

LLM学习笔记DAY9

摘要：大语言模型学习笔记一、大语言模型的局限性 1.1 规划能力不足示例：汉诺塔问题中步骤错误，缺乏校验与修正机制。需引入规划策略与反思检查策略。 1.2 知识时效性与计算能力不足示例：GPT-4回答“美国总统”错误，数值计算不准确。需外部工具支持（如搜索引擎、计算器）。 1.3 缺乏记忆与身份阅读全文

posted @ 2025-10-23 18:35 半截山上的小猫阅读(22) 评论(0) 推荐(0)

2025年10月21日

LLM学习笔记DAY8

摘要： 📘今日学习总结大语言模型提示技术学习笔记 1 提示工程 1.1 提示设计关键要素五大核心要素：任务描述：清晰明确的任务指令，包含目标、限制条件、数据格式等上下文信息：提供背景知识，帮助模型突破知识局限输入数据：具体的查询内容或问题提示策略：问题分解、多步思考等策略输出格式：期望的回答阅读全文

posted @ 2025-10-21 02:50 半截山上的小猫阅读(24) 评论(0) 推荐(0)

2025年10月20日

LLM学习记录DAY7

摘要： 📘今日LLM学习笔记总结一、大模型解码策略 1.1 自回归解码定义：逐词生成下一个词，基于已生成内容继续生成。流程：输入词序列 ( u ) 重复：模型输出下一个词的概率分布 ( P ) 采样或选择下一个词 ( u' ) 将 ( u' ) 拼接到 ( u ) 直到生成结束词或达到最大长度阅读全文

posted @ 2025-10-20 21:40 半截山上的小猫阅读(20) 评论(0) 推荐(0)

szhAC

公告