摘要: 一、思维导图 二、subword(子词)粒度 在很多情况下,既不希望将文本切分成单独的词(太大),也不想将其切分成单个字符(太小),而是希望得到介于词和字符之间的子词单元。这就引入了 subword(子词)粒度的分词方法。本文重点介绍这一部分。 2.1 WordPiece 在BERT时代,WordP 阅读全文
posted @ 2025-02-01 22:57 AAA建材王师傅 阅读(29) 评论(0) 推荐(0)
摘要: 作者前言: DeepSeek系列现在非常火,笔者决定主要梳理DeepSeekzui最重要的四代版本: DeepSeek-LLM; DeepSeekMath; DeepSeek-V2; DeepSeek-V3; DeepSeek-R1 敬请期待。 Deepseek系列博客目录 Model 核心 Dat 阅读全文
posted @ 2025-02-01 18:43 AAA建材王师傅 阅读(224) 评论(0) 推荐(0)