摘要: 网络结构 多层transformer的encoder堆叠组成,Base Bert由12层encoder组成 Bert的embedding由三个部分组成:Token Embeddings+Segment Embeddings+Position Embeddings: Token Embeddings: 阅读全文
posted @ 2025-06-30 23:55 Luna-Evelyn 阅读(23) 评论(0) 推荐(0)