zhou-snaker - 博客园

2024年4月14日

摘要：个人学习使用, 侵权删 LLM的3种架构：Encoder-only、Decoder-only、encode-decode 阅读全文

posted @ 2024-04-14 16:41 zhou-snaker 阅读(8) 评论(0) 推荐(0) 编辑

摘要：个人学习使用，侵权删参考来源: 详解生成式语言模型-GLM：General Language Model Pretraining with Autoregressive Blank Infilling 清华ChatGLM底层原理详解——ChatGPT国内最强开源平替，单卡可运行阅读全文

posted @ 2024-04-14 15:47 zhou-snaker 阅读(1) 评论(0) 推荐(0) 编辑

2024年3月29日

摘要：内容来源网络，侵权删 Python3《机器学习实战》学习笔记（八）：支持向量机原理篇之手撕线性SVM 支持向量机（SVM）——原理篇 SVM分类器原理详解阅读全文

posted @ 2024-03-29 12:41 zhou-snaker 阅读(3) 评论(0) 推荐(0) 编辑

2024年3月15日

摘要：个人学习使用，侵权删 word2vec中的负采样与分层softmax - 向阳树的文章 - 知乎 Word2Vec教程-Negative Sampling 负采样阅读全文

posted @ 2024-03-15 16:29 zhou-snaker 阅读(4) 评论(0) 推荐(0) 编辑

2024年3月7日

摘要：个人学习使用，侵权删参考资料：深度学习模型压缩技术阅读全文

posted @ 2024-03-07 14:17 zhou-snaker 阅读(2) 评论(0) 推荐(0) 编辑

摘要：个人学习使用，侵权删 np问题阅读全文

posted @ 2024-03-07 14:09 zhou-snaker 阅读(2) 评论(0) 推荐(0) 编辑

摘要：个人学习使用，侵权删参考资料： L1,L2,L0区别，为什么可以防止过拟合 L1正则化及其稀疏性解释深度学习训练中是否有必要使用L1获得稀疏解? 阅读全文

posted @ 2024-03-07 13:41 zhou-snaker 阅读(2) 评论(0) 推荐(0) 编辑

2024年3月6日

摘要：个人学习使用，侵权删【集成学习】：bagging和boosting算法及对比阅读全文

posted @ 2024-03-06 14:03 zhou-snaker 阅读(1) 评论(0) 推荐(0) 编辑

2024年3月4日

摘要：个人学习使用,侵权删参考连接: 为什么 Bert 的三个 Embedding 可以进行相加? 阅读全文

posted @ 2024-03-04 15:05 zhou-snaker 阅读(1) 评论(0) 推荐(0) 编辑

摘要：个人学习使用，侵权删参考连接：生成式预训练模型：UniLM、BART、T5、GPT 阅读全文

posted @ 2024-03-04 11:16 zhou-snaker 阅读(3) 评论(0) 推荐(0) 编辑