2024年4月14日
摘要: 个人学习使用, 侵权删 LLM的3种架构:Encoder-only、Decoder-only、encode-decode 阅读全文
posted @ 2024-04-14 16:41 zhou-snaker 阅读(8) 评论(0) 推荐(0) 编辑
摘要: 个人学习使用,侵权删 参考来源: 详解生成式语言模型-GLM:General Language Model Pretraining with Autoregressive Blank Infilling 清华ChatGLM底层原理详解——ChatGPT国内最强开源平替,单卡可运行 阅读全文
posted @ 2024-04-14 15:47 zhou-snaker 阅读(1) 评论(0) 推荐(0) 编辑
  2024年3月29日
摘要: 内容来源网络,侵权删 Python3《机器学习实战》学习笔记(八):支持向量机原理篇之手撕线性SVM 支持向量机(SVM)——原理篇 SVM分类器原理详解 阅读全文
posted @ 2024-03-29 12:41 zhou-snaker 阅读(3) 评论(0) 推荐(0) 编辑
  2024年3月15日
摘要: 个人学习使用,侵权删 word2vec中的负采样与分层softmax - 向阳树的文章 - 知乎 Word2Vec教程-Negative Sampling 负采样 阅读全文
posted @ 2024-03-15 16:29 zhou-snaker 阅读(4) 评论(0) 推荐(0) 编辑
  2024年3月7日
摘要: 个人学习使用,侵权删 参考资料: 深度学习模型压缩技术 阅读全文
posted @ 2024-03-07 14:17 zhou-snaker 阅读(2) 评论(0) 推荐(0) 编辑
摘要: 个人学习使用,侵权删 np问题 阅读全文
posted @ 2024-03-07 14:09 zhou-snaker 阅读(2) 评论(0) 推荐(0) 编辑
摘要: 个人学习使用,侵权删 参考资料: L1,L2,L0区别,为什么可以防止过拟合 L1正则化及其稀疏性解释 深度学习训练中是否有必要使用L1获得稀疏解? 阅读全文
posted @ 2024-03-07 13:41 zhou-snaker 阅读(2) 评论(0) 推荐(0) 编辑
  2024年3月6日
摘要: 个人学习使用,侵权删 【集成学习】:bagging和boosting算法及对比 阅读全文
posted @ 2024-03-06 14:03 zhou-snaker 阅读(1) 评论(0) 推荐(0) 编辑
  2024年3月4日
摘要: 个人学习使用,侵权删 参考连接: 为什么 Bert 的三个 Embedding 可以进行相加? 阅读全文
posted @ 2024-03-04 15:05 zhou-snaker 阅读(1) 评论(0) 推荐(0) 编辑
摘要: 个人学习使用,侵权删 参考连接: 生成式预训练模型:UniLM、BART、T5、GPT 阅读全文
posted @ 2024-03-04 11:16 zhou-snaker 阅读(3) 评论(0) 推荐(0) 编辑