2024年4月14日
摘要:
个人学习使用, 侵权删 LLM的3种架构:Encoder-only、Decoder-only、encode-decode
阅读全文
posted @ 2024-04-14 16:41
zhou-snaker
阅读(340)
推荐(0)
摘要:
个人学习使用,侵权删 参考来源: 详解生成式语言模型-GLM:General Language Model Pretraining with Autoregressive Blank Infilling 清华ChatGLM底层原理详解——ChatGPT国内最强开源平替,单卡可运行
阅读全文
posted @ 2024-04-14 15:47
zhou-snaker
阅读(33)
推荐(0)
2024年3月29日
摘要:
内容来源网络,侵权删 Python3《机器学习实战》学习笔记(八):支持向量机原理篇之手撕线性SVM 支持向量机(SVM)——原理篇 SVM分类器原理详解
阅读全文
posted @ 2024-03-29 12:40
zhou-snaker
阅读(13)
推荐(0)
2024年3月15日
摘要:
个人学习使用,侵权删 word2vec中的负采样与分层softmax - 向阳树的文章 - 知乎 Word2Vec教程-Negative Sampling 负采样
阅读全文
posted @ 2024-03-15 16:29
zhou-snaker
阅读(23)
推荐(0)
2024年3月7日
摘要:
个人学习使用,侵权删 参考资料: 深度学习模型压缩技术
阅读全文
posted @ 2024-03-07 14:16
zhou-snaker
阅读(17)
推荐(0)
posted @ 2024-03-07 14:09
zhou-snaker
阅读(7)
推荐(0)
摘要:
个人学习使用,侵权删 参考资料: L1,L2,L0区别,为什么可以防止过拟合 L1正则化及其稀疏性解释 深度学习训练中是否有必要使用L1获得稀疏解?
阅读全文
posted @ 2024-03-07 13:41
zhou-snaker
阅读(14)
推荐(0)
2024年3月6日
摘要:
个人学习使用,侵权删 【集成学习】:bagging和boosting算法及对比
阅读全文
posted @ 2024-03-06 14:02
zhou-snaker
阅读(6)
推荐(0)
2024年3月4日
摘要:
个人学习使用,侵权删 参考连接: 为什么 Bert 的三个 Embedding 可以进行相加?
阅读全文
posted @ 2024-03-04 15:05
zhou-snaker
阅读(20)
推荐(0)
摘要:
个人学习使用,侵权删 参考连接: 生成式预训练模型:UniLM、BART、T5、GPT
阅读全文
posted @ 2024-03-04 11:16
zhou-snaker
阅读(13)
推荐(0)