足迹

能看不尽景,始是不凡人

 

03 2023 档案

优化故事: BLOOM 模型推理
摘要:优化故事: BLOOM 模型推理 经过“九九八十一难”,大模型终于炼成。下一步就是架设服务,准备开门营业了。真这么简单?恐怕未必!行百里者半九十,推理优化又是新的雄关漫道。如何进行延迟优化?如何进行成本优化(别忘了 OpenAI 8K 上下文的 GPT-4 模型,提示每 1000 词元只需 0.03 阅读全文

posted @ 2023-03-28 07:16 姚伟峰 阅读(598) 评论(0) 推荐(0)

BLOOM 训练背后的技术
摘要:BLOOM 训练背后的技术 假设你现在有了数据,也搞到了预算,一切就绪,准备开始训练一个大模型,一显身手了,“一朝看尽长安花”似乎近在眼前…… 且慢!训练可不仅仅像这两个字的发音那么简单,看看 BLOOM 的训练或许对你有帮助。 近年来,语言模型越训越大已成为常态。大家通常会诟病这些大模型本身的信息 阅读全文

posted @ 2023-03-21 08:09 姚伟峰 阅读(767) 评论(0) 推荐(0)

导航