摘要: 每一周,我们的同事都会向社区的成员们发布一些关于 Hugging Face 相关的更新,包括我们的产品和平台更新、社区活动、学习资源和内容更新、开源库和模型更新等,我们将其称之为「Hugging News」,本期 Hugging News 有哪些有趣的消息,快来看看吧! 社区活动 百姓 x Hugg 阅读全文
posted @ 2023-03-25 23:09 HuggingFace 阅读(166) 评论(0) 推荐(0)
摘要: 欢迎使用 AI 进行游戏开发! 在本系列中,我们将使用 AI 工具在 5 天内创建一个功能完备的农场游戏。到本系列结束时,您将了解到如何将多种 AI 工具整合到游戏开发流程中。本文将向您展示如何将 AI 工具用于: 美术风格 游戏设计 3D 素材 2D 素材 剧情 注意: 此篇文章多次引用 第 2 阅读全文
posted @ 2023-03-24 13:32 HuggingFace 阅读(1653) 评论(0) 推荐(5)
摘要: 我们很高兴正式发布 trl 与 peft 的集成,使任何人都可以更轻松地使用强化学习进行大型语言模型 (LLM) 微调!在这篇文章中,我们解释了为什么这是现有微调方法的有竞争力的替代方案。 请注意, peft 是一种通用工具,可以应用于许多 ML 用例,但它对 RLHF 特别有趣,因为这种方法特别需 阅读全文
posted @ 2023-03-23 10:15 HuggingFace 阅读(1316) 评论(1) 推荐(1)
摘要: 假设你现在有了数据,也搞到了预算,一切就绪,准备开始训练一个大模型,一显身手了,“一朝看尽长安花”似乎近在眼前 …… 且慢!训练可不仅仅像这两个字的发音那么简单,看看 BLOOM 的训练或许对你有帮助。 近年来,语言模型越训越大已成为常态。大家通常会诟病这些大模型本身的信息未被公开以供研究,但很少关 阅读全文
posted @ 2023-03-22 11:54 HuggingFace 阅读(2227) 评论(0) 推荐(0)
摘要: Scaling Instruction-Finetuned Language Models 论文发布了 FLAN-T5 模型,它是 T5 模型的增强版。FLAN-T5 由很多各种各样的任务微调而得,因此,简单来讲,它就是个方方面面都更优的 T5 模型。相同参数量的条件下,FLAN-T5 的性能相比 阅读全文
posted @ 2023-03-21 13:41 HuggingFace 阅读(1847) 评论(0) 推荐(0)
摘要: 每一周,我们的同事都会向社区的成员们发布一些关于 Hugging Face 相关的更新,包括我们的产品和平台更新、社区活动、学习资源和内容更新、开源库和模型更新等,我们将其称之为「Hugging News」,本期 Hugging News 有哪些有趣的消息,快来看看吧! 社区活动 全球社区的 Ker 阅读全文
posted @ 2023-03-19 11:53 HuggingFace 阅读(328) 评论(0) 推荐(1)
摘要: 本文为社区成员 Jun Chen 为 百姓 AI 和 Hugging Face 联合举办的黑客松所撰写的教程文档,欢迎你阅读今天的第二条推送了解和参加本次黑客松活动。文内含有较多链接,我们不再一一贴出,请 点击这里 查看渲染后的 Notebook 文件。 随着人工智能和大模型 ChatGPT 的持续 阅读全文
posted @ 2023-03-17 14:31 HuggingFace 阅读(484) 评论(0) 推荐(0)
摘要: 最近 Kakao Brain 在 Hugging Face 发布了一个全新的开源图像文本数据集 COYO,包含 7 亿对图像和文本,并训练了两个新的视觉语言模型 ViT 和 ALIGN ViT 和 ALIGN。 这是 ALIGN 模型首次公开发布供开源使用,同时 ViT 和 ALIGN 模型的发布都 阅读全文
posted @ 2023-03-16 15:07 HuggingFace 阅读(458) 评论(0) 推荐(1)
摘要: 本文发表于 2020 年 6 月 8 日,虽然时间较久远,但现在看起来仍然是非常有价值的一篇文章。 在这个全民 LLM 的狂欢里,想测测你拿到的预算够训一个多大的模型吗?本文会给你一个答案,至少给你一个计算公式。 在自然语言处理领域,有时候我们恍惚觉得大家是为了搏头条而在模型尺寸上不断进行军备竞赛。 阅读全文
posted @ 2023-03-15 13:17 HuggingFace 阅读(530) 评论(0) 推荐(0)
摘要: 我们很高兴地宣布,SpeechT5 现在可用于 🤗 Transformers (一个开源库,提供最前沿的机器学习模型实现的开源库)。 SpeechT5 最初见于微软亚洲研究院的这篇论文 SpeechT5: Unified-Modal Encoder-Decoder Pre-Training for 阅读全文
posted @ 2023-03-14 11:09 HuggingFace 阅读(1323) 评论(3) 推荐(1)