ChatGPT讲座

焦李成西安电子科技大学

ChatGPT引起学术界和工业界的关注

但目前只能作为工具辅助人类工作，但不能替代人类，并不具有人类的心智。

大模型，但其实没有在基础上进行太大的创新。

Transformer，奖励模型RM，强化学习

基于人类反馈的强化学习（RLHF）方法

ChatGPT无法通过图灵测试，（提问一些弱智吧的问题）

所以ChatGPT辨伪存真能力有待提高。容易被虚假信息误导。

黄民烈清华大学

ChatGPT是通用任务助理

对话式搜索引擎

开放讨论

实现AGI水平的对话智能体

张家俊自动化所

虽然大模型没法直接train，但是利用finetune，提示学习，指令学习都可以进行微调和提升

1.迈向通用性的提示学习

预训练+参数微调(finetune)的问题：①资源占用过多，每个下游任务都需要一个模型 ②过拟合严重，因为下游任务可能数据少 ③丧失通用能力

预训练+提示学习(prompt)：更改下游任务的描述，变成大模型可以解决的问题。当然，大模型需要足够强大。

比如，机器翻译，变为：I love this film. Its Chinese is ?

提示语：引导大模型回答下游任务。给所有样本增加提示语很有挑战性。

2.从提示学习到指令学习

可以参考https://zhuanlan.zhihu.com/p/590311003

泛化能力增强很多。

3.我们的探索和实践

①不同的提示语得到的结果往往差异很大

所以，对于样本引入任务的共性，把提示词也进行聚类——统一提示学习方法

不足：需要提前知道任务信息，需要进一步的泛化（因为知道任务才能把提示词聚类）

效果很不错，少量样本就可以得到很好的效果。

posted @ 2023-03-11 11:48 *Miracle* 阅读(161) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部

Miracle

生活中当一个智者，研究时做一个傻子 // A F O

ChatGPT讲座

焦李成西安电子科技大学

黄民烈清华大学

张家俊自动化所

公告

*Miracle*

生活中当一个智者，研究时做一个傻子 // A F O

ChatGPT讲座

焦李成 西安电子科技大学

黄民烈 清华大学

张家俊 自动化所

公告

Miracle

焦李成西安电子科技大学

黄民烈清华大学

张家俊自动化所