Prompt | 快速生成五分钟 pre,用来讲自己的工作
1 流程概述
总体流程:
- 规划要讲的主要内容,以及每部分占用的时间:
- 可以先让 gpt 生成一个时间规划,用来参考;
- 然后,自己微调一下这个时间规划。
- 做 ppt,生成每一页的文字。
- 根据 ppt,生成讲稿。
2 相关 prompt
2.1 生成 pre 的时间规划
prompt:
给你看一个工作。请问你是否觉得这是一个好工作?它是否解决重要的问题、讲了一个好故事、有合理的 巧妙的 符合学术界审美的方法、并且实验结果可以支撑自己的 claim?请客观公正地评价这个工作,并且帮我想想,如果将其讲给别人听,但我只有五分钟,应该怎么讲,效果会最好,让别人觉得这是一个故事清晰的好工作。
最后确定的时间规划:
1min 介绍 PbRL,要让听众感觉 PbRL 可以解决 RL 的核心问题之一,应用广泛,是一个很有用 潜力很高的范式。
1min 介绍 segment indistinguishability 问题,要让听众明白,这个问题到底是什么,为什么会出现这个问题,这个问题确实会大大阻碍 PbRL 的应用。
1.5min 介绍 sepoa 方法,其中 0.5min 引入动机(不同 skill 的动作差别大,天然 distinguishable),1min 讲具体方法(预训练 skill、估计 skill return、query selection 时选 return 差异最大的 skill)为什么选 return 差异最大的 skill,是受到前面验证 segment indistinguishability 问题时做的人类实验的启发。
1min 介绍实验结果。
最后 0.5min 总结,给听众写 takeaway。
2.2 根据时间规划生成 ppt
2.2.1 概览式的生成
我现在要讲一个 5min 的英文 presentation,给更多人介绍 sepoa 的工作。我计划这样讲:
[刚刚生成的时间规划]
请问你觉得怎么样,这样能讲清楚嘛?我的主要目的,首先是让大家觉得我的故事很好(传教),其次 show off,再其次则是展示我们的工作很 solid。
请问可否帮我构想一下,具体每一部分怎么讲,我应该对于每一部分,呈现什么具体的逻辑线?
2.2.2 开始细化
1
对于第一部分 1min 介绍 PbRL,我打算做两页 ppt。第一页用 20s 介绍 RL 虽好但需设计 reward function,这个过程可能十分困难,举一个例子。第二页先用 20s 介绍 PbRL 可以通过 preference 来免去设计 reward function 的过程,更直接地利用人类专家的经验和直觉;然后再用 20s 介绍 PbRL 在各种领域广泛应用,如机器人、LLM 训练(RLHF)(你还知道有什么领域嘛?)。
请问可否帮我细化一下这个逻辑?请问可否直接帮我构思一下,我面对台下的观众应该怎么讲?
2
我已经做了两页 ppt。第一页用 20s 介绍 RL 虽好但需设计 reward function,这个过程可能十分困难,举一个例子。第二页先用 20s 介绍 PbRL 可以通过 preference 来免去设计 reward function 的过程,更直接地利用人类专家的经验和直觉;然后再用 20s 介绍 PbRL 在各种领域广泛应用,如机器人、LLM 训练(RLHF)、自动驾驶。
现在,我想做第 3 页 ppt,介绍 segment indistinguishability 问题,要让听众明白,这个问题到底是什么,为什么会出现这个问题,我们的人类实验验证了这个问题,这个问题确实会大大阻碍 PbRL 的应用。
请问可否帮我构思一下,这一页我应该具体怎么讲?
3
我已经做了三页 ppt。第一页用 20s 介绍 RL 虽好但需设计 reward function,这个过程可能十分困难,举一个例子。第二页先用 20s 介绍 PbRL 可以通过 preference 来免去设计 reward function 的过程,更直接地利用人类专家的经验和直觉;然后再用 20s 介绍 PbRL 在各种领域广泛应用,如机器人、LLM 训练(RLHF)、自动驾驶。第 3 页 ppt 用 1min 介绍 segment indistinguishability 问题,要让听众明白,这个问题到底是什么,为什么会出现这个问题,我们的人类实验验证了这个问题,这个问题确实会大大阻碍 PbRL 的应用。
现在,我想介绍 sepoa 方法。我想做第 4 页 ppt,用 0.5min 引入动机(不同 skill 的动作差别大,天然 distinguishable),然后做第 5 页 ppt,用 1min 讲具体方法(预训练 skill、估计 skill return、query selection 时选 return 差异最大的 skill)为什么选 return 差异最大的 skill,是受到前面验证 segment indistinguishability 问题时做的人类实验的启发。
请问可否帮我构思一下,这两页我应该具体怎么讲?
4
我已经做了五页 ppt。第一页用 20s 介绍 RL 虽好但需设计 reward function,这个过程可能十分困难,举一个例子。第二页先用 20s 介绍 PbRL 可以通过 preference 来免去设计 reward function 的过程,更直接地利用人类专家的经验和直觉;然后再用 20s 介绍 PbRL 在各种领域广泛应用,如机器人、LLM 训练(RLHF)、自动驾驶。第 3 页 ppt 用 1min 介绍 segment indistinguishability 问题,要让听众明白,这个问题到底是什么,为什么会出现这个问题,我们的人类实验验证了这个问题,这个问题确实会大大阻碍 PbRL 的应用。第 4 页 ppt 用 0.5min 引入 sepoa 动机(不同 skill 的动作差别大,天然 distinguishable)。第 5 页 ppt 用 1min 讲 sepoa 的具体方法(预训练 skill、估计 skill return、query selection 时选 return 差异最大的 skill)。
现在,我想介绍 sepoa 的实验 setting 和结构。第 6 页 ppt 介绍 setting,我们做了哪些环境,跟哪些 baseline 作比较。第 7 页介绍主实验的结果。第 8 页介绍人类实验的结果。这些应该一共 1min。
请问可否帮我构思一下,这三页我应该具体怎么讲?
5
我已经做了 8 页 ppt。第一页用 20s 介绍 RL 虽好但需设计 reward function,这个过程可能十分困难,举一个例子。第二页先用 20s 介绍 PbRL 可以通过 preference 来免去设计 reward function 的过程,更直接地利用人类专家的经验和直觉;然后再用 20s 介绍 PbRL 在各种领域广泛应用,如机器人、LLM 训练(RLHF)、自动驾驶。第 3 页 ppt 用 1min 介绍 segment indistinguishability 问题,要让听众明白,这个问题到底是什么,为什么会出现这个问题,我们的人类实验验证了这个问题,这个问题确实会大大阻碍 PbRL 的应用。第 4 页 ppt 用 0.5min 引入 sepoa 动机(不同 skill 的动作差别大,天然 distinguishable)。第 5 页 ppt 用 1min 讲 sepoa 的具体方法(预训练 skill、估计 skill return、query selection 时选 return 差异最大的 skill)。第 6 页 ppt 介绍实验 setting,我们做了哪些环境,跟哪些 baseline 作比较。第 7 页介绍主实验的结果。第 8 页介绍人类实验的结果。6-8 页 ppt 一共 1min。
现在,我想做最后一页 ppt,这一页的内容是 takeaway。我希望可以用最简洁明了的语言,recall 我的工作的主要内容,让大家对我的故事线和 method 留下深刻印象。我想做的事情仍然是,第一传教(让大家觉得我的故事好)、第二 show off、第三让大家觉得我的工作 solid。
请问可否帮我构思一下,这一页我应该具体怎么讲?
2.2.3 生成 ppt 具体内容
概览:
请问可否帮我生成一下,我直接放在 ppt 里的文字?使用清晰简洁易懂的学术英语语言,不要让听众们看不懂。
细化:
我理解你的逻辑,但 ppt 恐怕放不下这么多文字,我们需要在 ppt 上只放 keynote 文字。请问可否帮我生成一下,我直接放在 ppt 里的文字?使用清晰简洁易懂的学术英语语言,不要让听众们看不懂。同时,请问可否为每一页 ppt,生成一下讲稿,可以直接照着念的那种?使用清晰简洁易懂的英语语言,不要晦涩,不要让听众们听不懂。
2.3 根据 ppt 生成讲稿
让 gpt 明白 ppt 的逻辑:
这是一个工作。我得到了它的 ppt。请问能教教我,告诉我这个 ppt 每一页都讲了什么内容嘛?我了解 RL,但对 PbRL 了解不多。
开始生成讲稿:
现在,我要替这个人去讲 ppt。请问能为每一页生成一下讲稿嘛?我希望我的讲稿能把每一页 ppt 的含义传达出来,语言符合事实和逻辑。需要使用简洁易懂的英文,不能让听众们听不懂。
细化:
这一段,请问可否帮我修改一下,使其变成可以直接照着念的讲稿?现在还有项目符号,我不知道怎么念。

浙公网安备 33010602011771号