ChatGPT-之精通-AI-对话
ChatGPT 之精通 AI 对话
原文:ChatGPT: Mastering Conversations with Artificial Intelligence
译者:飞龙

关于作者
Dumitru Radoiu 是罗马尼亚特兰西瓦尼亚的乔治·埃米尔·帕拉代大学医学、药学、科学和技术学院的副教授。他的出版物包括书籍、学术论文和科学普及文章,旨在使科学技术主题更加易于理解。
他曾扮演过许多角色,如领导者、战略家、教育家、研究人员、学术作家和访问教授,在英国、爱尔兰、挪威、法国、荷兰、西班牙、意大利和希腊的大学。
作为数字化转型的一名早期采用者和传教士,他在客户体验、流程创新和数字技术交汇处提供咨询服务。
最近,他一直在探索生成式 AI,主要研究大型语言模型,并思考如何利用新工具创造价值、提高生产力和竞争优势。
Dumitru Radoiu 可在 LinkedIn 上联系,dumitruradoiu。
书中的提示可以从www.jacaranda.ro下载。
书籍内容的更新可以在dumitruradoiu.substack.com/找到。

免责声明
本书旨在作为 ChatGPT 使用的通用指南和参考工具。本书中提供的信息基于作者截至 2023 年 9 月最后更新时对该主题的知识和理解。本书不声称涵盖与 ChatGPT 或其他 AI 技术使用相关的所有可能场景、应用或问题。
使用 AI,包括 ChatGPT,涉及一定的风险和责任,用户应行使自己的判断,并在必要时寻求专家意见。本书不旨在替代专业建议,无论是法律、技术还是其他方面的建议。
作者和出版社声明,对于因使用和实施本书中包含的建议或信息而直接或间接产生的任何责任、损失或风险,概不承担。本书与 OpenAI 或任何其他参与 ChatGPT 的开发、分销或监管的实体无关。在整个书中,我们使用了搭载 GPT-4 引擎的 ChatGPT。
书中提到的所有产品名称、标志和品牌均为各自所有者的财产。使用这些名称、标志和品牌并不表示认可。
我衷心感谢 Adi、Simina 和 Alexandra 对这一项目的信任。
引言
想象一下,拥有一个虚拟助手,它不仅能提醒你约会或发送天气更新,还能写文章、编写软件,甚至帮助你的业务增长。如果你这个虚拟助手不仅能自动化任务,还能与你交谈、产生想法和情感支持,甚至偶尔讲个笑话,你会怎么想?欢迎来到未来。它被称为 ChatGPT。
让我分享一个捕捉到我“哇”时刻的故事。
我的女儿刚刚在克里特岛完成了一个会议,在回家的路上在雅典有一个六小时的转机时间。她给我打电话说:“爸爸,我在雅典有一些时间。你以前去过几次。你认为六个小时足够探索主要亮点吗?”
现在,雅典不仅仅是一个城市。作为西方文明的摇篮,它充满了历史地标。但只有六个小时?这似乎是一个很高的要求。
这就是 ChatGPT 介入的地方。我要求它识别雅典必看的地标,并按重要性进行排名。ChatGPT 根据我女儿的兴趣提供了一份定制列表。然后我要求制定一条高效参观这些地点的最佳路线。ChatGPT 规划了一条步行游览路线,并提供了每个目的地之间的时间和距离估算。
我把定制的行程发给了我的女儿。她迅速按照 ChatGPT 建议的交通方式前往市中心。在探索过程中,我们互相发送更新,她一直按计划进行。几个小时后,事情发生了意想不到的转折,雨破坏了原计划。
没问题。我转向 ChatGPT,根据新的情况进行了调整,并迅速生成了一条替代路线。我的女儿转向了修订后的行程,并利用 ChatGPT 的实时调整及时赶上了她的航班。
这次体验捕捉了 ChatGPT 的能力。它将潜在的麻烦转化为一次迷你冒险,尽管我身处物理距离之外,仍克服了障碍和限制。想象一下,它能在许多复杂、时间紧迫的情况下为你做些什么。
这个故事激发了这个书的想法。接下来的页面将概述 ChatGPT,它的运作方式,以及最重要的是,如何利用 AI 技术以更少的投入完成更多的工作。更少的时间、精力和金钱。虽然我们专注于 ChatGPT,但涵盖的技术将适用于其他类似的大型语言模型 AI 应用。
本书首先揭开 ChatGPT 的神秘面纱,这是目前最先进的语言模型。我们将从基本层面概述其架构和机制。从那里,我们将引导你完成初始设置,将技术术语解码为简单的步骤,并通过有效的“提示”探索提出正确问题艺术。
接下来,我们将介绍扩展 ChatGPT 功能的插件,例如浏览网页和连接外部资源。我们还将深入探讨 ChatGPT 在准确性、推理和局限性等方面的优势和劣势。
本书的大部分内容集中在现实世界的应用上,以提升生产力。我们将提供将 ChatGPT 融入你日常工作流程的实战指南。我们还将涵盖更高级的使用案例,如数据分析。
在上一章中,我们将探讨 AI 的未来、即将到来的趋势以及它们如何可能改变我们的日常生活。
那么,你准备好用 ChatGPT 改变你的工作和生活方式了吗?现在正是时候。让我们深入探索可能性!未来不会等待任何人!
1. ChatGPT – 您的新 AI 助手
1.1 概述
欢迎来到未来!深入 ChatGPT 的世界,这是最新创新,吸引了全球的关注!ChatGPT 不仅仅是一个 AI 助手;它基于突破性的生成式 AI 技术。这项技术利用非结构化数据(如文本、图像和声音)来识别复杂的模式,并将其存储为统计值。当用户通过简单的界面(图 1.1)提示时,生成式 AI 利用这些模式生成新的内容,无论是文本、声音、2D 图像还是 3D 对象。它是艺术与科学的和谐融合,由先进的算法支撑。

图 1.1 ChatGPT 用户界面
ChatGPT 在生成式 AI 领域内是一个独特的应用。它专门设计用于生成和处理文本,并准备好进行对话交互。这类工具通常被广泛称为大型语言模型,或简称 LLM,它们的演进速度令人惊叹。
本书主要深入探讨了 ChatGPT LLM 和 DALL-E 图像生成器,它们都是生成 AI 世界中的佼佼者。ChatGPT 于 2022 年 11 月由 OpenAI 发布。它被免费提供给公众,其反响极为积极,仅两个月就积累了超过一亿用户。
生成 AI 为何如此具有变革性?它是第一种允许我们委托需要类似人类智能的任务的技术。这开启了一个时代,机器不仅执行预定义的动作,还能产生原创想法,做出明智的决定,激发创新。
1.2 架构
为了学习人类的谈话模式,ChatGPT 从书籍、网站、聊天、百科全书和其他文本资源中读取了大量文本。它将这些模式保存在一个称为神经网络的计算机大脑中。这就像一块海绵吸收了大量的文本。这个学习阶段帮助它学习单词、语法规则以及一些关于世界的知识。随着它学习单词和句子的结构,它能够预测句子将如何继续。然后它进入更多的训练阶段,在这个阶段中,它看到了许多问题和答案的来回交流。这有助于 ChatGPT 以更“人性化”的方式改进其对问题的回答(逐字猜测)。这部分训练就像有一个提供详细反馈的老师。
这是如何做到的?
ChatGPT 建立在称为 Transformer 架构的蓝图上^(1)(图 1.2)。这个架构有两个主要组件:编码器和解码器。编码器深入文本输入,分析和理解单词的意义。一个内置机制,称为“注意力”^(2),帮助编码器专注于文本的适当部分,并使语言模型能够专注于输入的相关部分,并辨别单词和短语之间的关系:
– 讨论的主题域和上下文,
– 句子中单词的位置,以及
– 句子中每个词与其他词的关系。

图 1.2 语言模型交互的简化表示
句子中单词的位置很重要,就像食谱中成分的顺序一样。单词之间的关系(弱或强)也很重要,因为它可以改变句子的意义。解码器在训练期间记录了单词、语法模式和作者风格。它根据这些见解构建响应,反映了文本输入中明显的语言模式^(3)。
1.3 功能
ChatGPT 的生成潜力远远超出了简单的问答,使其成为众多创意和创新任务的有价值工具。
对于作家来说,它充当了一个创意伙伴,建议故事情节、角色发展,甚至创作诗歌或散文片段。
博客作者和记者可以利用它进行标题生成、引言段落优化,甚至用于构思文章主题。
教师可以利用 ChatGPT 创建定制的教学计划、考试问题或创新的教育场景,以吸引学生。
相反,研究人员可以利用它从密集的学术文本中综合摘要或总结。
商业专业人士可以利用它的力量进行头脑风暴会议、生成产品名称和标语,甚至基于提供的数据制定商业策略。
设计师和艺术家也不会被排除在外;通过文本提示,ChatGPT 可以提出设计概念、艺术主题,甚至音乐歌词。
在编码和开发中,它有助于建议代码片段、调试解决方案或提出算法结构。
此外,它模拟各种对话风格的能力使其成为编剧的理想工具,能够为戏剧、电影或电子游戏起草对话。
从本质上讲,ChatGPT 的生成能力提供了无与伦比的灵活性,改变了各个领域的专业人士的构思、创造和创新方式。
但是,由于语言模型是从文本而不是真实事件中学习的,他们的知识是真实和虚构内容的混合。他们不知道对错。他们可能听起来像他们理解了,但他们并没有。他们只是给出与我们提供的文本相匹配的文本。
1.4 局限性
我们人类发明了一种模仿我们说话方式的机器。这意义重大,因为文本仍然是人类经验、知识和反馈存储的主要形式。现在,我们似乎终于可以访问具有分析、解释和生成语言能力的机器了。
这有多酷?与这样的机器一起工作有多酷?
在我们继续前进之前,是时候讨论 ChatGPT 的临时局限性了。
就像所有大型语言模型(LLM)一样,ChatGPT 并不真正“理解”或“推理”,它并不真正“处理”信息的方式与我们人类一样。我们用大量的文本数据训练 LLM,但并没有给它提供区分文本中表达的观点和科学事实的机制。与人类不同,LLMs 没有一致的“世界观”或明确的“真理来源”。
我们可以将 ChatGPT 视为一个故事书角色,一个“知识守护者”,他阅读并现在记得大量的文本。他可能会建议他读过的书籍,现在总结它们,回答问题,并扮演书中的角色。然而,他现在无法访问这些书籍,大多数时候,在讨论一个主题时,他会结合不同作品中阅读到的想法,难以确切记住哪个想法来自哪本书,甚至难以记住这个想法是观点还是真实的事实。因此,我们需要验证他所说的每一件事。
但“知识守护者”仍然有用,因为它可以从大量信息中提取出微小的细节,找到甚至聪明的人类可能错过的联系。获取那些甚至人类专家可能错过的隐藏洞察力的技巧是提出恰当的问题。
这本书是关于如何提出这些问题,以及如何与 AI 交谈。
当 OpenAI 推出 ChatGPT 时,其影响是深远的。细腻、类似人类的互动与数百万人的梦想产生了共鸣,回响着《星际迷航:下一代》中指挥官数据的互动(图 1.3)。这种 LLM 的流畅性可能会让人期待超越仅仅是语言理解和生成的能力。我们可能渴望真正的推理、动态学习和外部资源访问。然而,语言能力并不能保证准确性。
模仿指挥官数据的科技将具备:
– 一个全面的世界模型,配备学习动态,
– 智能处理能力,包括因果规则和算法,
– 实时访问多样化的现实世界数据。

图 1.3 使用人工智能推理机器的语言使用简化表示。科学证明语言在思考中发挥作用,尽管语言与思维之间的确切关系仍然是争论的焦点
然而,我们当前的技术还没有达到这个顶峰。LLM 虽然复杂,但主要基于数值理解,对输入文本进行统计分析。随后的数学运算产生上下文相关的输出。现在的 LLM,包括 ChatGPT,仍然是工具,而不是像指挥官数据(图 1.4)那样的有感知能力的实体。

图 1.4 使用类似 ChatGPT 的语言模型的语言使用简化表示
那么为什么会有拟人化的倾向呢?
“人类天生就有拟人化的倾向。[...] 我们准备好去爱和害怕那些甚至不是活物的东西。”(本·索耶,中央佛罗里达大学心理学项目教授)
无论外观是否类似人类,都绝对不能将机器拟人化。这些设备并不“思考”,而是“背诵”它们从训练中学到的知识,使用统计来确定适当的回应。
好吧,现在我们知道 ChatGPT,这个“知识守护者”,是一台机器,而不是人类。
ChatGPT 有什么吸引人的地方?
它在阐明跨大量数据源之间的联系方面的能力是独特的。这个工具无缝地融合了人类生成的内容,揭示了不同人类作品之间意想不到的平行关系。这样的 AI 工具体现了原始的社会协作。这才是真正的表现。
我们今天正在构建的 AI 工具已成为一种创新的社会协作形式。因此,学习与 AI 合作可能是你在这个十年可以培养的最高杠杆技能。
最后,这就是文明的核心,一种共同工作的方式。

苏格兰部落首领的特写肖像,身着传统苏格兰服装
-
视觉叙事团队;Madhumita Murgia,“生成式 AI 的存在是因为 Transformer。这是它的工作方式,”在《金融时报》(2023 年 10 月访问;
ig.ft.com/generative-ai/)。 -
Ashish Vaswani 等人,“Attention Is All You Need”(arXiv:1706.03762v7;最后修改日期:2017 年 6 月 12 日;
arxiv.org/pdf/1706.03762.pdf)。 -
Timothy B. Lee,Sean Trott,“如何用非术语解释 AI 大型语言模型的工作原理,”在 Arstechnica(2023 年 10 月访问;
arstechnica.com/science/2023/07/a-jargon-free-explanation-of-how-ai-large-language-models-work/)。
2. 开始使用
ChatGPT 是一个为对话设计的平台。1 它倾听您的声音,检测您的意图、感受和情绪,并尽可能接近您的请求进行回复。它的工作方式就像一面镜子。您想要展示的图像越清晰,您得到的反射就越清晰。因此,这不仅仅是提问;这是关于提出正确的问题,关于提供您问题的背景,关于您如何清晰地表达您的思想。
在本章中,我们将引导您了解基础知识,帮助您开始使用。到结束时,您将准备好与最先进的 AI 模型之一进行交流。
让我们开始吧!
2.1 设置 ChatGPT
您可以通过任何最新的浏览器在chat.openai.com访问 ChatGPT(图 2.1)。任何配备最新浏览器的现代设备都表现良好。为了在对话中保持流畅,拥有稳定的网络连接是好的,但不需要大带宽。
现在,让我们为您的 AI 对话做好准备。
连接到 ChatGPT;逐步说明
- 连接到chat.openai.com并注册
– 打开您的浏览器,
– 前往chat.openai.com。

图 2.1 如何使用网页界面访问 ChatGPT
- 设置账户
– 输入您的邮箱地址并创建密码
– 通过发送到您邮箱的链接验证您的账户。
- 首次登录
– 使用您的邮箱和密码登录
– 接受服务条款和隐私政策。
- 检查主仪表板(图 2.2)
– 检查所有标签页
– 探索自定义选项的设置。
- 开始对话
– 通过提供的聊天框开始你的第一次对话。你的回复将显示在你面前
– 首先使用 ChatGPT;稍后升级到 ChatGPT Plus.^(2)

图 2.2 ChatGPT 用户界面
记住 ChatGPT 是一个工具;它的高级程度并不重要,重要的是你如何使用它。
享受聊天!
2.2 提示的艺术
使用 ChatGPT,你要求什么就得到什么。提示越好,它的回答就越好。提示构建的艺术是至关重要的。
当然,没有完美的提示,因为 LLM 在回答时总是会使用统计数据来学习模式,并使用概率来选择单词。 (你可以通过多次输入相同的提示来测试这一点。每次,你都会得到一个略有不同的文字回复。) 这意味着提示的艺术在于如何构建提示,以最大化我们得到我们想要的东西的机会。设计更好的提示以指导模型执行任务的实践被称为提示设计。好消息是我们可以用简单的提示做到很多事情。
让我们用一个简单的例子来说明,我们要求 ChatGPT 总结一段文字。
输入和输出如下所示。我们提交给处理的文本位于引号之间。


有许多使用场景与简单的提示相关。以下是一些关键词。
总结![]() |
生成对较大文本的主要观点或关键要素的简洁和浓缩概述。 |
|---|---|
改写![]() |
用于重新措辞或改写内容,同时保留其核心意义;为了提高清晰度、风格或适应不同的受众。例如:将复杂的科学文章转化为更简单的文本,不使用技术术语,供普通大众阅读。 |
生成![]() |
用于构思内容、头脑风暴和/或创意生成。例如:你正在撰写一个项目草案,需要使结果具有创造性。你可以使用 ChatGPT 作为头脑风暴工具来生成想法。 |
搜索![]() |
用于寻求事实性答案和澄清。例如:你正在研究关于气候变化及其对海洋生物影响的项目。你将“气候变化对海洋生物的影响”输入 ChatGPT,将收到关于该主题的各种观点和事实,包括它在训练期间学到的内容。如果 ChatGPT 连接到互联网,它将展示关于该主题的最新文章、研究论文和研究的范围。 |
提取![]() |
从文本中检索特定信息或数据。例如:从报告中提取城市名称。 |
分类![]() |
根据给定的标准将数据或信息分类或排序到不同的组中。例如:根据内容将电子邮件分类到“工作”、“个人”或“促销”等文件夹中。 |
聚类![]() |
根据共享的特征或模式将相关项目分组在一起。例如:你上传了一组客户评价,并要求 ChatGPT 将具有相似情感和讨论相似方面的评价进行聚类。 |
对话![]() |
模拟自然、上下文相关的交流,就像两个人之间的交流一样。例如:与一个以对话方式回应、理解上下文并提供有意义的答案的虚拟助手聊天。另一个例子是将 ChatGPT 用作导师。 |
翻译![]() |
将文本从一种语言转换为另一种语言,同时保留其意义和上下文。例如:使用语言翻译工具将一段英文转换为西班牙文。 |
情感分析![]() |
通过使用自然语言处理和计算技术来确定文本中表达的情感基调或情感。例如:分析社交媒体帖子,了解它们是否传达了对产品的正面、负面或中性感受。 |
2.3 构建提示的一般技巧
当与 ChatGPT 互动时,你提出提示的方式极大地影响了响应的准确性、相关性和质量。以下是一些基本指南:
– 明确你的需求
清晰度是确保你获得准确和针对性的答案的关键。使用直接的语言,避免含糊不清。比较以下提示的输出。
请为我总结一下[书籍标题]。
你能总结一下[书籍标题]中的关键主题和人物发展吗?
– 构建场景
上下文对于有意义的对话至关重要。提供背景信息以帮助 AI 理解你查询的上下文。例如:
锻炼有哪些好处?
在整体健康的情况下,你能详细说明为 70 岁的人推荐的身心锻炼吗?
– 通过迭代来细化你的提示。
尝试新的措辞、上下文和风格,以观察 AI 的响应如何演变。从观察到的模式中学习,进一步微调你的方法。不要害怕提出多步问题。提出一个问题并得到回答。基于那个回答,再提出另一个问题。根据需要多次重复,你将得到美妙的结果。
2.4 保留你的对话
ChatGPT 是一个强大的工具,可以生成大量内容。为了充分利用您的互动并跟踪您的对话,该平台提供了一个方便的功能。每次对话后,ChatGPT 都会在“历史”标签页中保存整个对话线程。“历史”标签页充当您与 AI 互动的存储库,记录了您的讨论。
这允许您随时回顾和继续对话。要访问它们,请导航到“历史”标签页,您将按倒序时间找到您的对话列表。点击任何对话可以重新进入讨论(或删除它)或随时开始新的对话。
如果您希望使用或分享您已经进行的对话,您可以采用传统的复制对话并将其粘贴到另一个平台(如文档、电子邮件或笔记应用)的方法。
为了进行更结构化和永久性的记录保存,ChatGPT 提供了下载对话的选项。如果您想保留离线副本,这特别有用。要这样做,请按照以下步骤操作:
– 打开侧边栏历史记录(点击左上角图标);
– 在“历史”标签页底部,点击选择设置/数据控制;

– 点击导出并按照指示操作。
2.5 实践练习
如您所知,ChatGPT 的潜在应用范围广泛——从协助研究和提供客户支持,甚至帮助作者构思想法。
a. 下面有一些简单的提示。测试它们,修改它们,并首次体验 ChatGPT 的工作方式。
| 总结通过提供新的、清晰的指导,调整提示词,以帮助 AI 生成符合您意图的摘要。 | 我想对产品的新功能[例如,手机型号]进行总结。重点关注相机功能和电池寿命。 |
|---|---|
| 请总结这项科学研究的关键发现,关于睡眠不足对认知表现的影响。强调对生产力的主要影响。 | |
| 请提供这份记录讨论正念冥想对减压益处的摘要。包括所有提到的实用技巧。 | |
| 改写通过提供新的、具体的目标来定制提示词。例如,使文本更简洁,改变语气为非正式,或简化复杂的概念。 | 请重新措辞这篇博客文章,讨论独自旅行者的旅行技巧。在保持吸引人的语调的同时,精简内容以便快速阅读。 |
| 请帮我重写我的论文摘要。我希望得到一个更简洁的版本,同时保留主要发现和关键影响。 | |
| *我需要这份[产品/服务]的更清晰的说明版本。简化步骤并确保语言对初学者易于理解。 | |
生成 调整提示以适应您的需求。例如,从教科书生成问题、生成旅行想法等。 |
为高中生创建一个引人入胜的人工智能*解释。使用简单语言和相关的例子来阐明人工智能的概念。 |
| 我需要一份详细的 比较,在 iOS 和 Android 之间。突出它们在用户体验方面的优势和劣势、差异。 | |
| 我有一份包含[清单成分]的成分列表。你能使用这些成分制作一份美味健康的食谱*吗?请建议烹饪技巧、调味料和步骤说明。 | |
搜索 通过提供新的清晰搜索条件来自定义提示,以收集相关信息。帮助我找到 [手机型号] 的评论。我想了解其功能、性能和用户体验。 |
|
| 我计划在[旅游目的地]度假。请收集有关历史地标*的信息,并为每个地标提供简要概述。 | |
| 我对学习如何开始写博客很感兴趣。请找到涵盖步骤、工具和最佳实践的全面指南*。 | |
提取 通过指定您想要提取的信息类型来调整提示,以收集相关细节。 |
请从关于人工智能未来的这篇文章中提取主要要点和收获*。 |
| 我需要从这篇关于气候变化影响的研究论文中提取任何相关的统计数据或数据*。 | |
| 从[小说标题]中提取主要角色的描述*,并详细说明他们的外貌和个性。 | |
分类 根据您的需求调整这些提示,通过调整标准和类别进行修改。 |
根据他们的行为和动机,将这个故事中的主要角色*分类为主角、反派或配角。 |
| 将此产品描述中提到的功能*分类到如可用性、性能和安全等类别。 | |
| 将这篇天文学文章中提到的观察到的现象*分类为行星、恒星或银河事件。 | |
聚类 通过提供 AI 清晰的指南来调整这些提示,以创建您的聚类。 |
我正在寻找根据客户偏好将我们的客户反馈*进行分群的方法。将提及类似功能或问题的反馈分组。 |
| 根据质量、舒适度、设计和合身度等属性,将我们服装线的产品评论*进行聚类。 | |
| 请将市场调研数据聚类成诸如消费者行为、产品需求和行业竞争等趋势。 | |
对话 根据您的偏好和对话的上下文调整和定制这些提示词。不要忘记指定助手的角色。 |
请帮助我通过与我扮演的语言教师进行对话来练习意大利语。让我们讨论我的周末计划。 |
| 我在工作中对一项新项目感到有压力。你能扮演我的个人教练,提供一些建议和技术来管理我的焦虑并提高我的专注力吗? | |
| 你是我的朋友。让我们就人工智能的最新发展进行辩论。你认为我们接近实现人类水平理解了吗? | |
翻译 根据您的特定翻译需求定制这些提示词。 |
请将我的信息翻译成普通话,同时保持专业语气。 |
| 我有一篇意大利语文章。你能阅读、总结并将其翻译成英语吗? | |
| 帮助我将这份用户手册中的技术说明从德语翻译成英语。 | |
情感分析 根据您希望分析情感的具体文本修改这些提示词。 |
对这些社交媒体评论进行情感分析,以评估观众对我们新产品的看法。 |
| 分析这份项目反馈中的情感,以评估我们的商业合作伙伴对结果满意度的满意度。 | |
| 对客户取消请求及其伴随的评论进行情感分析。确定问题是否与服务相关或情境相关。 |
b. 使用以下关键词创建自己的提示词集合:DESCRIBE, COMPARE, PREDICT, RECOMMEND, LIST, MEASURE, CATEGORIZE, ANALYZE, DEFINE, RANK, RECOGNIZE, IDENTIFY, EVALUATE, EXPLAIN, SELECT, ORGANIZE。

意大利佛罗伦萨街道上行走的一位年轻女性。她穿着一件引人注目的绿色连衣裙
-
OpenAI, "OpenAI 的技术解释"(2023 年 11 月访问;
openai.com/global-affairs/openai-technology-explained)。 -
OpenAI, "介绍 ChatGPT Plus"(2023 年 8 月至 10 月访问;
openai.com/blog/chatgpt-plus)。
3. 提示词设计
提示的结构和措辞在 ChatGPT 生成的响应类型中起着关键作用。微小的改动可能导致不同的输出,突显了模型对敏感性的反应。考虑到这一点并尝试不同的措辞可以帮助用户优化交互。这种适应性确保他们始终获得所需的信息。
我们可以将与语言模型的对话与给一位分享思想、提问或请求建议的朋友写信进行比较。你分享思想的方式、你提供的上下文以及你提问或请求措辞的方式极大地影响了你从对话中获得的内容。
同样,为了从与 ChatGPT 的对话中获得最大收益,你需要结构化你的信息。这就像是一个乐高游戏。我们将开始学习提示的构建模块以及如何使用它们实现不同的结果。
然后,我们将继续了解 AI 的词汇记忆工作原理以及如何利用它使你的对话自然流畅且连贯。
每一章的理论都十分精彩,但实践才是真正的魔法所在。动手经验将增强你的信心并提升你的提示构建技能。
3.1 提示结构
人工智能模型响应的精确性取决于你提示的质量。不同的措辞、上下文、示例和指示都起着塑造提示输出的作用^(1)。为了开始这段旅程,让我们首先了解提示的基本组成部分。以下列出了最重要的元素(图 3.1)。

图 3.1 提示的组成部分
在图 3.2 中,我们为每个组件提供了简单示例。

图 3.2 提示的组成部分:示例
我们将逐一学习它们。
上下文组件
就像与同事进行友好的聊天一样,在寻求建议或提出问题之前,设置场景和提供上下文,建立对话的基础是至关重要的。
通过使用上下文指示,我们使 AI 能够:
– 理解我们的总体目标
– 解码行话、缩写或首字母缩略词
– 生成与我们相关的输出
– 确保输出对区域和文化差异敏感。
示例 1:寻求写作建议
上下文:
我在写一篇关于可持续生活的博客文章,需要帮助组织我的想法。
示例 2:编程任务协助
上下文:
我在进行一个网站开发项目,需要帮助编写一个响应式导航菜单的代码。
示例 3:组织环境保护活动
上下文:
领域:环境保护
地点:澳大利亚内陆
时间:当代
场景:规划植树活动
期望视角:生态可持续实践
总体目标:组织一场成功的事件,促进社区参与环境保护。
AI 角色组件
与 AI 交谈时,接下来最重要的事情是分配给 AI 一个特定的角色。这使它能够承担不同的责任,如教师、语言教师或设计师。
指令 "扮演 [角色]" 为 AI 提供了互动的蓝图。有了这个角色在心中,AI 可以提供符合其定义角色的定制回答、见解和解决方案。
高级 GPT 引擎可以采用各种角色,包括:
– 作为人类专家,无论是作为提示工程师、分析师、教师、治疗师还是财务分析师。
– 作为工具运行,模拟 Linux 终端、JavaScript 控制台或 Excel 表格等功能。
示例 1:寻求写作建议
角色:
扮演写作顾问的角色。
示例 2:编程任务协助
角色:
扮演代码导师的角色。
示例 3:寻求定制旅行建议
角色:
你是一位旅行顾问,专门为预算有限的背包客制定个性化行程。
在这个角色(作为旅行顾问)中,ChatGPT 会提供定制旅行建议,建议经济实惠的住宿、交通选择和旅游景点,并帮助背包客规划成本效益高的冒险。
AI 个人性组件
这个提示的组件包括关于 AI 在整个对话中应该如何表现以及如何与你互动的具体指令。默认设置是 "ChatGPT,你是一个有用的助手。"
示例:准备历史课程
个性:
你是一个机智、知识渊博且略带讽刺的助手,喜欢讲述历史轶事。在提供精确信息的同时,你用一点幽默和古风魅力,使学习之旅变得愉快。
这种个性使互动充满活力、引人入胜的语气,以及一丝幽默,使对话既富有信息性又充满娱乐性。
AI 任务组件
指令 "执行 [任务]" 是我们希望模型执行的内容,即我们的直接请求。将其视为向具有特定专长的不同朋友分配任务。
指令 "执行 [任务]" 可以包括当前任务或更广泛项目中的一个步骤。
– 如果当前任务是更大项目的一部分,那么长期目标是什么。
– 现在要执行的任务:撰写、重写、生成、总结、分析、编码、聚类、提取等。
示例 1:寻求写作建议
任务:
提供组织要点和创建引人入胜的小标题的指导。
示例 2:编程任务协助
任务:
指导我使用 HTML 和 CSS 创建一个响应式导航菜单。
示例 3:制定餐单
任务:
为四口之家创建一周饮食计划,确保其平衡、营养,并适应素食饮食。包括各种菜系,确保每天有三餐和两次零食,并简要描述每餐和零食。
任务指南组件
然而,细化任务通常需要额外的[任务指南]。这些指南为 AI 提供指令,以更好地结构化任务执行:
– 领域知识(领域或行业)
– 源要求(例如,仅限科学期刊)
– 源的时间限制(例如,近期出版物)
– 方法论(例如,费曼方法论)、论证结构
– 数据隐私、伦理考量、反馈整合
– 复杂任务的清晰多步说明
– 根据不断变化的数据进行适应性调整
– 比较分析,包括优点、缺点和潜在结果
– 模型执行请求所需的数据(例如,要总结的文本)
示例 1:寻求写作建议
任务指南:
考虑轻松、信息性的语气。
建议子标题,以捕捉可持续生活的各个方面。
使用最近文章的例子。
示例 2:编程任务辅助
任务指南:
遵循以移动优先设计为最佳实践。
解释媒体查询在响应性方面的使用。
提供代码片段和解释。
示例 3:创建饮食计划
任务指南:
包括各种菜系,以保持计划的趣味性。
确保每一天都满足平衡素食饮食的营养需求。
简要描述每餐和零食,提及关键成分。
提供至少三种不同口味的替代餐食选项。
确保描述适合初学者,避免使用技术术语。
在末尾包含节省时间的饮食准备技巧部分。
输出格式组件
[输出格式]通过包含输出所有方面的指令进行概述:
– 类型(电子邮件、博客、评论等)
– 口吻(正式、非正式、学术、说服性等)
– 语气(第一人称、第二人称、第三人称)
– 长度、版本、格式(纯文本、表格等)
– 引用风格、视觉元素
示例 1:寻求写作建议
输出格式:
类型:博客文章
语气:非正式且信息丰富
语气:第一人称
长度:约 800 字
示例 2:编程任务辅助
输出格式:
类型:文本文档
语气:技术性和指导性
语气:第二人称
长度:全面指南
示例 3:创建饮食计划
输出格式:
以色彩丰富的表格形式呈现饮食计划,行代表一周中的日子,列包括早餐、午餐、晚餐和零食。
每个单元格应包含菜肴名称及简要描述。此外,提供替代餐食选项的单独列表,并在末尾以项目符号格式提供饮食准备技巧。
确保文档以 PDF 格式保存,使用清晰易读的字体,并在顶部添加标题。
输出受众组件
理解[受众]对于 AI 至关重要。在制定指令时,考虑消耗输出的“角色”。他们的教育水平、词汇量和预期用途都应该影响 AI 如何定制其响应。
示例 1:寻求写作建议
输出受众:
对环保生活方式感兴趣的普通读者。
教育水平:高中及以上。
示例 2:编程任务辅助
输出受众:
网页开发者和爱好者。
教育水平:需要编码知识。
示例 3:创建教程
输出受众:
内容针对 18-25 岁的年轻成年人,他们技术熟练,对数字世界充满好奇,并对社交媒体平台有基本了解。
他们重视直接、无术语的解释,并欣赏与他们日常数字互动相关的视觉和示例。
系统设置组件
语言模型,如 ChatGPT,在特定的环境中运行。例如,“温度”控制随机性,“max_tokens”限制响应长度,“top_p”影响文本多样性。使用[系统设置],我们可以设置以下一些参数的值:
– 我们想使用什么模型
ChatGPT 由不同的 OpenAI 模型提供支持。例如,GPT-4(生成预训练变换器 4)是 GPT 系列语言模型的第四代。模型越新、越大,性能越好。
– 我们希望模型有多大的创意(该参数称为“温度”,取值范围在 0 到 1 之间)
当您将温度设置为低值时,模型变得更加专注和可预测。当您将温度设置为高值时,模型生成的文本更加随机和富有想象力。
– 我们希望模型返回多少单词作为输出(max_tokens)
我们可以使用"max_tokens"来限制模型在生成响应时可以使用单词或标记的数量。
– 它应该考虑哪些单词作为生成文本下一部分的内容(top_p)
"top_p"代表"最高概率",它控制着模型生成文本的多样性和随机性。"top_p"值在模型生成常见短语和探索更创意语言之间取得平衡。
ChatGPT 的默认设置
模型:gpt-3.5-turbo
最大标记数:4096
温度:0.8
频率惩罚:0.0
存在惩罚:0.0
这些设置提供了创意和连贯性的平衡,适用于一般用例。
您可以调整设置以更好地满足您的需求。
示例 1:寻求写作建议
系统设置:
使用 GPT-4 模型。
将温度设置为 0.6 以获得创意但专注的响应。
限制响应长度为 250 字(max_tokens)。
示例 2:编程任务辅助
系统设置:
使用 GPT-4 模型。
将温度设置为 0.5 以获得创意和精确度的平衡混合。
限制响应长度为 500 字(max_tokens)。
记住,您不必每次都包含所有提示元素。这就像为旅行打包——您选择必需品,同时丢弃不必要的物品。从必需品开始,根据需要添加细节。
3.2 使用自定义指令引导对话
自定义指令有助于为 GPT 提供您将频繁使用的相同上下文和指导。模型将在每次响应时始终考虑这些自定义指令,从而消除您在每次交互中重复您的偏好或信息的需求。(您必须是 ChatGPT Plus 会员才能启用此功能。)
设置 ChatGPT 自定义指令
自定义指令就像您调整以根据您的偏好/便利性定制手机体验的设置和偏好。这是在长时间与 AI 交互时设置持久上下文。
要启用自定义指令,点击
你名字旁边的菜单,然后点击“设置和测试版。”使用切换按钮启用自定义指令功能。
此功能允许根据您的偏好定制 ChatGPT 的响应,并且可以在未来的对话中随时修改或删除。

如果您在与 ChatGPT 的对话中更改自定义指令,您需要开始一个新的聊天才能看到更改反映出来。
自定义指令在各个领域提供了无限的可能性,使 AI 辅助体验更加愉悦。例如,教师可以更轻松地使用 ChatGPT 来设计课程计划,而无需不断提醒 AI 交互的整体目标;内容创作者可以在 AI 生成的每篇文本中融入他们独特的写作风格、节奏和语气。
您可以通过使用和不使用自定义指令测试 ChatGPT,以了解此设置能为您做什么。
关键要点:
– 使用自定义指令来指定:
B 上下文:话语领域、场景和交互的整体目标。
B AI 角色(例如,数字货币专家):在整个对话中假定。
B AI 个人风格:确保对话的风格、语气、词汇、节奏和流畅性的一致性。
B 输出受众:调整响应。
B 偏好的 AI 系统设置。
– 当您与 ChatGPT 交互时,任务、任务指南和输出格式可能会根据您想要的响应而变化,您可能需要根据它们进行调整。
– 使用自定义指令可以为您节省大量时间。一旦您在另一个上下文中开始新的对话,不要忘记禁用自定义指令或设置一个新的指令。
3.3 上下文记忆
如果您与某人的对话相当长,可能会发生对话偏离轨道的情况。您交谈的人可能只会记得最后几十次互动,而完全忘记最初的主题。
这也适用于您与 ChatGPT 的长对话。
这种限制是所有语言模型的共同特点,被称为“上下文记忆”或“上下文窗口”(图 3.3)。
这是因为技术限制使得 AI 只能回忆有限的信息。如果这个限制用单词来表示,就称为“单词限制”。
6,000 个单词的单词限制表示模型在生成响应时考虑了过去 6,000 个单词的对话。

图 3.3 上下文窗口
表达这种限制的另一种方式是使用“标记”,在这种情况下,这种限制被称为“上下文窗口”。由于“标记”不仅描述了特定的单词,还包括模型在处理该单词时需要了解的一些其他上下文元素,它可能有不同的长度。因此,如果我们想将技术规范“上下文窗口”(以标记表示)转换为“单词限制”(以单词表示),我们需要使用平均值,每个标记大致对应 0.75 个单词。
让我们尝试一个简单的例子。
[单词限制] 以“单词”表示
[上下文窗口] 以“标记”表示
1 个标记 ~ 0.75 个单词(平均标记长度)
给定 1,000 个标记的上下文窗口,单词限制是多少?
单词限制 = 上下文窗口 / 平均标记长度
单词限制 = 1,000 个标记 / 每个标记 0.75 个单词
单词限制 ≈ 1,333 个单词
这里是最突出模型的上下文窗口:
表 3.1 最突出 LMs 的上下文窗口
| 模型 | 上下文窗口(标记) | 单词限制(单词) |
|---|---|---|
| GPT-4 Enterprise | 32,000 | ~ 24,000 |
| GPT-4 | 8,000 | ~ 6,000 |
| GPT-3.5 | 4,000 | ~ 3,000 |
上下文窗口限制对我们使用模型的方式有影响。我们的提示和模型响应的合并长度应大约为 1,333 个单词,以保持在给定的上下文窗口内(大约两页半的 A4 文本)。但我们如何处理这个问题呢?一种保持上下文的方法是控制输出并指定响应的长度。我们希望在我们需要简短答案时,AI 不要过于健谈。另一种方法是控制输入,例如,如果我们打算让 AI 概括一篇长文,我们可以将其分成可管理的块。
请记住,这两个例子都代表了一种简化的估计,实际的单词限制可能会受到各种因素的影响,包括标记化细节和模型能力的任何更新。2
3.4 提示的良好实践
-
ChatGPT 与谷歌的搜索引擎不同。相应地使用它。
-
与其打交道最简单的方法是提出很多后续问题——进行对话。
-
从几个案例开始“简单”,逐渐增加信息。
-
小心行事,不要输入任何个人信息。
-
请记住截止日期为 2022 年 1 月。在此日期之后提出的问题可能不会得到任何可操作的回复。
-
创建一个空间(文件、文件夹)来保存你最好的提示。
-
组织你保存的提示。
-
给 AI 足够的指导和思考时间。将任务分解为逻辑步骤。
-
使用提示组件来设定场景:上下文、总体目标、预期输出(格式、结构、长度、词汇)和输出消费者。
-
请求多个选项的答案,你可以从中选择。
-
请求 AI 以你自己的风格写作。如果没有任何指导或定制,ChatGPT 倾向于使用特定的写作风格,听起来权威且正式。一个有用的技巧是向 ChatGPT 提供一些你自己的写作样本,然后请求它分析你的风格并将类似的风格元素应用到新生成的文本中。
3.5 事实核查 AI
最重要的良好习惯是检查 AI 输出,评估模型提供的信息的准确性和可靠性。以下是一些你可以采用的认知验证的实际步骤:
– 从一般信息开始:首先向 AI 模型请求关于某个主题的一般信息。这可以为你提供一个初步的概述,并帮助你评估其在该领域的响应准确性。
– 寻找一致性:如果 AI 模型提供的信息与你已知或从其他来源学到的信息一致,这将增加响应的可信度。
– 检查日期和上下文:如果 AI 模型提供的信息是时间敏感的,请确保它是最新的。此外,考虑信息呈现的上下文;有时,上下文与信息本身一样重要。
– 多源交叉验证:在收到 ChatGPT 的响应后,将信息与多个可靠来源进行交叉验证,如学术论文、书籍或该领域的专家。如果多个来源确认信息,则更有可能是准确的。
– 对异常主张提出质疑:如果 AI 模型提供了复杂或异常的主张,或者它们与广泛接受的知识相矛盾,明智的做法是持怀疑态度。
– 使用批判性思维:运用你自己的批判性思维技能来评估提供的信息的合理性和逻辑性。如果某件事看起来好得令人难以置信或与你的理解不符,深入调查以验证。
– 评估来源可靠性:AI 生成的信息可能缺乏适当的引用或来自不可靠的来源。当信息没有归因于知名来源时,要谨慎。
– 核实技术细节:如果你处理的是技术细节或复杂概念,可以咨询该领域的专家以验证信息。他们可以提供非专业人士可能不会立即察觉的见解。
– 寻求澄清:如果你不确定响应的准确性,可以向 AI 模型提出后续问题,请求更详细的解释或额外的背景信息。
按照这些步骤,你可以在保持生成信息的高准确性和可靠性的同时,利用 ChatGPT 的生成能力。
3.6 实践练习
当你探索即将到来的示例时,你将获得有效应用这些提示元素的实际见解。根据你的需求调整和修改提示。
上下文中心提示:
上下文:
你是一位探索东京繁华街道的旅行博主。
助理角色:
GPT 助手,扮演知识渊博的旅游指南。
助理任务:
生成一段描述涩谷十字路口高峰时段繁忙气氛的吸引人段落。
所需输出:
输出一个约 150 字长度的非正式语调的博客风格段落。
任务特定提示:
上下文:
你是一位准备关于气候变化演示的学生。
助理角色:
GPT 助手,扮演科学研究员的角色。
助理任务:
总结关于森林砍伐对全球变暖影响的最新发现。
指令和数据:
使用过去五年内发表在信誉良好的科学期刊上的数据。
所需输出:
提供包含信息图表和表格的简洁摘要,针对学术受众。
ChatGPT 能够浏览互联网以提供“当前和权威”的信息,而不是被限制在截止知识范围内。
个性化输出提示:
上下文:
你是一位寻求升级电脑建议的科技爱好者。
助理角色:
GPT 助手,扮演技术专家的角色。
助理任务:
建议在合理预算内购买的高端游戏电脑的最佳电脑组件。
所需输出:
生成一份包括购买链接的推荐电脑组件的详细清单。
多步骤复杂任务提示:
上下文:
你是一位计划推出可持续时尚品牌的创业者。
助理角色:
GPT 助手,扮演商业顾问。
助理任务:
概述一个建立和推广品牌的逐步商业计划。
任务说明:
结合市场研究、竞争对手分析和环保生产策略。
所需输出:
提供一份包含标题、副标题和说服性语调的全面文档,针对潜在投资者。
比较分析提示:
上下文:
你是一位希望采用新锻炼计划的注重健康的人。
助理角色:
GPT 助手,担任健身顾问。
助理任务:
比较有氧运动与力量训练的利弊。
任务说明:
提供来自最近健身研究的基于证据的信息。
所需输出:
生成一个结构良好的表格或图表,突出每种锻炼类型的优缺点,旨在吸引那些希望改善其健身计划的人。
-
OpenAI, "使用 OpenAI API 的最佳提示工程实践"(2023 年 11 月访问;
help.openai.com/en/articles/6654000-best-practices-for-prompt-engineering-with-openai-api)。 -
在 2023 年 11 月的旧金山 DevDay 上,OpenAi 宣布了一个更大的 Token 窗口,128K 个 token,大约每个提示 300 多页。
4. 提示技术
你可以向 AI 提出几乎所有问题。有一点是关键。你问什么和怎么问,就是你会得到什么和怎么得到。在计算机编程的早期,描述程序质量与你得到的结果之间关系的表达是“垃圾进,垃圾出”。这意味着计算机的输出仅限于它们的输入。如今,这同样适用于 AI 提示。
按重要性和使用性对提示技术进行排名可能是主观的和情境依赖的。不同的方法可能根据任务的复杂性和期望的结果而证明更有用^(1)。通常,经验丰富的用户会发现哪些技术最适合他们的特定需求。
以下是一些基本技术,以提高我们与 AI 的交互。每种技术的有效性可能因情况而异。以下列出的最基本和最广泛使用的技术不会详细讨论:
– 自然语言提示,就像向人类提问一样简单地提问,
– 迭代提示,通过来回交互进行增量澄清,
– 纠正提示,向模型提供反馈并要求它自我纠正,
– 类比提示,要求 AI 通过类比进行思考。这有助于创造性问题解决和需要知识转移的任务。
随着 AI 技术的发展,可能会出现新的提示技术,或者现有的技术可能会变得更有或更不相关。
4.1 一次性提示
零样本和少样本提示描述了我们在没有示例(零样本)或少量示例(少样本)的情况下提供模型以引导模型执行新任务的交互。
一次性提示意味着制作一个简洁的提示,包含清晰的指令、上下文和具体细节。模型将根据这个单一提示生成响应。
一次性提示的目标是制作简洁、有效的提示,以最大限度地从单次交互中提取信息。
当你有明确的目标时,一次性提示非常有用,无需进行长时间的对话。我们已经在本书中多次使用它。结果与提示一样好,所以专注于制作好的提示。
好处:
– 在一次交互中获得所需的信息或响应。
– 节省时间(一次性提示简化了交互)。
– 允许 ChatGPT 在大段文本中建立联系。
通过基于经验发现的提示组成优化,你可以提高模型响应的质量和相关性。这是一个涉及对语言模型能力和提示构建艺术的深入理解的动态策略。
挑战:
– 在提示长度限制内构建一个全面的提示可能具有挑战性,尤其是在复杂任务中。
– 在保持提示简洁的同时平衡提供上下文的数量需要练习。
用例:
– 快速信息检索:当你需要特定信息或直接答案时,一次性提示可以提供即时结果。
– 简单查询:当你有直接的查询或指令时,一次性提示消除了长时间对话的需要。
– 特定任务:具有明确参数和定义良好目标的任务通常可以使用一次性提示有效地解决。
– 任务摘要:当你想让模型总结一个主题时,精心制作的单一提示可以产生简洁且相关的摘要。
实证发现
– 指令的措辞对模型响应的质量有重大影响。选择精确传达你意图的词语,避免歧义。
– 指令的顺序起着至关重要的作用。尝试不同的指令序列,以了解它们如何影响模型的解释和响应。
– 模型对上下文敏感,但过度加载上下文可能会导致混淆。
– 演示可能有所帮助,但模型有时会误解演示。
– 重复使用相同的上下文进行多个提示,然后平均结果。这种方法可以减轻上下文变化对模型响应的影响。
4.2 思维链提示(CoT)
思维链提示是用于需要逻辑推理或逐步解释的复杂问题的先进技术。目标是促进人工智能思维过程的透明度。
这种技术涉及通过链接一系列提示和响应来创建连续和不断发展的对话。每个后续提示都由模型的先前响应所指导,导致连贯且上下文丰富的对话。
CoT 是一种强大的技术,它利用模型的前期响应来创建动态和不断发展的对话。这种技术增强了与语言模型交互的自然性和丰富性。
过程从设置对话上下文或主题的初始提示开始。这个提示可以是一个问题、指令或陈述,以启动交互。
语言模型根据初始提示生成回复。这个回复成为后续提示的基础。后续提示参考模型响应,对话建立在早期交互的基础上,确保响应与已建立的上下文一致。
随着 CoT 的继续,交互自然发展。模型的回复由其先前输出塑造,导致动态和吸引人的对话,感觉更像人类。
好处:
– 对话自然流畅,模仿人类互动。
– 该技术允许复杂主题的逐步发展,使模型能够提供细微的见解。
– CoT 在探索多方面主题或构思想法方面效率很高。
– 由于每个提示都引用了之前的响应,重复的陈述有所减少。
挑战:
– 虽然该技术增强了上下文,但模型有时可能会误解不断变化的上文。
– 在多次交互中,响应的长度可能会累积,可能需要限制模型的冗长。
– 该模型可能会陷入循环,反复引用相同的上下文。
用例:
– 从不同角度探索一个主题,产生多样化的见解。
– (例如,对于作家)共同构思和开发情节、角色和故事弧。
– 为了构思复杂问题的解决方案,迭代地完善想法。
– 通过构建在先前模型响应的基础上来寻求创意想法和创新建议。
4.3 树状思维提示(ToT)
树状思维提示与 CoT 类似,但侧重于分支路径。正如树向各个方向分支一样,这种方法使您能够引导对话沿着不同的路径进行,每个路径都源自初始提示。它涉及根据模型响应提出后续问题或提示,从而创造动态和多角度的交流。
为了可视化这种技术,想象一个关于爱好的话题提示。它导致对话的不同分支。每个分支都深入探讨提到的某个爱好。
ToT 在讨论具有多种可能结果或决策过程中的复杂主题时特别有用。ToT 在 ChatGPT 的单次交互中创建多层次的对话,这些对话分支到不同的路径。
ToT 技术要求在保持对话的连贯性和上下文方面具备良好的技能。
好处:
– ToT 允许深入探讨一个主题。分支到不同的方面,您可以提取见解、想法和观点。
– 随着模型深入探讨主题的各个方面,这种技术导致更多样性。
– 对话的分支特性使互动保持吸引力和适应性,满足不断变化的思想和问题。
– 通过后续提示,您可以引导模型逐步了解特定领域或主题。
挑战:
– 随着对话分支,确保不同线程之间的连贯性和相关性可能变得越来越困难,可能导致响应碎片化。
– 在探索多个线程和维护对话连贯性之间取得平衡可能具有挑战性。
– 如果上下文没有保持清晰,模型可能难以在思想的不同分支之间无缝过渡。
用例:
– 适用于对模型进行深入访谈,让您能够跟进一个人的生活、职业或经历的各种方面。
– (用于头脑风暴)使用分支提示来探索不同的角度和变体,以激发创造力。
– 为了剖析复杂问题,将它们分解成更小的组成部分,分别分析每个方面。
4.4 连续提示
连续提示是跨多个会话进行丰富对话的重要技术,因为底层架构独立处理每个新会话,而不记得先前的会话。连续提示涉及构建引用先前会话的提示。当重新开始对话时,输入提示以刷新 ChatGPT 的记忆。
为了确保连续性,用户会在新会话开始时总结或引用早期交互中的重要细节。引用可以包括:
– 总结先前的对话结果
– 列出相关事实、决策或行动项目
– 突出显示任何重要未解决的问题或任务。
通过将这些元素纳入新会话的初始提示中,用户有效地“提醒”AI 先前的上下文,帮助保持连贯和相关的对话流程。随着语言模型的日益复杂,它们可能会发展出更长期记忆的能力,这可能会使连续提示变得不那么相关。
好处:
– 上下文连续性防止了断开和碎片化的交互。
– 连续提示鼓励模型提供更深入的见解和更深思熟虑的回应。
– 模型记得用户偏好、选择或先前的提示中的细节。
挑战:
– 模型能记住的信息量是有限的。(记住上下文窗口)
– 当对话包含多个线程时,连续提示可能具有挑战性。
– 平衡上下文的包含与自然语言流畅性可能很棘手,因为过度重复的引用可能会破坏对话节奏。
用例:
– 与学习技能或学科相关的任务;保持上下文连续性有助于在先前的课程和讨论的基础上进行构建,增强学习体验。
– 交互式故事;在创建交互式故事或叙述时,连续性确保角色和事件在整个对话中保持一致。
– 多步骤任务;保持上下文有助于个人助理提供相关和准确的信息。
4.5 连续密度提示(CoD)
连续密度提示是一种细微的提示技术,旨在精炼 AI 处理的信息,产生越来越密集和简洁的摘要。它不在标准 AI 的提示方法中得到广泛认可,但因其独特的增强内容丰富性的方法而脱颖而出,这种方法不会扩展长度。
在 CoD 中,AI 逐步融入更多复杂和实质性的信息——“浓缩”内容——同时遵守严格的字数限制。这种方法涉及从基本摘要开始,通过迭代提示,添加来源材料中的重要实体。挑战在于在不增加整体摘要长度的同时,压缩更多信息。
这种技术在生成需要每次迭代都提供更多细节和具体性的摘要时特别有效,鼓励 AI 高效地优先处理信息。
好处:
– CoD 培养了用更少的字数传达更多信息的能力,保持了简洁和相关性。
– 确保了必要的实体和概念,增强了摘要。
– 通过迭代地精炼摘要,AI 的输出变得更加精确。
挑战:
– 在引入新实体同时保持摘要长度需要技巧性的提示制作。
– 存在着将复杂信息过度简化的风险,以满足字数限制。
– 在增加密度的同时确保摘要保持连贯性和上下文准确性可能具有挑战性。
用例:
– 帮助学生和研究人员创建复杂学术文本的摘要。
– 产生高密度信息内容而不冗长。
– (在数据密集型领域)通过关注最重要的数据点来总结报告。
示例框架:
初始提示:
任务:
编写以下文本的摘要,不超过 100 字。"[TEXT]"
CoD 流程:
第 1 步:
了解在提供的 TEXT 中构成“新实体”的内容。
第 2 步:
识别一个在现有摘要中缺失的“新实体”。
第 3 步:
编写一个改进的摘要,包含上一版本的所有实体以及“新实体”。
循环:
重复循环十次以增强实体密度。
指南:
为了维持字数限制,使用缩写,消除多余的语言,并不断精炼摘要以保持流畅和清晰。
4.6 思维骨骼法提示(SoT)
思维骨骼法(The Skeleton-of-thought approach)在详细阐述细节之前,结构化提示以概述推理的“骨骼”或基本要素。这就像在添加墙壁和屋顶之前先建造房子的框架。这种技术允许你为对话构建一个清晰且逻辑的框架,为详细探索奠定基础。
想象一个提示要求制定一个启动小型企业的计划。SoT 会在深入探讨每一步的复杂性之前,列出基础步骤。
SoT 在处理需要先建立坚实基础理解才能进入复杂领域的多方面问题或概念时特别有益。它有助于与 ChatGPT 创建结构化和全面的对话。
思维骨骼法(SoT 技术)因其组织上的好处和对复杂对话的清晰性而非常有价值。
好处:
– 为了建立一个清晰的基线,确保复杂信息得到良好的组织。
– 促进清晰性和对对话方向的更好理解。
– 培养信息的逻辑流程。
– 在建立框架后,讨论可以以专注的方式深入细节,直接针对每个点。
挑战:
– 从过于简化的提纲开始,可能会遗漏理解复杂问题的重要细微差别。
– SoT 的结构性质可能会限制对话的流畅性,使其变得不那么动态。
– 随着对话的进行,确保细节的扩展与原始提纲保持联系可能变得更加困难。
用例:
– 以结构化的方式教授概念,在进入复杂性之前先阐述基础知识。
– 制定策略,提供明确的计划,并建立初步步骤。
– (对于作家和内容创作者)在详细阐述之前先概述文章或故事。
– 在研究中,在详细说明具体程序和测试之前,先概述研究的方法论。
这种技术在需要 AI 产生结构化输出的场景中证明是有效的。
示例:
任务:
撰写一篇关于全球变暖的演讲稿。
任务指南:(框架)
全球变暖的主要原因:二氧化碳排放、甲烷、森林砍伐、自然碳汇的丧失、土地利用、人类行为、工业化。
4.7 练习
1. 一次性技术
测试这些提示,并根据您的需求进行调整:
快速定义:
定义“光合作用”并解释其在生态系统中的重要性。
创意写作:
创作一个设定在未来城市中,梦想作为一种货币进行交易的短篇小说。
编程帮助:
编写一个 Python 函数,计算给定正整数的阶乘。
历史背景:
解释大宪章的重要性及其对现代民主发展的影响。
食谱请求:
分享一个简单素食意面食谱,配以奶油番茄酱。
解决问题:
解方程 x² - 5x + 6 = 0 并提供两个解。
2. 思维链技术
初始提示:
你是一位熟练的大厨。告诉我关于你的素食特兰西瓦尼亚炖牛肉的事。
模型响应:
这道菜是对该地区丰富的烹饪传统的致敬,以野生蘑菇为主角。柔软、大地的松露和牛肝菌在浓汤中翩翩起舞,融入了当地香草的低语。
后续提示:
分享您寻找关键原料的方法,强调真实性的重要性。
模型响应:
我们的野生蘑菇来自特兰西瓦尼亚本身的原始森林,由熟练的采集者精心挑选。香草在我们自己的花园中种植。红酒是当地葡萄园的产品,为这道菜注入了土地的风土,确保每一勺都是特兰西瓦尼亚的味道。
后续提示:
请阐述在特兰西瓦尼亚野生蘑菇牛肉炖菜中实现口味和质地平衡所采用的烹饪技巧。
模型响应:
制作这道匈牙利牛肉炖菜需要一系列烹饪技巧。野生蘑菇先煎炒至增强其自然风味,然后轻轻炖煮在浓郁的肉汤中。焦糖化的洋葱和大蒜,是特兰西瓦尼亚乡村魅力的证明,为炖菜增添了深度。随着牛肉炖菜的炖煮,红酒逐渐与蘑菇融合,创造出和谐的口味结合。一撮烟熏辣椒为这件杰作画上了完美的句点,增添了复杂层次和一丝特兰西瓦尼亚的神秘感。
3. 思维树技术
初始提示:
请告诉我你最喜欢的爱好。
模型响应:
我最喜欢的爱好之一是绘画。我觉得它非常放松,并允许我表达我的创造力。我也喜欢在自然中徒步旅行,因为它给我一种宁静感,并让我从科技中解脱出来。
分支 1 - 追问提示:
请告诉我更多关于你的绘画爱好。你喜欢画什么主题?
模型响应(分支 1):
说到绘画,我偏爱风景和鲜艳的色彩。我经常从自然场景中寻找灵感,比如海洋上的日落或茂密的森林。我喜欢玩不同的色调来捕捉自然世界的美丽和情感。
分支 2 - 追问提示:
你最喜欢的徒步地点有哪些?
模型响应(分支 2):
徒步旅行是我放松和充电的绝佳方式。我在家附近探索了一些美丽的步道,比如附近山上的风景步道和一条宁静的森林小径。新鲜的空气和自然的声音确实让人焕然一新。
1。OpenAI,"提示工程"(2023 年 11 月访问;platform.openai.com/docs/guides/prompt-engineering)。
5. 扩展 ChatGPT
我们最初只是用手机打电话。然后,随着手机变得越来越智能并能连接到互联网,我们可以发送短信、电子邮件、使用社交媒体,并运行提供新功能的应用,如金融服务。后续更新为我们提供了新的设置和个性化选项,我们不时地发现新的功能。我们也期待智能手机的操作系统将定期更新,并添加新功能。
我们称之为智能手机生态系统,其中更新和新功能代表了智能手机的不断进化,不断适应新的挑战和用户需求。
对于 ChatGPT 及其不断发展的生态系统来说,情况类似。每一个额外的功能和特性都代表了一个附加的配件或实用工具,使得 ChatGPT 在现代社会中成为一个更加多才多艺且不可或缺的工具。
第一个是有浏览功能,从浩瀚的互联网宇宙中获取新鲜信息。它就像智能手机的浏览器应用一样,实时访问大量信息。网络浏览功能使 ChatGPT 能够提供比其训练数据更新的信息,而截至 2023 年 9 月,其训练数据仅更新至 2022 年 1 月。
第二个是使用插件的能力。插件可以比作您可以在智能手机上安装的无数应用,每个都增强了手机的功能,并提供专门的工具和功能。插件的大千世界允许第三方服务提供 ChatGPT 内部未构建的能力。例如,一个插件可能提供数学计算、语言翻译或数据库查询。
并且这种类比并未停止。在前一章中引入的定制指令,就像您调整以定制手机体验的设置和偏好一样。而我们在下一页将要遇到的“高级数据分析”——可以比作手机的诊断工具,深入系统性能,确保一切运行最优。
本章承诺提升您对 ChatGPT 的理解,并充分利用其全部潜力。让我们共同踏上这段启迪人心的旅程吧!
5.1 使用 Bing 浏览
我们的信息景观的本质始终在变化。新闻发生,科学发现出现,技术发展,文化转变。一个在某个时间点冻结的静态数据库无法希望跟上这种最新信息的无情潮流;因此,赋予 ChatGPT 网络浏览能力的想法。
由于“谨慎起见”,Bing 浏览功能于 2023 年 7 月被禁用,并于 2023 年 9 月恢复。OpenAI 此后添加了更新,包括允许网站控制 ChatGPT 如何与之交互的功能。
ChatGPT 的浏览功能在模型庞大的内部知识和不断变化的互联网动态世界之间架起了一座桥梁,为用户提供更及时、更全面的查询响应(图 5.1)。
-
用户启动浏览:需要最新信息的提问。
-
模型解释查询:模型解释您的请求,将其制定成适合搜索引擎的查询。例如,如果您问,“电动汽车的最近进展是什么?”,它可能翻译成搜索查询“2023 年最新电动汽车进展。”
-
获取搜索结果:模型随后将检索一系列搜索结果,类似于您在搜索引擎中输入查询时看到的结果。它实际上并不像人类那样“点击”链接,而是从搜索结果中获取内容快照。
-
数据提取和分析:模型扫描这些结果,识别最相关的信息片段。然后它提取并处理这些数据,以形成对您问题的连贯回答。

图 5.1 ChatGPT 浏览功能方案
-
构建响应:拥有提取的数据“在手”,模型综合生成一个全面的答案。这涉及到从多个来源拼接信息,确保答案既相关又具有信息性。
-
响应交付:最后,模型根据它找到的最相关信息,为您提供格式整洁的响应,包括相关链接。
ChatGPT 浏览 Bing 是一个测试功能(仅对 ChatGPT Plus 订阅者开放),允许 ChatGPT 搜索互联网以回答受益于最新信息的提问。
启动 ChatGPT。您将看到一个友好的界面,准备好进行对话和探索。
转到设置。点击“启用 Bing 浏览”并切换它。

选择“使用 Bing 浏览”功能并开始您的第一个查询。

输入一个问题或陈述。比如说,“ChatGPT 的多模态能力最新进展是什么?”现在 ChatGPT 将利用 Bing 浏览网络,并为您提供最新的见解。

当然,您可以与 ChatGPT 的响应进行互动。如果您点击参考 1,浏览器窗口将打开,您可以检查信息的来源。
提出后续问题并细化您的查询,以深入了解具体细节。这是一个教育和启迪的对话。
例如,假设您搜索“生成式 AI 应用”。在查看结果后,您决定深入研究一个特定领域,比如“音乐制作中的生成式 AI”。您细化查询,现在 ChatGPT 将协助您探索特定于 AI 在音乐制作中生成角色的文章或资源。这种查询细化的迭代过程有助于缩小焦点,并根据不断变化的需求或查询提取更精确的信息或资源。
值得一提的是,ChatGPT 的系统不存储个人数据,并且与 Bing 的每一次浏览会话都是短暂的。这意味着一旦您的问题得到解答,所有相关的浏览数据都会被丢弃,删除用户特定请求的历史记录。
5.2 使用插件拓展视野
插件是为像 ChatGPT 这样的 LLM 设计的工具,旨在将它们连接到外部第三方服务或工具(图 5.2)。这些插件背后的公司可能对您的数据有不同的政策,不符合 OpenAI 的道德准则。请确保您阅读了政策文档。

图 5.2 ChatGPT 插件功能方案
ChatGPT 插件的应用场景非常广泛^(1);以下是最常见的:
– 访问网络上可用的外部数据。
– 访问私有数据。
– 获取实时信息(例如新闻)。
– 帮助用户完成在线操作(如预订)。
如何安装 ChatGPT 插件
• 打开 ChatGPT。在左下角,选择“设置”>“测试功能”,然后切换“插件”设置。
在 ChatGPT 中,选择“新建聊天”。
• 将 ChatGPT 模型切换到 GPT-4。
• 从下拉菜单中选择“插件”>“插件商店”
• 现在,选择你想要安装的 ChatGPT 插件。

在安装和使用任何插件之前,请记住检查“开发者信息”。您可以在插件描述的底部找到它(见上图)。这是必须的,因为隐私和数据伦理不是由 OpenAI 提供,而是由提供插件的第三方提供。阅读使用条款。它可能会将其存储在其数据库中,并与其他商业伙伴共享。
本网站上列出的内容和服务仅用于信息目的,并不构成专业建议。它们未经任何提及实体的审查或批准。因此,你应根据此处提供的信息采取行动和做出决定。
安装应不超过一分钟。要卸载,只需再次选择插件即可。然而,目前还没有“所有插件”列表,以便轻松取消订阅。此外,没有排序插件的功能,因此你必须滚动浏览每一页,直到找到你想要的内容。搜索功能将在后续更新中提供,但拥有这些 UI 功能将使其实用性更强。
你如何使用 ChatGPT 插件取决于你安装的插件。但 ChatGPT 插件的使用方法与常规 ChatGPT 类似;你提出问题,ChatGPT 提供答案。答案的准确性取决于你的提示质量,但现在也取决于 ChatGPT 插件的质量。请记住,ChatGPT 插件是一个测试功能。ChatGPT 插件生态系统尚未完全运行,尽管有可用的插件数量,但只有少数按预期或我们希望的方式工作。
使用任何插件时请谨慎。尽管它们在 ChatGPT 插件商店中可用,但它们尚未经过本书作者的验证。使用它们的风险自负。可能存在潜在的安全风险。
5.3 图像输入功能
图像输入是 ChatGPT 文本界面的扩展,是视觉数据表示和文本理解之间的桥梁,使数据解释更加易于访问和有洞察力。
这种功能允许用户上传图像文件,然后 GPT 引擎可以分析并解释它。(只需在命令字段中点击“文件上传”按钮,见图 2.2)
一旦图像被处理,引擎提供文本描述,回答有关图像的问题,甚至根据其内容生成故事或假设。这种多模态方法增强了引擎的通用性,使其不仅是一个基于文本的工具,而是一个更全面的助手,能够通过文本和视觉元素进行理解和交互。
尽管 OpenAI 的平台旨在优先考虑用户隐私,并且图像不会被存储或用于其他目的,但一般规则是确保要上传的图像不包含可识别的信息。
这里有一些用例。
分析图表
您可以上传各种类型的图表,如簇状柱状图、饼图或折线图。GPT 引擎可以解释视觉数据并将其转换为文本信息。这对于总结关键见解、发现趋势或识别异常特别有用。
例如,您上传一个销售业绩图表,引擎会为您提供简洁的摘要,指出哪个季度销售最高以及哪个产品表现最佳。这种能力为那些喜欢以视觉方式消化数据但同时也希望获得文本分析带来的细微理解的人提供了额外的便利。



分析 X 射线
上传一张 X 射线图像并请求对图像的一般概述或提出具体问题。GPT 引擎分析视觉信息,将发现与文本信息数据库相关联,并提供相关见解。然后您可以与引擎进行对话。这对于没有医学专业知识的人来说特别有用,它提供了对 X 射线图像显示内容的简单语言理解。
引擎提供了一般理解;它可能无法捕捉到训练有素的眼睛会注意到的细微或高度专业化的细节,因此,它不能替代合格的放射科医生或医疗专业人员的分析。
这可以应用于多个领域的用户,从试图快速理解 X 射线图像的医学学生开始,到远程健康援助,在那里即时专业见解不可用,以及在研究方面,科学家们试图对大量 X 射线图像进行分类或理解。



从图像中抓取数据
当涉及到从图像中抓取数据时,系统使用光学字符识别(OCR)来检测和解释图像中的字符。一旦文本被提取,系统就可以根据用户的准则解析和结构化数据。


设计分析
图像输入能力使 AI 能够通过处理图像中的视觉数据来分析用户界面(UI)设计。首先,AI 识别并提取 UI 的独特组件,如按钮、文本字段、图像、图标和导航栏。然后,AI 评估元素的空间排列,衡量视觉层次、对齐和分布。对于颜色分析,AI 评估颜色组合、对比度和调色板,以确定和谐、可读性和对设计原则的遵守。通过使用 OCR,评估字体、大小、间距和印刷对比度,以确定可读性和视觉吸引力。
另一步是一致性检查。AI 检查不同 UI 部分或页面中设计元素的一致使用。尽管它不能与静态图像交互,但它可以根据常见的设计模式推断潜在的交互元素。
该过程包括将图像中的设计与既定的设计原则和模式进行比较。基于分析,AI 可以提供改进的建议。



线框图转代码
使用图像输入能力将线框图转换为代码是 AI 中一个不断发展的应用。
该过程与在“设计分析”中解释的过程类似。AI 在线框图中识别标准 UI 组件及其空间关系。基于元素和关系,AI 生成相应的 HTML、CSS 或其他相关代码。此代码结构化以重新创建线框图中表示的布局和设计。如果线框图包含特定的样式(如颜色、字体或间距),AI 可以提取这些样式并将其转换为适当的 CSS 属性。该引擎可以从线框图中推断响应式设计规则,确保生成的代码在各种设备尺寸上表现良好。
将作者的情节图转换为文本
将作家的图表转换为文本涉及多个步骤。使用 OCR 技术提取书面文本。文本揭示了角色名称、情节要点和关系,或故事注释。下一步是确定文本元素之间的关系,这基于它们在图表中的空间位置、连接器和分组。这有助于确定情节点之间的顺序、层次或关系。除了文本中明确表达的内容外,AI 还能识别图表中的各种形状、线条或符号。(例如,箭头可能表示顺序,而圆圈可能代表主要事件或角色。)识别出的形状可以为提取的文本提供上下文,如特定事件、转折点或故事的其它结构组成部分。有了提取的信息,AI 构建代表故事图表的句子或结构化文本。显然,初始输出可能需要人工审查和编辑,以确保准确捕捉作者的意图。
研讨会笔记可以以相同的方式进行处理。
图片到食谱
使用图像输入功能将菜肴图片转换为食谱是一个雄心勃勃的任务。这项功能尚未文档化,但可以按以下方式处理。AI 使用计算机视觉模型分析菜肴的图像,通过识别纹理、颜色和形状来识别关键成分。例如,它可能识别出花生、鸡肉或罗勒的视觉特征。然后,系统根据菜肴的整体外观对其进行分类,这一步骤缩小了可能的食谱范围。(例如,分层外观可能表明是千层面,而装有汤和面条的碗可能被识别为某种汤。)一旦确定了主要成分和菜肴类型,系统就可以交叉引用食谱数据库,建议一个或多个与视觉输入密切匹配的食谱。
值得注意的是,虽然 AI 可以根据视觉数据做出有根据的猜测,但仅从图像中实现完美的食谱匹配是具有挑战性的。像香料、烹饪技术和不显眼的内部成分等因素可能会使提取复杂化。



5.4 临时限制
ChatGPT 的魔力很大,但它有其局限性。每个用户在深入使用之前都应该了解这些限制。了解这些可以帮助避免意外的惊喜。但请注意,以下简短的限制清单并不涵盖所有内容。ChatGPT 可能会用其华丽的言辞误导,因此你必须仔细检查其答案。这可能比你自己查找资料更难。ChatGPT 是一个工具,而不是批判性思维的替代品。
就像任何工具一样,过度依赖 ChatGPT 可能是一个陷阱。它提供快速、广泛的见解,但交叉核对和验证关键数据至关重要。多样化信息来源,与专家合作,并定期通过人工检查来使 AI 交互保持平衡,这可以在效率和准确性之间取得平衡。
1. 幻觉
ChatGPT 说话很好,但这并不意味着它总是正确的。它对文字的处理如此之好,以至于即使内容不正确,也能让人听起来很合理。这种解释与 ChatGPT 的设计和训练数据有关。按设计,ChatGPT 是根据前面的单词来预测下一个单词的。它的唯一任务是自动完成,但它可以非常连贯地继续自动完成,以生成长文本。ChatGPT 自动完成的质量和准确性反映了它训练数据的质量和准确性。但这并不总是导致事实准确性,因为文本数据并不总是真理的来源。在训练过程中,ChatGPT 使用的互联网文本数据比科学书籍多。而且,错误信息很多,大约有 30%是错误的。
现在,即使有这个限制,ChatGPT 通常也能给出正确的答案,这很酷!这可能是由于维基百科等地方的良好信息。但,作为一个经验法则,彻底核实内容至关重要。务必检查日期、地点、数字以及任何看似非常具体的声明。
2. 算术与数学
当您向 ChatGPT 询问数学问题时,有时它会出错。如果它以前见过,它可以猜出简单的答案。它在数学方面正在变得更好,但还没有完全达到那个水平。这是因为 ChatGPT 没有真理的来源;它依赖于识别它以前看到的数学问题语言中的模式。
3. 引用
ChatGPT 在引用方面有困难。它猜测很多。它知道引用的样子,可以编造听起来很专业的标题,但其中大部分并不真正存在。该模型无法实时访问外部来源(除非您使用浏览插件),因此它根据在训练期间学到的模式生成它“认为”可能是正确引用的内容。
4. 一致性
ChatGPT 可以给出正确的答案,但解释可能会出错。这种不一致性可能是因为模型可能从训练数据中的模式中获取正确的答案,但未能理解背后的逻辑或事实,导致解释不正确。
当前事件:ChatGPT 的信息截止到 2022 年 1 月。如果您询问最近的事情,它会编造答案。ChatGPT 没有实时访问互联网,所以它就像是在问一个已经脱离了现实一段时间的人。
人工智能的旅程漫长但充满希望。今天的问题可能为明天的奇迹铺平道路。

由砂岩形成的沙漠景观和一辆带有车顶架的越野单车
1。Maria Diaz,“如何使用 ChatGPT Plus:从网页浏览到插件,”在 ZDNET(2023 年 10 月访问;www.zdnet.com/article/how-to-use-chatgpt-plus-from-web-browsing-to-plugins/)。
6. 扩展 ChatGPT:DALL-E
6.1 什么是 DALL-E?
DALL-E 是一个 120 亿参数版本的 GPT-3,使用文本-图像对数据集进行训练.^(1)
GPT-3 的 Transformer 架构在处理数据序列方面表现出色。
在学习过程中,图像被转换成一系列离散的标记,这个过程类似于对文本进行标记化,DALL-E 在图像及其对应的文本标题对上进行了训练。该模型通过处理来自两种模态的标记序列,学会将文本与图像中的视觉概念相关联。
DALL-E 拥有一系列多样化的功能,包括创建动物和物体的拟人化版本,以合理的方式结合无关的概念,渲染文本,以及将变换应用于现有图像。
它接收文本和图像作为包含最多 1,280 个标记的单个数据流,经过训练,使用最大似然生成所有标记,一个接一个。
DALL-E 能做什么?
– 通过融合各种概念、属性和风格,将自然语言描述转换为独特的视觉图像。
– 生成原始图像(分辨率高达 1024x1024 像素)。
一旦生成图像,你可以使用任何首选的编辑工具下载和修改它们。
DALL-E 的最新版本(第 3 代)带来了新功能:
– 在图像中生成可读的文本。
– 描绘历史人物和知名名人。
– 包含符合伦理的公共使用过滤器。
– “超画”功能将图像扩展到原始框架之外,以创作新的构图。
– “内画”功能允许在图像中进行选择性替换。
– 根据标题调整真实照片,添加或删除对象、阴影、反射和纹理等元素。
– 生成高分辨率图像。
为了节省资源,DALL-E 会根据你的提示词生成变体(大多数情况下是扩展它),渲染 4 张图像。你可以选择你喜欢的任何图像,并要求 DALL-E 在下一个提示中根据你的需求进行修改。
如果你的提示词长度为 76 个单词,DALL-E 会将其截断。
DALL-E 生成的图像和版权
首先,任何由 DALL-E 生成的艺术品并不完全属于你。这意味着你可以使用由 AI 创建的图像,但它们不是专有的;其他人也可能使用它们。其次,使用 DALL-E 修改受版权保护的材料可能导致侵权,即使结果看起来不同。
我们建议负责任地使用 DALL-E 并尊重知识产权边界。
6.2 第一张图像
使用 DALL-E 3(风格化的 DALL·E 3)进行设计是一个简单的过程。本指南将指导你生成你的第一张图像。
第 1 步:在搜索栏中输入你想要的文本。或者,探索提供的示例(向下滚动,将提供几个样本描述)。
第 2 步:DALL-E 3 通常会返回四张不同的图像结果。如果没有任何一张符合你的期望,考虑细化你的描述。如果你对某张特定的图像感兴趣并希望探索变体,将鼠标悬停在所选图像上,点击右上角的
。选择“生成变体”以查看不同的版本。
第 3 步:一旦你选定了一个喜欢的图像,就可以通过内置的图片编辑器(截至 2023 年 9 月,ChatGPT DALL-E 模式中尚不可用)来深入了解。尝试不同的提示词并相应调整,以达到最佳的视觉效果。
6.3 提示结构
在本节中,我们将探讨 DALL-E 提示结构。我们将学习如何构建好的提示,理解使它们发挥作用的不同部分,并从 AI 中获得最佳图像。
| 提示组件 | 描述 | 示例 |
|---|---|---|
| 上下文 | 这是提示的核心。该部分描述了整体主题、图像的叙事。这为图像应该代表的内容创造了舞台。指定时代或历史时期。 | 指定主体放置的背景或环境:森林、外太空、18 世纪舞厅、水下城市或末日废墟,包括一天中的时间以及额外的元素如雨、蝴蝶、雾、漂浮岛屿、全息图、遗迹等。(例如,黎明时分宁静的山景;19 世纪一个下雪的繁忙城市街道)。 |
| 图像类型 | 它设定了图像的基本风格方向。图像的类别或风格定义了你想要的是照片、插图还是其他类型的图像。 | 照片、油画、插图、素描、卡通、矢量图、水彩画、渲染、虚幻引擎、3D 渲染、octane 渲染。 |
| 图像元素 | 主题大小和位置:主题的大小(小、中、大)和首选位置(前臂、背部等)情感基调:你希望图像传达的情感,如快乐、神秘等。文化参考:你想要融入的文化元素。必须包含的元素:所有非协商性的具体项目或想法。你也可以包括图像元素之间关系或动作的描述。必须避免的元素:你不想在图像中出现的所有元素或项目。 | 猫、山、宇航员、机器人、城市景观、花朵、龙等。(例如,一只龙栖息在悬崖上;一位女士在树下读书)。指定主题的大小相对于其周围环境或与其他主题的比较。它也可以用来创造超现实的尺寸比例。 |
| 图片背景 | 背景、环境或场景。它们可以改变主要元素的解释。 | 海滩日落;雪山的山顶。 |
| 图片布局和尺寸 | 图片的方向和分辨率。 | 宽(1792×1024)正方形(1024×1024)高(1024×1792) |
| 图片光线和色彩调色板 | 该组件指定图像应遵循的特定颜色集或情绪。想法是颜色设定了图像的情绪和美学,影响了其整体感觉。 | 光源、强度、环境光和光学效果。单色、粉彩、鲜艳、棕褐色、霓虹、冷色调等。(例如,温暖的秋色;夜晚场景的冷蓝色和紫色)。 |
| 图片附加信息 | 关于图像元素表示的附加指南。 | 狂欢节上的一群多样化的人;亚洲男性科学家在实验室。 |
| 风格参考 | 想要模仿的图像所需的艺术外观的特定风格,无需提及具体近期艺术家。不一定必要。 | 印象派风格带有笔触,新艺术风格带有华丽流畅的线条,毕加索风格,Autochrome,监控,达盖尔式,一次性相机,双重曝光,航空摄影,T 台,时尚等。 |
| 格式与质量 | 图片的首选格式和质量。通常,默认图片格式(如 PNG 或 JPEG)就足够了,但特定用例可能需要特定格式。 | 格式:PNG,JPEG。图片质量,如高清。 |
| 随机数种子 | 随机数种子初始化模型的随机过程并确保确定性行为。种子通常是非负整数。在 64 位系统上,种子可以从 0 到 18,446,744,073,709,551,615。默认值是 5,000。具有不同种子的相同提示将产生不同的结果。 | 一个数值,它从相同的提示创建图像的变体。用于生成变体或确保图像之间的一致性。 |
| 摄像机设置 | 对于旨在模仿专业相机输出的图像,提示应指定摄像机设置以实现高质量的结果,例如:光圈、焦距、ISO、模式(自动或手动)和白平衡。添加每个设置的用途说明(例如,为什么选择大光圈或特定的快门速度)。 | 例如,f/2.8 的大光圈以实现浅景深,1/60 的快门速度以捕捉运动而不模糊,以及 ISO 800 以适应低光条件。35mm 的焦距以捕捉场景而不产生过度扭曲。 |
6.4 使用 DALL-E 进行设计
我们将举例说明几个通用的提示,这些提示可以用来加速您的创造力。
我们将揭示使用 DALL-E 3 来节省设计项目时间和降低成本的最佳方法。
由于 DALL-E 持续发展和改进,当您测试提示时,预期它们的工作方式会有所不同。
用方括号内的占位符(元素)来调整提示,以适应你想要生成的特定照片。
电影海报
通用提示:
为名为“The Guns of Navarone”的电影创建一张海报。
历史时期:第二次世界大战。
宽图像:1792×1024
在日落时分,地中海边的高山。
山顶上,士兵和两个炮兵阵地都朝向大海。
在海平面上,地平线处,一艘战舰。
4K 图像。
请在海报上添加电影标题,“THE GUNS OF NAVARONE”。
任务完成后,给我你使用的图像种子。
发生的事情是 DALL-E 重新措辞了我的提示:
《纳瓦罗恩的枪》4K 宽屏电影海报,具有逼真的视觉效果。背景设定在第二次世界大战的历史背景下,场景在夕阳西下时展开,位于俯瞰地中海的山坡上。在山顶上,士兵们站在两个炮兵阵地旁边,所有炮口都指向大海。在遥远的地平线上,一艘战舰投下了轮廓。海报上大胆且突出地展示了标题“THE GUNS OF NAVARONE”。
生成的海报远非理想。你可以注意到我们要求的内容和得到的内容之间存在几个差异。


但我们有图像种子。使用相同的提示和相同的图像种子,结果将是相同的图像,方便演示。
尝试你的示例,迭代,并使用不同的图像种子以获得最佳结果。
书籍封面
这里有一个通用的提示,帮助你开始:
设计一本名为'[书名,例如'Whispers in the Shadows']'的[类型,例如'神秘']小说的吸引人的封面。封面应包含[你想要的主要元素,例如'一位女士在雾蒙蒙的背景中手持灯笼的剪影']。主要颜色应为[首选颜色,例如'深蓝和紫色']。作者的名字'[作者的名字,例如'Jane Doe']'应出现在底部。
示例:


标志
通用提示:
商业或品牌名称:[应在或周围显示的名称]
行业:[业务运营的行业或领域]
风格:[首选的美学风格,如简约、复古、现代等]
元素:[你想要包含的关键图标、形状或图形]
颜色:[你想要坚持的颜色调色板]
字体:[如果涉及文本,首选的字体风格或特征]
情感基调:[你想要传达的感觉或氛围]
独特特性:[任何特殊属性,如动画或 3D 效果]
必须包含的元素:[必须出现的不可协商元素]
必须避免的事项:[您不希望在标志中看到的内容]
附加说明:[您希望提供的任何其他具体说明或自由度]
示例:
企业或品牌名称:SolarNova
行业:可再生能源
风格:未来感十足且易于接近
元素:风格化的太阳、互联的网格或电路线
颜色:蓝色调,金色点缀
字体:简洁的几何无衬线字体
情感基调:乐观且赋权
独特特点:微妙的渐变以增加深度
必须包含的元素:太阳元素和品牌名称必须突出显示
必须避免的事项:不要使用深色或暗色调
附加说明:应传达创新和可持续性

信息图表
通用提示:
设计一个关于'[信息图表主题,例如,'可再生能源的好处']'的具有信息性和视觉吸引力的信息图表。信息图表的结构为[布局风格,例如,'垂直流动']。
*图像**:
以代表[主要主题,例如,'发光的地球']的中心图像开始。
融入与主题相关的视觉元素[例如,'太阳能板、风力涡轮机和水力大坝']。
使用图标来表示[具体子点,例如,'减少碳排放、节省成本和创造就业']。
*文本元素**:
标题:'[信息图表标题,例如,'利用自然的力量']'。字体:[字体样式,例如,'粗体 Helvetica'],大小:[大小,例如,'36pt'],颜色:[颜色,例如,'深绿色'],位置:[位置,例如,'顶部中央']。
每个部分的副标题,字体:[字体样式,例如,'Arial'],大小:[大小,例如,'24pt'],颜色:[颜色,例如,'午夜蓝']。
主要内容文本,字体:[字体样式,例如,'Calibri'],大小:[大小,例如,'18pt'],颜色:[颜色,例如,'深灰色'],位置:[位置,例如,'在对应图像下方或旁边']。
使用项目符号或编号列表来列出[具体信息点,例如,'好处或步骤']。字体:[字体样式,例如,'Calibri'],大小:[大小,例如,'16pt'],颜色:[颜色,例如,'板岩灰']。
*颜色和风格**:
使用[首选颜色,例如,'绿色、蓝色和灰色']的统一调色板。确保视觉和文本的平衡混合,使用清晰易读的字体。使用[特定技术,例如,'粗体文本或彩色图标']突出重要点。
确保有足够的空白空间以提高可读性。信息图表应简明扼要且内容全面,通过视觉引导读者了解信息。



图表
通用提示:
创建一个[类型图表],说明[主要概念]。包括以下元素:[元素 1],[元素 2],[元素 3],和[元素 4]。使用[配色方案]进行设计,并清楚地标记元素。
示例:



时尚
通用提示:
设计一款[服装类型,例如,'飘逸的晚礼服'],适合[场合或季节,例如,'夏季晚宴']。
情感/情绪:
设计应唤起一种[情感或情绪,例如,'优雅和神秘']的感觉。它应与穿着者产生共鸣,并使他们感到[期望的情绪,例如,'自信和迷人']。
图像质量和细节:
专注于[具体细节或元素,例如,'复杂的蕾丝工艺']在[服装部分,例如,'袖子和领口']。
融入[装饰元素或图案,例如,'花卉刺绣或亮片细节']。
轮廓应为[合身和形状,例如,'腰部合身,底部飘逸']。
颜色:
主色调:[主色调,例如,'深宝石蓝色']。
点缀颜色:[次要颜色,例如,'银色和珍珠白色']用于[特定元素,例如,'装饰或装饰']。
风格:
整体风格应为[整体外观和感觉,例如,'现代并带有复古魅力的微妙感觉']。
融入[具体风格元素,例如,'低领或一侧高开叉']以增加[设计意图,例如,'大胆的触感']。
面料选择应为[期望的面料品质,例如,'柔软、透气且带有微妙的光泽'],适合[功能性或场合,例如,'温暖的夏夜']。
确保设计在舒适与美观之间取得平衡,使穿着者不仅看起来惊艳,而且感到自在。
示例:


建筑设计
这里是创建建筑设计的通用提示:
为位于[地点类型,例如,'城市商业区']的[特定用途,例如,'企业办公室']设计一栋建筑。
高度和结构:
建筑应有[楼层数,例如,'20']层,带有[特定特征,例如,'屋顶花园或露台']。
结构应为[结构风格,例如,'分层'],其中每个部分在上升时都向后退/[另一种选择:'突出']。
风格:
建筑风格应为[具体风格,例如,'现代并受装饰艺术影响']。
立面应融入[材料,例如,'玻璃和抛光钢'],并带有[附加功能,例如,'间隔的绿色垂直花园']。
外观和感觉:
主入口应散发出一种[情感,例如,'宏伟']的感觉,并带有[特定特征,例如,'大拱门或水景']。
窗户应为[窗户风格,例如,'落地窗,允许充足的自然光线']。
如果有阳台或露台,其设计/风格应该是[例如,'光滑简约,没有重型栏杆']。
可持续性:
考虑[可持续性特征,例如,'太阳能板、雨水收集和被动冷却技术']以确保建筑对环境友好。
周围环境:
建筑应与[周围元素,例如,'一侧是公园,另一侧是繁忙的街道']很好地融合。
建筑周围的景观应该是[景观风格,例如,'简约,使用本土植物和几棵标志性树木']。
确保设计优先考虑功能和美观,使其成为[地点类型,例如,'市中心区域']的地标性建筑。
示例:



彩色书
通用提示:
设计一本以[情境,例如,'野生动物冒险']为主题的全套彩色书。
时间:
每页应代表一天中的不同时间,从[具体时间,例如,'黎明到黄昏']。
地点:
彩色书中的场景应该将色彩家带到[地点,例如,'从茂密的雨林到干旱的沙漠的各种标志性自然栖息地']。
行动:
包括[具体动物,例如,'豹']在中跳跃或[另一种动物,例如,'蜂鸟']在花朵上盘旋的动态场景。
融入宁静的时刻,例如[具体动物,例如,'一头大象']与其小象一起吃草。
构图:
每页应使用[构图技巧,例如,'三分法']进行平衡设计。
通过在不同页面上交替使用近距离详细图像和广阔景观来创造多样性。
特点:
在动物和景观上融入复杂的图案和纹理,使涂色体验更加吸引人和详细。
情感:
彩色书应该唤起[期望的情感,例如,'惊奇、兴奋和放松']。旨在在色彩家和自然世界之间建立联系。
附加说明:
确保每页都有清晰、粗体的线条,便于涂色。
在每页底部添加与场景相关的简短描述或事实,提供教育方面。
设计应适应广泛的年龄范围,从儿童到成人,通过改变场景的复杂性。
确保整体书籍感觉统一,一次一页地带领色彩家穿越世界的自然奇观。
示例:


产品包装
通用提示:
为[情境,例如,'高端有机茶品牌']设计产品包装。
环境元素:
产品名称:[具体名称,例如,'Verde Bliss']。
产品描述:简要描述[关键特征,例如,'来自喜马拉雅山脉手工挑选、道德采购的绿茶']。
标志:在包装的显眼位置融入品牌的[标志描述,例如,'优雅的书法标志,带有茶叶图案']。
图像构图:
主要视觉:展示[关键视觉,例如,'木勺上的茶叶图像,背景有雾蒙蒙的山峰']。
背景:使用[背景样式,例如,'微妙的渐变']来补充主要视觉元素,从底部[颜色,例如,'深绿色']过渡到顶部[颜色,例如,'柔和的米色']。
附加元素:穿插[次要视觉,例如,'农民或茶园的小插图']来展示[特定特征,例如,'有机和手工挑选的自然']的茶。
情感:包装应唤起[期望的情感,例如,'宁静、纯净和奢华']的感觉。它应该让顾客感到[具体情感,例如,'与自然和茶艺师的工匠精神相连接']。
附加说明:
字体:使用[字体样式,例如,'产品名称使用手写体,其他细节使用无衬线字体']。确保可读性和层次感。
空间:确保布局整洁,留有足够的空白空间以获得高端感。
可持续性:使用[具体图标或徽章,例如,'回收标志或“无残忍”徽章']突出产品或包装的环保方面。
附加信息:添加一个侧面板,包含[具体细节,例如,'冲泡说明、成分和营养信息']。
确保包装设计协调一致,清楚地传达产品的独特卖点,并在零售货架上脱颖而出。
示例:


纹身
通用提示:
风格:[描述你希望达到的整体风格,例如,部落风格、极简主义、水彩画等]
元素:[列出你想要包含的核心元素,例如,动物、几何形状、文字等]
颜色:[指定色彩搭配,或注明是否希望为黑白]
尺寸和位置:[详细说明尺寸(小、中、大)和首选位置(前臂、背部等)]
情感基调:[传达你希望纹身包含的情感或氛围,如快乐、神秘或勇气]
文化参考:[注明你希望融入的任何文化或流行文化元素]
必须包含:[列出任何非协商性的具体项目或想法]
必须避免:[列出你绝对不希望包含的元素或主题]
附加备注:[任何其他具体要求或给予 AI 的创意自由]
示例:
风格:赛博朋克与日本传统风格相遇
元素:锦鲤、电路图案、樱花树枝
颜色:霓虹蓝、电子紫,以柔和的粉色作为樱花的亮点
尺寸和位置:中等,适用于前臂。
情感基调:宁静与活力的融合
文化参考:想象一下如果“银翼杀手”的世界有樱花节。
必须包含:确保锦鲤的鳞片过渡到电路图案
必须避免:避免暴力或阴暗的图像。
附加说明:无缝融合有机和技术元素,突出它们的相互关联性。
示例:


照片
通用提示:
拍摄一张描述[照片背景,例如,'宁静的湖边场景,一个独自冥想的人']的照片。
一天中的时间:
场景应设定在[一天中的时间,例如,'日落前的黄金时段']。
位置:
拍摄地点[具体地点,例如,'宁静的湖边,周围是高大的松树,背景是山脉']。
相机设置:
光圈:[具体光圈,例如,'f/2.8']
快门速度:[具体速度,例如,'1/200s']
ISO:[具体 ISO 设置,例如,'100']
镜头类型:
使用[镜头类型,例如,'50mm 定焦镜头']。
焦点:
焦点应集中在[焦点主题,例如,'冥想的人']上,并使用[焦点效果,例如,'浅景深以轻微模糊背景']。
曝光:
曝光应[曝光偏好,例如,'轻微欠曝以强调人物与落日的剪影']。
构图:
使用[构图技巧,例如,'三分法']将[主要主题,例如,'这个人']放置在[具体位置,例如,'画面的左三分之一']。
确保与[平衡元素,例如,'右侧的树木和上方广阔的天空']保持平衡。
情感:
照片应唤起[期望的情感,例如,'和平、孤独和反思']的感觉。
示例:




6.5 最佳实践
使用迭代方法^(2)
在设计风景之前,先从人物开始。在填充其余部分之前,确保身体形态正确。使用详细的描述。
通过交互式方法影响生成图像中对象的定位和排列。使用诸如“在左边”、“在后面”等短语来引导对象放置。
具体提示
使用形容词、时间框架和背景元素来细化你的提示。
用“欢欣鼓舞的年轻女性”代替“女性”。上下文也丰富了提示;指定一个时间框架,如“日落”,可以为生成的图像增添特定的色调和氛围。
提供上下文。例如,指定“在日落时欢欣鼓舞的年轻女性庆祝她的毕业”可以极大地细化生成的输出。
成为您的场景设计师
DALL-E 提供了大量的创作自由,但它也要求您成为您虚拟舞台的导演。您不仅能够影响图像中元素的位置和排列,还能影响相机位置和设置。


重新生成图片
DALL-E 无法根据您的请求编辑图片,例如移除对象或改变它们的朝向。如果您需要修改图片,请回顾原始图片,确定需要改进的区域,并精炼措辞以捕捉您的愿景。将每一次迭代视为向理想提示的进步。迭代很容易;通过点击提交提示下方的
进行“提示重写”,允许您编辑提示并重新提交。
例如,在下面的图片中,图片的焦点保持不变,您可以通过指定相机设置、角度、构图、缩放和摄影技巧来指导场景的视角。^([3)]
例如,“一位经验丰富的石油钻井平台探险家穿着黄色背心,用佳能 EOS 风格相机拍摄,9 点对焦。场景设定在加拿大北部森林地带的阳光明媚的傍晚时分。图片捕捉了一个特写肖像,突出了他脸上的复杂细节:多年的经验、雀斑、一些汗珠和从开采地点带来的几滴泥土。在背景中,可以看到石油钻井平台和其他工人在加拿大景观中。自然光线增强了图像的深度和清晰度,适合国家地理杂志的出版物。”

或者,“摄影,8K 分辨率,描绘了一辆光滑的达西亚 Duster 停泊在悉尼的岩石区。场景沐浴在夏日阳光的明亮色调中。宏伟的悉尼歌剧院和充满活力的环形码头构成了背景。一个精致的镜头光晕,这是 50mm 镜头的典型特征,增强了视觉效果。”

图片尺寸
DALL-E 3 接受三种不同的图像尺寸:1024px x 1024px、1792px x 1024px 和 1024px x 1792px。它提供了更多的纵横比灵活性,并且是生成图像风格和上下文的补充。垂直图像可能看起来像是用手机相机拍摄的。水平图像可能更适合风景画或数字设计。4

猴坐在色彩缤纷的印度寺庙的楼梯上
-
OpenAI, "DALL·E: Creating Images from Text" (accessed in November 2023;
openai.com/research/dall-e). -
Kurtis Pykes, "An Introduction to Using DALL-E 3: Tips, Examples, and Features," in Datacamp (accessed November 2023;
www.datacamp.com/tutorial/an-introduction-to-dalle3). -
Keith Torrence, "The Master Guide to Prompting DALL-E 3 Creatively with ChatGPT" (accessed in November 2023;
keithtorrence.substack.com/p/the-master-guide-to-prompting-dall). -
Will Depue, "What's new with DALL·E-3?" (accessed in November 2023;
cookbook.openai.com/articles/what_is_new_with_dalle_3).
7. 故障排除常见问题
尽管它们具有庞大的能力,但大型语言模型(LLMs)有时可能会犹豫并要求澄清。本节深入探讨这些细微差别,突出常见错误并提供解决方案。
7.1 理解误解
与 ChatGPT 等 LLMs 常见的误解通常源于人类语言的微妙性质。我们的日常交流依赖于上下文、文化参考和隐含的假设。当我们使用习惯用语或地区特定的表达方式提示时,我们不应总是期望 ChatGPT 能理解它们。
为了减轻这些挑战,我们必须构建清晰直接的查询。尽管 ChatGPT 被训练来处理复杂的语言模式,但通过简化它们的请求,我们可以获得更好的结果。移除无关细节,专注于核心查询可以产生更精确的结果。
此外,了解 ChatGPT 的响应基于其训练数据中的模式,有助于设定现实的期望。当一个问题的内容在其训练数据中代表性较低或结构不常规时,ChatGPT 正确解释它的可能性较低。
定期回顾和调整我们的提问方法可能是有效的。分析模型的回应,从先前的互动中学习,调整提问的措辞或结构,可以逐步提高对话的质量。最终,掌握与 ChatGPT 有效沟通的艺术是一个持续的学习、适应和敏锐观察的过程。
7.2 处理偏见
人工智能,如 ChatGPT,是由其训练数据塑造的。其中很大一部分来自互联网,并携带了嵌入的偏见,无论是明显的还是微妙的。因此,ChatGPT 可能无意中反映了其基础材料中存在的某些社会、文化或特定偏见,导致不平衡或不适当的输出。1
解决偏见的关键在于理解文化敏感性。每种文化都体现了独特的规范、价值观和信仰。用户必须认识到,AI 的回应可能并不总是与或欣赏这些文化细微差别产生共鸣,这可能导致概括或误解。
意识是对抗偏见的基础。用户应批判性地评估 AI 的回应,理解没有任何模型天生是客观的,偏见是大量训练中无意产生的副产品。
为了积极缓解偏见:
– 明确的情境化:在讨论特定的文化背景时,提供清晰和全面的细节以指导 AI。
– 多样化查询:从不同的角度提出问题或重新措辞,以评估 AI 的一致性和公正性。
– 交叉参考:将 AI 的回应与其他可靠来源或平台进行验证,以确保更全面和无偏见的理解。
总结来说,尽管 ChatGPT 标志着信息获取新时代的到来,但用户必须谨慎互动,仔细审查并确保获得的见解是无偏见的且符合文化。
7.3 处理模糊回应
与 ChatGPT 或任何复杂的人工智能语言模型互动时,回应中的模糊性并不罕见。鉴于其训练数据的广泛性和人类语言的复杂性,ChatGPT 有时可能提供比期望更概括的答案或存在多种解释。
面对模糊的回应时,采取主动立场是至关重要的。以下是一些管理这些回应的策略:
– 重新措辞问题:有时,简单地改写你的查询就能得到清晰的回应。
– 要求具体信息:如果回应似乎过于宽泛,提示 AI 提供更多详细的信息或例子。例如,如果你询问特定饮食的好处,并收到一个概括性的答案,你可能会跟进说“请列出具体的健康益处”。
– 寻求清晰:如果回应令人困惑或存在多种解释,请要求 AI 澄清其答案。简单的“用更简单的术语解释一下”可能有效。
– 顺序提问:将主要问题分解为一系列较小、相关的问题,可以引导 AI 为查询的每个方面提供更具体的答案。
– 反馈循环:如果回复模糊,提供关于您觉得不清楚的反馈,可以引导 AI 在后续尝试中提供更精确的答案。
认识到人工智能的输出可能作为对话的起点而不是最终结论,可能会重塑用户的期望并提升他们的体验。通过耐心和战略性的方法,用户可以导航模糊性并从 ChatGPT 中提取他们寻求的特定信息。
7.4 控制冗余和重复
虽然 ChatGPT 旨在提供深入和全面的信息,但有时它会陷入冗长或重复。尽管内容丰富,但回复对于寻求简洁信息的用户来说可能会感到压倒性或重复。
为了有效地管理这种情况:
– 明确期望:首先明确表达您对简洁答案的偏好。像“简而言之”或“简要”这样的短语可以引导模型提供专注的回复。
– 精炼问题:简化或缩小问题可以减少收到冗长或重复答案的可能性。例如,您可能会问“互联网的历史是什么?”而不是“互联网发展的关键里程碑有哪些?”
– 请求摘要:当收到过长的回复时,请求摘要。
– 限制字数:明确设置字数限制,例如“请用 50 个字以内解释[这个]。”
– 反馈:如果 ChatGPT 提供了重复的答案,让模型知道。反馈有助于改进后续的交互。
7.5 不适当的内容
与 ChatGPT 等人工智能平台互动可能会产生意外的输出,其中一些可能是不适当或有害的。这个挑战源于 ChatGPT 的知识代表了来自互联网的多样化数据集,虽然涵盖了广泛的信息,但通常包括有偏见、有争议或敏感的内容。
OpenAI 意识到这个挑战,并已采取措施解决。首先,OpenAI 采用严格的微调过程,在模型经过广泛的初始训练后,在更窄、更具体的数据集上进行训练。涉及人工审查员的反馈循环也起着重要作用,因为他们会根据广泛的各种输入评估模型输出并提供纠正。
OpenAI 也在研究和工程上投资,以减少 ChatGPT 回复中的微妙和明显的偏见。他们积极从用户社区寻求反馈,并根据这些宝贵的输入迭代他们的模型。目标是不断改进模型,以确保它尊重用户价值观,同时最大限度地减少生成潜在有害内容的机会。
7.6 深度和广度上的局限性
ChatGPT 拥有令人印象深刻的知识范围,但像任何工具一样,它也有其局限性。在某些主题上,它的见解可能不如预期那样全面或专业。OpenAI 不断更新模型,整合多样化的数据和反馈,以提高深度和准确性。
尽管如此,用户在处理专业或细分领域的话题时,应理解 ChatGPT 可能无法取代那些领域的专业专家。重要的是将其视为一个信息门户,而不是终极权威,并在需要时考虑补充来自专业来源的信息。
7.7 用户反馈的重要性
OpenAI 正在征求用户反馈(每次与 ChatGPT 交互后),以了解用户的使用体验、挑战和期望。用户反馈为 ChatGPT 在实际场景中的表现提供了洞察。
考虑到你所提供的每一份反馈都是你改进 ChatGPT 的机会,使其更符合用户需求并最小化潜在的风险。

年轻印度女性,在恒河中,手持一朵小花
- Barry Cousins, "揭示 ChatGPT 的不同类型偏见"(2023 年 7 月访问;
www.forbes.com/sites/forbestechcouncil/2023/03/31/uncovering-the-different-types-of-chatgpt-bias/)。
8. ChatGPT:对话应用
与 ChatGPT 最自然的交互方式是通过对话。ChatGPT 被设计用来通过聊天窗口或语音助手等对话界面为用户提供信息、回答问题或执行任务。
8.1 iOS 版 ChatGPT 的对话
2023 年 5 月 18 日,OpenAI 宣布推出免费的 iOS 版 ChatGPT 应用。该应用可以在设备间同步你的历史记录,并与其开源的语音识别系统 Whisper 集成。
iOS 版的 ChatGPT 非常神奇,将文本和语音无缝融合在一个紧凑的包中。¹ 要安装它,前往 App Store,搜索 ChatGPT,然后点击下载。安装完成后,打开应用会显示一个直观的界面。与浏览器界面不同的是,耳机图标是你的对话模式的入口。

主要的交互方式是聊天。点击底部的文本框,输入你的查询或陈述,然后点击发送。ChatGPT 会直接在你消息的上方回复。
为了更接近人性化的交互,点击耳机图标,说出你的想法,ChatGPT 会将你的话转换成文本,然后进行回复。
您的互动历史只需轻轻一滑即可查看;点击
左上角即可。轻松回顾过去的讨论,并在社交媒体或消息应用中分享您的 ChatGPT 互动。
ChatGPT for iOS 将简洁与功能结合在一起。警告:一些最先进的功能最初仅提供给 ChatGPT Plus 订阅者。您可以给它一个个性化的触感,并按您喜欢的样式自定义应用:声音设置、主题或文本大小。
这里有一些用例:
– 语言翻译:该应用就像一个口袋大小的语言翻译器。
– 旅行助手:获取信息或用作音频导游。
– 新闻检索:了解最新新闻。
– 情感支持:用它来引导您进行冥想或精神平静练习。
语言翻译
考虑到您在国外,突然出现语言障碍。启动 ChatGPT 并启用语音输出。ChatGPT 将口述翻译后的文本。
您可以键入您的短语,说话,或者拍摄您想要翻译的文本的照片。ChatGPT 是一个节省时间和改变游戏规则的工具。
嗨助手!我们正在与只会说罗马尼亚语的人交谈。请将您听到的所有英语翻译成罗马尼亚语,并将所有罗马尼亚语翻译成英语。
从这里开始,这是一个双向的道路。表达、询问、学习和享受对话。
旅行助手
不知所措?问 ChatGPT。它会建议活动、参观的地方,甚至尝试当地美食。它就像有一个当地朋友在引导您,并跟踪时间。
嗨助手!我们正在巴塞罗那参观圣家堂。我们在主入口处。请引导我们游览这个景点。记住,我们只有一小时的时间参观。
新闻和信息检索
在移动中保持更新。让 ChatGPT 阅读最新新闻,使信息检索无需动手且方便。
虽然传统的新闻应用提供了结构化的新闻来源,但 ChatGPT 提供了一种更互动、个性化、全面的了解信息的方法。
互动,因为它提供了一种对话式的信息检索方式,与滚动浏览文章相比,使过程更加吸引人且不那么单调。
个性化,因为 ChatGPT 会根据您感兴趣的具体主题定制您的新闻简报,随时为您提供新闻摘要。
全面,因为 ChatGPT 能够理解和提供上下文相关的回复,从而带来更加丰富和有洞察力的新闻消费体验。
情感支持
在我们快节奏的世界里,寻找情感宁静是一个共同的目标。当然,人的触摸是无法替代的,但 ChatGPT 可能是一个虚拟伴侣,在追求宁静的对话中提供支持。当您分享您的感受时,它会以同理心和舒缓的建议回应。例如:
用户:
ChatGPT,我感觉焦虑。
ChatGPT 的回复:
感到这样是正常的。你想交谈或尝试呼吸练习吗?
它不仅仅是倾听;它引导你进行正念练习,如冥想。
用户:
引导我进行一段简短的冥想.
ChatGPT 的回复:
找一个舒适的座位。闭上眼睛。深呼吸……然后慢慢呼气……
值得记住的是,即使 ChatGPT 可能为分享情感提供一个安全的空间,但它不能取代人类治疗师细微的理解和保密性。
8.2 模拟工作面试
ChatGPT 可以用作面试模拟器,提供逼真的模拟面试体验。将职位描述和可能的面试问题输入 ChatGPT,并要求它模拟各种面试场景。ChatGPT 可以扮演面试官的角色,根据职位和行业提出相关的问题。它评估回答,对表现提供反馈,建议更好的回答,并突出改进的领域。这种练习可以帮助候选人准备并在真正的面试前获得信心.^(2) ChatGPT 的灵活性允许定制面试准备过程,使其成为求职者和职业顾问的有价值工具。
下面是一个通用的提示,可以根据未来的需求进行调整。
背景:
[插入对职位角色、行业以及模拟过程中应涵盖的任何特定面试主题或问题的简要描述]
AI 角色:
面试模拟器
AI 个性:
专业、吸引人、分析性
AI 任务:
模拟真实的工作面试体验。结束后,对回答提供反馈,识别优点、改进领域以及如何提高表现的建议.
任务指南:
提出混合常见和角色特定的问题以评估准备情况.
在整个模拟过程中保持专业态度.
在必要时提供建设性的反馈和替代回答。
[指定是否有额外的资源用于有效的模拟,例如特定的面试场景或公司背景]
受众:
[插入反馈的预期受众,例如,求职者、职业顾问]
系统设置:
默认设置.
8.3 个性化辅导
ChatGPT 可以在学习的大千世界中作为一个工具,提供定制的解释、专注的注意力和即时的反馈,帮助个人掌握各种学科和技能。
个性化学习路径
每个学习者都是独特的,有着不同的学习曲线。ChatGPT 调整指令以满足这些需求。它在物理或数学教学中构建课程,确保概念被分解成可消化的部分,有助于理解和记忆。
例如,一个场景和父母可能使用的提示。
学习目标:万有引力,普遍的吸引力定律
学生:14 岁
起始点:学生一无所知。他错过了课程并且生病了。
任务:创建个性化的学习路径
第 1 步:引力的介绍
提示:
解释引力的基本概念以及为什么它很重要。
第 2 步:深入研究万有引力定律
提示:
万有引力定律是什么?用简单的话解释一下。
第 3 步:解释公式
提示:
解释万有引力定律的公式以及每个符号的含义。
第 4 步:现实世界例子
提示:
提供一些万有引力定律在现实世界中的应用实例。
第 5 步:解决问题
提示:
让我们通过一些问题来更好地理解万有引力定律。
第 6 步:练习和评估
提示:
提供更多关于万有引力定律的问题以供练习,并提供解决方案以供自我检查。
第 7 步:复习和巩固
提示:
让我们回顾一下万有引力定律的关键点。总结一下。
通过导航这些步骤和相关提示,家长引导 14 岁的学生从对引力的基本理解过渡到对万有引力定律的更深入掌握。整个过程根据学生的理解速度进行,确保在进入下一阶段之前对知识有彻底的理解。通过与 ChatGPT 的持续互动,学生参与到一个既自主又全面的学习旅程中,弥补了缺课和生病的时间。
8.4 学习新技能
学习新技能对个人成长至关重要,ChatGPT 可以成为一个方便的导师。ChatGPT 擅长帮助用户掌握新技能,尤其是在传统方法可能不够有效或不够及时的情况下。
使用 ChatGPT 学习一门新语言提供了一种互动、个性化的方法。3 你会立即得到回复,按照自己的时间表学习,并可以根据自己的意愿深入研究特定主题。虽然这不能取代完整的语言课程,但它是一种有效的补充学习方式,可以在路上进行学习和实践。
初始提示:
教我一些基本的西班牙语短语。
ChatGPT 的回复:
“Hola”意味着“你好”。“¿Cómo estás?”是“你好吗”。
补充说明:
我该如何发音“Hola”?
ChatGPT 的回复:
发音像“O-la”,其中的“H”是不发音的。
第二次补充说明:
西班牙语中的“谢谢”怎么说?
ChatGPT 的回复:
“谢谢”在西班牙语中是“Gracias”,发音像“Grah-see-ahs”。
第三次补充说明:
扮演我的西班牙语老师,教我。
学习基本的编程技能
ChatGPT 提供的编码建议通常比阅读文章或观看视频更定制化和及时。这就像有一个私人导师,只需一个聊天就能得到。4
初始提示:
我想学习编程。我应该从哪里开始?
ChatGPT 的回复:
从一门入门级的语言开始,比如 Python。它有简单的语法和大量的资源可用。
补充说明:
我可以尝试哪些项目?
ChatGPT 的回复:
对于初学者来说,创建一个基本的计算器或待办事项列表应用可以是一种满足感和教育性的体验。
第二次补充:
同时像 Python 编码环境一样,又像 Python 导师一样。
ChatGPT 的回复:
当然,我可以在为你模拟 Python 编码环境的同时切换到 Python 导师模式。虽然我不能执行代码,但我将帮助你编写、调试和理解 Python 脚本。
学习烹饪技能
烹饪是一门艺术和科学,ChatGPT 可以帮助你掌握烹饪技巧。有了 ChatGPT 作为你的虚拟副厨师,你可以探索新食谱,提高你的技术,并摆出连拉姆齐厨师都会点头称赞的菜肴。准备好开始烹饪了吗?
初始提示:
我想用戈登·拉姆齐的风格做一道印度菜。有什么建议吗?
ChatGPT 的回复:
这是一个令人兴奋的挑战!来一道戈登·拉姆齐风格的 Chicken Tikka Masala 如何?它结合了英国烹饪的精湛技艺和丰富的印度风味。
补充:
用户:
听起来很美味!我需要哪些食材?
ChatGPT 的回复:
太好了!你需要鸡胸肉、酸奶和香料:孜然、香菜和姜黄,用于腌制。酱汁需要洋葱、大蒜、姜、罐装番茄和奶油。别忘了新鲜的香菜作为装饰!
第二次补充:
用户:
第一步是什么?
ChatGPT 的回复:
第一步是腌制鸡肉。将酸奶与香料混合,加入切丁的鸡肉,静置至少一小时。这将使你的鸡肉柔嫩多汁,这是拉姆齐的必备!
第三次补充:
用户:
我该如何制作酱汁?
ChatGPT 的回复:
对于酱汁,将洋葱、大蒜和姜炒至金黄色。加入香料和番茄。煮沸至变稠。加入奶油以增加丰富度。这就是拉姆齐触感所在——平衡、深度和丝滑的口感。
第四次补充:
用户:
有什么服务建议吗?
ChatGPT 的回复:
当然!戈登·拉姆齐喜欢摆盘。将酱汁倒在煮熟、腌制的鸡肉上。用切碎的新鲜香菜和奶油点缀。搭配娜恩或巴斯马蒂米饭食用。
这就是最好的对话式人工智能,你的口袋里的伴侣。无论你是环游世界还是修理水槽,ChatGPT 都会支持你。它不仅仅是关于答案。它是关于丰富你生活的故事,一次对话一次。
8.5 解决常见问题
技术无处不在,随之而来的偶尔故障也不例外。无论是设置新设备、连接设备还是解决顽固的软件错误,ChatGPT 都提供即时的第一线支持。
复古与新技术
想象一下,你继承了一套复古的高端音频系统。这是一件艺术品,但你想知道如何从你的 iPhone 流式传输你最喜欢的播放列表。
初始提示:
我怎样才能将我的 iPhone 连接到老式音频系统来播放音乐?
ChatGPT 的回复:
您可以使用蓝牙音频适配器。使用 RCA 或 3.5mm 插头将适配器连接到您的音频系统,然后将您的 iPhone 与适配器配对。它将把您的复古系统变成一个现代流媒体强大动力。
跟进:
用户:
我在哪里可以找到蓝牙音频适配器,平均价格是多少?
ChatGPT 的回复:
蓝牙音频适配器在电子产品店中广泛可用,无论是实体店还是在线店,如百思买、亚马逊或沃尔玛。您还可以检查您所在地区的专业音频店。基本适配器的平均价格在 15 至 40 美元之间,但具有额外功能的高端型号可能更贵。在购买前阅读用户评论并确保与您的音频系统和 iPhone 兼容是一个好主意。
办公室技术之舞
您的大演讲在一小时后,而您的投影仪出了问题。或者也许办公室打印机又卡住了。
初始提示:
投影仪没有检测到我的笔记本电脑。我该怎么做?
ChatGPT 的回复:
首先检查笔记本电脑和投影仪之间的电缆连接。确保投影仪上的正确输入源。如果这不起作用,尝试重新启动两个设备并检查您的笔记本电脑显示设置,以确保它开启以复制或扩展显示。
旅行技术问题
您在国外,您的手机无法连接到本地网络,导致您无法连接到必要的服务和联系人。
初始提示:
我的手机在国外无法连接到本地网络。有什么解决办法吗?
ChatGPT 的回复:
首先,确保已启用漫游。然后,尝试在设置中手动搜索网络并选择本地提供商。重启您的手机或开关飞行模式也可能有所帮助。
在一个以技术为中心的世界里,您可能会感到不知所措。但有了 ChatGPT,您可以立即获得指导和/或解决方案。
8.6 客户服务支持
ChatGPT 处理询问、解决问题和提供信息,从而减轻了人工代理的负担。在由美国国家经济研究局(NBER)进行的研究中,发现使用生成式预训练变换器(GPT)AI 工具的客户支持代理的生产力几乎提高了 14%。如果您(或计划)在信息经济(即任何涉及创建、使用或交换信息的角色)中工作,那么 AI 可能会显著加快并增强您完成工作的能力。
让我们探索 ChatGPT 如何提升客户互动的几种方法.(5)(6)
预生成的常见问题
这解决了客户服务的主动方面。企业可以提供现成的答案来回答常见问题,使用户更容易找到信息。
步骤指南:
– 识别常见问题:首先列出客户关于您的产品或服务的常见问题。
– 查询 ChatGPT:使用 ChatGPT 为每个这些常见问题生成详细的答案。
– 编译与审查:收集这些答案,并审查它们的准确性和清晰度。
– 发布:将最终的部分添加到您的网站上。
– 更新:定期使用新的查询来审查和更新该部分。
最佳实践:
– 在问题和答案中使用简洁明了的语言。
– 总是双重检查 ChatGPT 的回答的准确性和与您业务的关联性。
实时聊天手册援助
这侧重于实时互动,但在手动环境中。客服代理从 ChatGPT 获得实时建议,他们可以使用这些建议立即帮助客户。
步骤指南:
– 设置:在您的实时聊天软件旁边打开 ChatGPT 的单独窗口或标签页。
– 训练客服代理:在实时聊天中向客服代理简要介绍如何将输入查询输入到 ChatGPT。
– 实时援助:当客户提出问题,将它们输入 ChatGPT 以获取建议答案。
– 回复:以 ChatGPT 的建议为基础,在发送给客户之前个性化您的回复。
最佳实践:
– 在实时聊天中,速度至关重要;准备代理快速细化 ChatGPT 的回答。
– 提醒代理使用他们的判断;ChatGPT 是一个工具,而不是人类直觉的替代品。
快速脚本
这应被视为一种准备和实时援助的工具。代理在与客户交谈时可以参考脚本,使服务更加一致和高效。
步骤指南:
– 列出场景:确定客户在通话中提出的常见问题或查询。
– 生成脚本:使用 ChatGPT 生成解决这些问题的脚本。
– 审查:审查这些脚本,确保它们符合您品牌的语气并且内容准确无误。
– 分发:与您的客服团队分享批准的脚本,以便在通话中使用。
最佳实践:
– 保持脚本灵活;代理应根据客户的具体需求进行调整。
– 根据新的客户互动和反馈定期更新脚本。
-
OpenAI,“介绍 ChatGPT iOS 应用”(2023 年 11 月访问;
openai.com/blog/introducing-the-chatgpt-app-for-ios)。 -
AGI 博客,“如何使用 ChatGPT 模拟面试并通过任何面试”(2023 年 10 月访问;
artificialgeneralintelligence.blog/simulate-interview-with-chatgpt/)。 -
ChatGPT 指南编辑,“如何使用 ChatGPT 学习英语或任何语言”(2023 年 7 月访问;
www.chatgptguide.ai/2023/06/14/how-to-use-chatgpt-to-learn-english-or-any-language/)。 -
Julian Horsey, "Learn how to code with Chat GPT" (accessed in July 2023;
www.geeky-gadgets.com/learn-how-to-code-with-chat-gpt/). -
Mathew Patterson, "Using ChatGPT for Customer Service" (accessed in November 2023;
www.helpscout.com/blog/chatgpt-customer-service/). -
Cem Dilmegani, "ChatGPT for Customer Service: 7 Use Cases & Benefits in 2023" (accessed in October 2023;
research.aimultiple.com/chatgpt-for- customer-service/).
9. ChatGPT 用于个人生产力
想象一个世界,其中那些常常成为你日常节奏障碍的日常和重复性任务消失了。解锁这种超级能力的钥匙在于理解生成式 AI 如何融入你的工作流程.^(1)
让我们探讨如何使用 ChatGPT 作为你的智能个人助理来增强你的工作和提高你的生产力。
9.1 发散思维,产生想法
第一个领域是通过想法生成使用 ChatGPT,如果你通过传统方式尝试,可以节省数小时的研究和审议时间。
示例:
初始提示:
我必须提出一些创新的想法来减少我公司的碳足迹。我从哪里开始呢?
ChatGPT 的回复:
首先,对你们公司排放量最大的领域进行分类,例如交通、能源消耗或废物管理。然后你可以为每个领域确定针对性的解决方案。
跟进:
我们最大的罪魁祸首是能源消耗。我们能做什么呢?
ChatGPT 的回复:
考虑过渡到可再生能源,如太阳能或风能。你也可以实施使用运动传感器的智能照明系统,或者投资于节能的家用电器和暖通空调系统。
第二次跟进:
可再生能源听起来很昂贵。有没有成本效益的过渡方式?
ChatGPT 的回复:
可再生能源从长远来看可以节省成本。你可以从小处着手,比如分阶段安装太阳能板。政府补助和税收优惠也可能抵消初始成本。
第三次跟进:
关于让员工参与进来,有什么建议吗?
ChatGPT 的回复:
员工参与至关重要。发起一项“绿色挑战”,让各部门竞争减少能源消耗或浪费。或者激励远程工作以减少通勤排放。即使是在整个员工中推广的小改变也能产生重大影响。
9.2 研究:事实核查、专业文本合成和摘要
ChatGPT 可以在第二个领域提供有价值的帮助,那就是研究。
例如,ChatGPT 可以提供快速、初步的见解,帮助您深入了解市场研究。它可以分析客户评论并注意趋势和情绪。您可以使用这些数据来改进产品和服务。但请记住,ChatGPT 只是您研究工具箱中的一个工具。它不能取代全面的传统方法。
这里有一些带有步骤指南和最佳实践的示例。
客户评论分析
步骤指南:
– 收集评论:从 Google、Yelp 或 Trustpilot 等平台收集客户评论。
– 输入数据:将一组评论粘贴到 ChatGPT 中,并要求其总结要点或检测情绪。
– 解释:使用输出结果来了解客户对您的产品或服务喜欢或不喜欢什么。
最佳实践:
– 收集多样化的评论以进行综合分析。
– 将 ChatGPT 的发现与数值评分相结合以获得更深入的见解。
竞争对手基准测试
步骤指南:
– 识别竞争对手:列出您的主要竞争对手。
– 收集数据:从他们的网站或评论平台上抓取客户评论或产品描述的片段。
– 分析:将此数据输入 ChatGPT 并询问“这与我们的产品/服务相比如何?”
– 制定策略:使用反馈来识别您的优势和劣势。
最佳实践:
– 专注于您市场细分内的竞争对手以获得相关见解。
– 定期更新您的分析,因为您和您的竞争对手都在不断发展。
趋势捕捉
步骤指南:
– 源数据:找到与您行业相关的文章、博客文章或论坛帖子。
– 输入到 ChatGPT:将此内容粘贴到 ChatGPT 中并询问“讨论了哪些趋势?”
– 汇总见解:使用输出结果来汇总您领域中的趋势或即将到来的变化。
最佳实践:
– 选择可靠的来源以准确捕捉趋势。
– 将 ChatGPT 的发现与其他研究方法相结合,以获得全面的视角。
9.3 对话支持
ChatGPT 可以帮助起草有说服力的电子邮件或报价。它知道如何击中正确的音符以提高转化率。以下示例涵盖了 ChatGPT 在电子邮件支持中可以使用的广泛范围。
起草有说服力的电子邮件
步骤指南:
– 识别目标:确定电子邮件的目标——是销售、促销还是新产品发布。
– 起草:将提示输入 ChatGPT 以生成有说服力的电子邮件副本。
– 审阅:编辑生成的内容以匹配您的品牌语气和目标。
– 发送:通过您的电子邮件营销平台部署最终定稿的电子邮件。
最佳实践:
– 保持语言对话性和个性化。
– 总是跟进以查看电子邮件的转化效果如何。
电子邮件回复
步骤指南:
– 阅读电子邮件:了解收到的电子邮件中概述的客户查询或问题。
– 询问 ChatGPT:将或总结客户的查询粘贴到 ChatGPT 中,以获得建议的回复。
– 定制:优化生成的回复以更好地匹配您品牌的语气和具体查询。
– 回复:将最终确定的电子邮件发送给客户。
最佳实践:
– 仔细检查 ChatGPT 生成的响应的准确性和语气。
– 及时回复;及时性在客户服务电子邮件中至关重要。
自动跟进
步骤指南:
– 确定需要:确定跟进电子邮件会有益于哪些情况,如购买后或服务电话后。
– 使用 ChatGPT 起草:生成电子邮件内容,重点关注客户满意度和反馈。
– 审查:确保电子邮件符合情况并符合品牌语调。
– 自动化:虽然你会手动进行,但将最终确定的跟进电子邮件粘贴到你的电子邮件软件中。
最佳实践:
– 语调应礼貌,但不要过于正式。
– 包含一个用于反馈或下一步行动的号召性用语(CTA)。
9.4 内容创作
内容创作是当今商业的重要组成部分,ChatGPT 在这里发挥着至关重要的作用。它就像拥有一个随时待命的文案。让我们探索三个不同的例子。在所有三个案例中,关键是要将 ChatGPT 作为起点,并加入你个人的风格。ChatGPT 负责繁重的工作,让你可以专注于微调。
博客文章
步骤指南:
– 灵感生成:使用 ChatGPT 来构思博客主题。只需问“关于[你的行业]有哪些博客主题?”
– 概要:一旦你有了主题,请 ChatGPT 生成大纲。
社交媒体更新
步骤指南:
– 内容日历:向 ChatGPT 询问特定周或月的社交媒体帖子想法。
– 草稿撰写:将这些想法输入 ChatGPT 以生成每篇帖子的文本。
– 视觉元素:将生成的文本与相关图像或视频配对。
– 审查:在发布前确保语气与品牌相符。
最佳实践:
– 保持帖子简短且引人入胜。
– 使用 ChatGPT 来改变语言,保持新鲜感。
时事通讯
步骤指南:
– 主题选择:咨询 ChatGPT 以获取吸引客户基础的时事通讯主题。
– 部分:要求生成将时事通讯结构化为介绍、主要内容、结论等部分的概要。
– 内容创作:为每个部分,通过 ChatGPT 生成文本。
– 编辑:完善生成的文本,并整合任何品牌特定的语言或优惠。
最佳实践:
– 个性化语言,以引起受众共鸣。
– 总是双重检查事实和数字。
9.5 重复性任务支持
招聘和雇佣
ChatGPT 可以通过筛选简历和分析候选人答案来自动化招聘流程。
步骤指南
简历筛选:
– 以 JSON 或 CSV 等结构化格式收集简历。
– 设计一系列针对技能和资格的问题。
– 使用 ChatGPT 将简历与问题进行比较,生成合格候选人的列表。
洞察生成
– 设计一系列开放式问题,以衡量个性、工作风格和行为。
– 进行初步面试并记录答案。
– 使用 ChatGPT 分析候选人的回答并识别关键词。
– 要求 ChatGPT 根据他们的回答提供每位候选人的性格、行为和工作风格的总结。
会议准备
想象一下,在几分钟内就能列出会议的所有要点。ChatGPT 可以总结长文档或电子邮件,而你则可以准备就绪地参加。
市场营销支持
ChatGPT 可以根据用户数据和行为模式生成个性化的市场营销信息。它还可以自动化广告定位和投放,确保在正确的时间吸引正确的受众。它还可以通过回答用户查询和提供相关信息来协助潜在客户的生成和培养。
9.6 旅行建议
想象自己在国外漫步。但你有 ChatGPT。询问必去之地,然后你前往必看的地标。接着询问关于西班牙小吃和步行游览的问题。
示例:
初始提示:
你是我的西班牙旅行代理。我将在十月底访问马拉加、龙达、格拉纳达、科尔多瓦和塞维利亚。我将使用马拉加机场在连续的周六晚上进出西班牙。我计划租车并开车一周。你认为我应该如何安排行程,以便我行驶的最短距离?请尽量简短回答。
ChatGPT 的回复:
星期六:抵达马拉加。办理入住并休息。
星期日:从马拉加到龙达(1.5 小时)。探索龙达。
星期一:从龙达到塞维利亚(2 小时)。下午在塞维利亚。
星期二:在塞维利亚度过完整的一天。
星期三:从塞维利亚到科尔多瓦(1.5 小时)。度过这一天。
星期四:从科尔多瓦到格拉纳达(2.5 小时)。下午参观阿尔罕布拉宫。
星期五:在格拉纳达度过完整的一天。
星期六:从格拉纳达到马拉加(1.5 小时)。乘坐晚上的航班。
第二次跟进:
请列出每个城市的参观地点。请记住,我还想享受散步、喝一杯酒和品尝小吃。
第三次跟进:
你推荐我提前购票吗?在哪里以及为什么?
9.7 练习
在以下示例中,仅提供了提示的 TASK 组件。为了将提示适应您感兴趣的区域和您想要解决的问题,请添加其他相关的提示组件,如第三章所述。TASK 组件还包括“占位符”需要填写。
1. 博客文章创作练习
– 适应提示并将其与您最紧迫的业务挑战对齐。
– 将括号替换为与您的项目相关的具体信息。
– 检查输出的准确性。例如,“这个信息准确吗:[需要核实的事实或数字]?”
– 检查输出的声音、风格、流畅性和节奏。例如,“这个内容是否符合我品牌的风格:[生成的内容]?”
– 校对输出以检查拼写和语法。例如,“使用‘友好简洁’的风格。避免行话。使用加里·普罗沃斯特的流畅和节奏。[生成内容]”
灵感生成:
ChatGPT,你能为我建议一些与[您的行业]相关的博客主题吗?
概要:
为关于[选定主题]的博客文章创建大纲。
草稿:
为我关于[选定主题]的博客文章草拟引言。
为我关于[选定主题]的博客文章中标题为[章节名称]的部分撰写内容。
为我关于[选定主题]的博客文章撰写结论。
编辑:
你能帮我改写这句话以符合我的品牌风格:'[要改写的句子]'?
2. 社交媒体更新练习
– 将占位符(方括号)替换为适用于您具体情况的信息。
– 交互式改进输出:“这篇帖子吸引人吗:[生成内容片段]?”“我如何改写这篇帖子使其更加新鲜/吸引人/多样化:[生成内容]?”
内容日历:
ChatGPT,你能为我提供一些关于即将到来的[周/月]在[您的行业]领域的社交媒体帖子想法吗?
复制草稿:
生成关于[特定主题或事件]的社交媒体帖子。
为我推广[您的产品或服务]写一条推文。
撰写关于我们最新的[成就或新闻]的 LinkedIn 更新。
视觉效果:
为关于[特定主题或事件]的帖子建议一些合适的视觉效果。
审查:
这篇社交媒体帖子的语气是否符合我的品牌:[生成内容]?
3. 通讯稿练习
– 将括号内的部分替换为您的具体细节。
– 检查准确性:“这个说法准确吗:'[事实或数据]'?”
– 检查输出声音、风格、流畅性和节奏。例如,“这篇文本与我的品牌调性是否相符:'[生成内容]'?”
主题:
GPT,为我建议一些关于[您的行业]领域的下一份通讯稿的主题。
章节:
为关注[选定主题]的通讯稿概述章节。
内容创作:
为我关于[选定主题]的通讯稿撰写引言。
为我通讯稿的[特定章节]草拟内容。
你能讨论[选定主题]来结束我的通讯稿吗?
编辑:
帮助我调整此段落,使其与我的受众产生共鸣:'[要编辑的段落]'。
- 伯纳德·马尔,《利用生成式 AI 提高生产力》,载于《哈佛商业评论》(2023 年 6 月访问;
hbr.org/2023/06/boost-your-productivity-with-generative-ai)。
10. 数据分析
太常了,我们处理大量数据,合并数据,将文件从一种格式转换为另一种格式,将数据放入图表形式,并执行其他更多耗时的工作。
好消息是,所有这些都可以通过使用 ChatGPT 数据分析快速高效地完成,无需深入了解数据科学。
在本章中,我们将深入探讨 ChatGPT 数据分析提供给您与数据交互的革命性方式。我们将首先比较 ChatGPT 和 ChatGPT 数据分析,揭示赋予您与数据工作的变革性转变。然后,我们将深入探讨数据分析的能力。
在本章中,我们设计了练习,让您可以将新获得的知识付诸实践。
虽然 ChatGPT Plus 可以帮助进行数据分析,但我们必须进行批判性思考并验证结果。这是一个提供洞察力的工具,但与人类专业知识及严谨分析相结合时效果最佳。
高级数据分析可能是一个颠覆性的变革。
10.1 高级数据分析是什么?
如果我们将 ChatGPT 比作“知识守护者”,一个文字的巫师,那么我们可以将数据分析比作一个能干的“数据科学家”助手。
“数据科学家”知识渊博,但需要具体的指令和一些监督。它在编码、解读文档和可视化数据等任务上表现出色。它擅长计算机编程,并熟练使用专业工具。以下是一些观察结果:
– 它受限于其超级强大的计算机,但没有互联网访问。因此,对于您分配的任何任务,您必须直接提交所有必要的文件和数据。
– 它可以编写 Python 代码来完成复杂任务,无需理解代码即可从中受益。
– 它的记忆有限。它只记得当前交互中的任务和指令。它不会记住关于过去交互或未完成的任务任何事情。当您开始新的聊天时,就像第一次见到您一样。
– 它很擅长但并非完美无缺。它通常不会检查其输出,除非被要求。您必须审查并双重检查每一项工作,以确保没有错误或疏忽。这种警惕性确保您收到的输出是准确可靠的。

图 10.1 LLM 与数据分析能力
最好的建议是关于您的目标、限制、需求等要非常具体。在您的指令中要明确。例如,如果您需要文件组织,请指定您希望它们如何命名以及您偏好的文件夹结构。
总是确认“数据科学家”是否正确理解了您的任务。它通常会反映它即将要做的事情,提供调整的机会(图 10.1)。
您可以启用它,如果您有 ChatGPT Plus 订阅。
“知识守护者”与“数据科学家”之间的基本区别在于它们与数据文件交互的能力。
虽然两者都允许您发送聊天消息并接收回复,但 ChatGPT 数据分析提供了一个额外的功能:“上传文件”按钮。此功能允许用户上传他们的数据文件:销售数据、文档或图像和视频。
在处理基于文本的任务时,通常只需要“图书管理员”。对于数据处理、数值计算或文件操作,预期将涉及“数据科学家”。
在 ChatGPT 的上下文中进行数据分析允许使用各种文件格式进行数据导入、导出和处理。以下是一个简单的表格,概述了支持的文件格式和最大 512 MB 的文件大小:^(1)
| 文件格式 | 扩展名 | 用途 | 备注 |
|---|---|---|---|
| CSV | .csv | 数据导入/导出 | 以逗号分隔的值 |
| JSON | .json | 数据导入/导出 | JavaScript 对象表示法 |
| Excel | .xls, .xlsx | 数据导入/导出 | 微软 Excel 格式 |
| XML | .xml | 数据导入/导出 | 可扩展标记语言 |
| SQL | .sql | 数据导出 | 结构化查询语言 |
| HTML | .html | 数据导出 | 超文本标记语言 |
| 数据导出 | 可移植文档格式 | ||
| TXT | .txt | 数据导入/导出 | 纯文本 |
这些文件格式由数据分析工具和库(如 Pandas、Numpy 和各种 SQL 数据库)支持,使它们与你在 ChatGPT 的辅助下可能执行的先进数据分析任务兼容。
任务完成后,请要求 ChatGPT 将工作编译成可下载的格式,如 zip 文件,以便你轻松检索。
数据分析仅对 ChatGPT Plus 订阅者开放。
10.2 高级数据分析:用户指南
ChatGPT 数据分析的新功能旨在增强对文本丰富文档的分析:
– 综合分析:从文档中分析信息以生成内容或见解。
– 转换:在不改变信息本质的情况下改变信息的呈现方式。
– 提取:从文档中识别并提取特定的数据片段。
步骤 1:定义你的目标
首先明确你希望通过数据分析实现什么目标。你是想寻找趋势、模式还是特定的见解?这将指导你与 ChatGPT 的互动。
例如,对于一个快速消费品(FMCG)分销商来说,目标可能是分析销售情况并确定最畅销的产品。或者探索这些产品的销售与其他商品之间是否存在任何相关性。
步骤 2:准备你的数据
在与 ChatGPT 互动之前,将你的数据组织成易于理解的形式。它可以是表格、电子表格或任何其他结构化数据格式。
假设小型分销公司的实际数据集包括“产品名称”、“销售”和“日期”等列。
步骤 3:开始对话
与 ChatGPT 开始对话,并介绍你的数据分析项目背景。例如:“我有一组各种快速消费品销售数据的数据集。我想分析销售情况并确定销量最高的产品。此外,我还想了解这些产品的销售与其他商品之间是否存在任何相关性。你能帮我进行这项分析吗?”
步骤 4:提出具体问题
提出与分析相关的具体问题:
你能告诉我哪些产品是根据销售数据确定的销量最高的吗?
这些顶级产品的销售数据中是否存在明显的模式或趋势?
你能探索一下顶级产品的销售与其他数据集中的商品销售之间是否存在任何相关性吗?
步骤 5:寻求解释
不要只要求结果——要求 ChatGPT 解释其推理。例如:
你能解释一下导致某个月份销售增加的因素吗?
你认为为什么这些特定产品是销量最高的?
你能解释一下导致观察到的销售模式的因素吗?
步骤 6:可视化洞察
如果你的数据包括数值,请 ChatGPT 帮助创建可视化。例如:
请生成一个折线图,以显示过去一年的销售趋势。
你能生成一个条形图,展示顶级产品的销售分布吗?
请创建一个散点图,以显示顶级产品销售与其他商品销售之间的关系。
步骤 7:精炼和迭代
根据初步洞察,继续完善你的问题,并与 ChatGPT 进行迭代对话,以深入分析。
步骤 8:总结发现
在互动的尾声,请 ChatGPT 总结数据分析的关键发现。这将有助于你为报告或决策整合信息。
在整个过程中,请记住 ChatGPT Plus 帮助分析,但你的批判性思维和领域知识对于准确解释结果至关重要。根据你遇到的具体数据集和细微差别,请随意修改问题或指令。
按照这些步骤,你可以有效地利用 ChatGPT Plus 分析销售数据并揭示有价值的见解,从而驱动明智的决策。
喜欢数据分析!
示例
数据集
| 产品名称 | 4 月销售 | 5 月销售 | 6 月销售 | 7 月销售 | 8 月销售 |
|---|---|---|---|---|---|
| 肥皂 | 131.00 | 141.00 | 154.00 | 167.00 | 175.00 |
| 洗发水 | 138.00 | 139.00 | 146.00 | 152.00 | 160.00 |
| 洗洁精 | 157.00 | 153.00 | 149.00 | 151.00 | 152.00 |
| 洗衣液 | 84.00 | 86.00 | 80.00 | 81.00 | 83.00 |
提示:
数据集来自一家小型快速消费品分销公司。数据集有六个列:产品名称、4 月销售、5 月销售、6 月销售、7 月销售和 8 月销售。数据集的第一行包含标题名称。请:
第 1 步:
分析数据结构。
第 2 步:
计算所有产品对之间的相关性。
第 3 步:
可视化销售并将在图上写上相关系数。
第 4 步:
找到销量最高的产品,提取数据,并使用不同的颜色可视化销量最高的产品。
第 5 步:
找到估计 9 月份每个产品销售的最佳方法,并可视化 4 月到 9 月所有产品的销售情况,包括在内。
第一个观察结果是您可以用简单的语言表述提示,没有任何技术性,ChatGPT 就会理解您的需求。


第二个观察结果是数据分析可以非常出色地管理结构化数据。您可以上传 CSV 文件或 Excel 表格,然后指示它处理、分析和可视化数据。数据分析将检查错误、处理不准确的数据、检测异常值等。您还可以要求它组织您的数据。如果您知道自己在做什么,它可以成为您的数据分析助手。

这是一个使用数据分析可以做什么的简单例子。为了处理数据,ChatGPT 将生成代码,执行它,显示它,并评论其表现如何。要检查代码(复制并执行),请点击[>_]标志。

数据可视化的过程涉及几个步骤:
– 理解数据、其结构、变量以及它们之间的关系;
– 根据数据的性质和我们想要传达的见解选择最佳的可视化方式;
– 准备和清理数据,处理缺失值和异常值,或将数据转换为可绘制的格式;
– 使用 Python 及其库(如 Matplotlib、Seaborn 和 Plotly)创建可视化;
– 调整布局、注释和样式,使可视化易于理解;
– 解释可视化的数据。
对于第 4 步,数据分析,选择不同的可视化方式。

ChatGPT 数据分析可能会犯错。尽管它生成 Python 代码来执行许多操作,但它可能在代码中犯错。
在这个例子中,如果您只想解决关键问题,检查结果很简单。更好的方法是把问题分解成可管理的部分,并逐步解决。

10.3 最佳实践^(2)
– 选择那些解决方案的正确性容易验证的问题。创建解决方案并不困难,但验证其准确性可能具有挑战性。ChatGPT 数据分析在生成 Python 代码时仍然可能出错。因此,适合数据分析的问题是可以容忍错误或错误可以迅速被发现的问题。例如,可视化销售数据是容错的,而决定贷款批准则不是。
– 选择那些即使是不完整或部分解决方案也能增加价值或帮助做出决策的问题。例如,从清理你的数据开始。ChatGPT 高级数据分析在那些即使是不完美的解决方案也因其迭代开发、调试和快速原型设计能力而具有价值的问题上茁壮成长。用户可以尝试不同的策略,进行修改,并从错误中学习,从而找到解决方案。
– 数据分析旨在辅助人类推理,而不是取代它。用它来提高你的技能,提供新的见解,或提供有助于决策的视角。避免依赖工具完成排除批判性思考的任务。这种支持可能从自动化日常任务到展示多种解决问题的方法。
– 不要与 AI 分享包含非公开数据的内容,例如敏感信息(例如,社会保障号码、信用卡信息或招聘材料)以及个人信息。
1。OpenAI,"高级数据分析(ChatGPT 企业版)"(2023 年 11 月访问;[help.openai.com/en/articles/8437071-advanced-data- analysis-chatgpt-enterprise-version](https://help.openai.com/en/articles/8437071-advanced-data- analysis-chatgpt-enterprise-version))。
2。麻省理工学院管理,"如何使用 ChatGPT 的高级数据分析功能"(2023 年 11 月访问;mitsloanedtech.mit.edu/ai/tools/data-analysis/how-to-use-chatgpts-advanced-data-analysis-feature/)。
11. 生成式 AI 的未来
直到 2000 年代,我们使用计算机解决问题的方法很简单。拿一个复杂问题,让人类解决问题。然后,让程序员告诉机器重复人类所做的事情。而现在我们有了一个新的机器,它不需要编程。它自己学习或在监督下学习。有些人会称之为 AI,而有些人会称之为另一种自动化。这项技术为 ChatGPT 等创新铺平了道路。
你可能已经听到了炒作:
"ChatGPT 很快就会变得有感知能力。"
"ChatGPT 将拯救我们!ChatGPT 将治愈癌症。ChatGPT 将解决气候变暖。"
"ChatGPT 将毁灭我们。它很快将成为人工超级智能并统治我们。"
但不是这样的!ChatGPT 不能做上述任何一件事情。至少,不是今天。它是一个出色的语言模型,在创意领域有众多应用,但它的语言流畅性并不代表准确性。
ChatGPT 运行良好,但不会自动导致通用人工智能。这是一项强大的技术;只有:
– 它没有直观的推理能力。如果你告诉它街道是湿的,它不能推断出正在下雨。它会要求更多的上下文。

– 它没有真理来源;它不能独立验证其内容的准确性,也不能自行纠正。


– 它的知识仅限于训练语料库中的内容。

但不是很好吗?有一台机器能做这些事情?像 ChatGPT 这样的高级工具的最佳用途依赖于用户的技能和理解,而不仅仅是技术的本身能力。我们应该学习如何使用这个了不起的创造,ChatGPT。我们才刚刚开始探索通过将语言、视觉和自动化结合在一个 AI 系统中所能实现的可能性。
这就是未来。
麦肯锡的研究发现,包括 ChatGPT 在内的生成式人工智能应用每年可能为全球经济增加高达 4.4 万亿美元.^(1)
这对我们未来的意义是什么?
高盛的研究表明,生成式人工智能的进步可能导致未来十年全球 GDP 增长 7%(近 7 万亿美元),并可能在该时期内提高 1.5 个百分点的生产率增长.^(2)
OpenAI 和 UPenn 的研究发现,大约 80%的美国劳动力可能至少有 10%的工作任务会受到生成式预训练变换器(GPTs)的影响。大约 19%的美国工人可能会看到至少 50%的任务受到人工智能兴起和最终采用的冲击。这项研究还表明,类似于 ChatGPT 的人工智能可以比人类工人更快地完成任务,所有工资水平的工作都可能受到影响。
我们将构建新的模型,生成训练语料库中未包含的新想法和知识,这些新知识可能不会包含在我们的科学书籍中,但很可能会基于与 LLMs 不同的架构。
技术变化的速度令人叹为观止,这表明我们将比预期更早地构建这些新机器。今天的 ChatGPT 版本允许用户自由选择用于特定目的的定制 AI。

在 OpenAI DevDay^(3)(2023 年 11 月 6 日,旧金山)上公布了新的功能:
– 一个新的 GPT-4 Turbo 模型,知识截止到 2023 年 4 月,并支持 128K 的上下文窗口。
– 通过结合指令、额外知识和任何技能组合,创建您自己的 ChatGPT 版本的新功能(^(4))。请注意这一点:无需任何开发者经验。创建它就像开始一场对话,给它指令和额外知识,并选择它能做什么,比如搜索网络、制作图像或分析数据。
您可以创建它们。供您个人使用或您公司的内部或公共使用。
在chat.openai.com/gpts/discovery上试一试。
GPT 将继续变得更加熟练。最终,我们将允许它们在现实世界中承担任务。
在人工智能领域,这些系统被称为“代理”。
除了使用内置功能外,您可以通过使一个或多个 API 对 GPT 可用来定义自定义操作。像插件一样,操作允许 GPT 集成外部数据或与世界互动。将 GPT 连接到数据库,将它们插入到电子邮件中,或使它们成为您的购物助手。例如,您可以集成一个旅游列表数据库,连接用户的电子邮件收件箱,或促进电子商务订单。
直到通用人工智能出现——有些人认为这一时刻只有 5-15 年——我们必须在心理上为一个新的世界做好准备,在这个世界中:
– 最优秀的围棋选手是人工智能,
– 最优秀的国际象棋选手是人工智能,
– 人工智能可以参加法律和商学院的考试,
– 人工智能可以参加美国医学执照考试,
– 以及许多归因于人类的成就。
在接下来的几年里,将非常不寻常,因为人工智能技术将加速其融入我们生活的步伐。政治家们应该考虑避免重蹈奥本海默时刻的覆辙,让那些拥有人工智能力量和财富的人在使用它们仅为自己利益服务之前犹豫不决。哲学家们应该思考一种新的社会形态,在那里人工智能技术创造繁荣,土地和资源的冲突将停止。
我们必须为“非人类”智能做好准备,这种智能已经存在并正在增长。当这种新的自动化形式让我们从枯燥的工作中解放出来时,人工智能将重新定义工作、商业,甚至可能甚至我们的存在。我们需要找到更快的方法来提升技能并利用人工智能创造一个更美好的未来。

未来太空探索指挥中心
1。麦肯锡公司,“生成式人工智能的未来是什么?15 张图表中的早期观点”(2023 年 10 月访问;www.mckinsey.com/featured-insights/mckinsey-explainers/whats-the-future-of-generative-ai-an-early-view-in-15-charts)。
-
高盛研究报告,"生成式 AI 可能将全球 GDP 提高 7%" (2023 年 10 月访问;
www.goldmansachs.com/intelligence/pages/generative-ai-could-raise-global-gdp-by-7-percent.html). -
OpenAI, "在 DevDay 上宣布的新模型和开发者产品" (2023 年 11 月访问;
openai.com/blog/new-models-and-developer-products-announced-at-devday). -
OpenAI, "创建 GPT" (2023 年 11 月访问;
help.openai.com/en/articles/8554397-creating-a-gpt).
基本术语
开始使用像生成式 AI(GenAI)这样的革命性技术可能会让人感到不知所措。关键要素是建立共同术语。这对于更准确、有效和知识性地使用这项现代技术至关重要。据我所知,截至 2023 年 9 月,目前还没有关于人工智能和机器学习的通用定义。
人工智能(AI):专注于创建能够执行需要人类智能的任务的计算机系统的研究领域。这些任务包括解决问题、学习和决策。
人工神经网络:受人类大脑启发的计算系统。它是由线条连接的节点或“神经元”组成的网络,这些线条被称为“突触”。数据通过这些连接流动。每个节点处理数据,就像一个微型决策者。一层层地,它们共同工作以解决问题或做出预测。简单的任务只需要几层。复杂的任务需要许多层。它是现代 AI 的骨架。

注意:计算机算法中的工具,有助于关注数据的重要部分。在 AI 和 ChatGPT 等语言模型的背景下,它帮助系统关注关键词或短语,以便更好地理解长句。
多头注意力:一种高级的注意力形式,使用多个“焦点”同时理解数据的不同部分。这就像同时阅读一个句子并理解其意义、语气和上下文。
分类:机器学习中的任务,其目标是将数据分类到特定的类别中。想象一下根据颜色将水果分类到标有“苹果”或“香蕉”的篮子里,那就是分类。你是在将事物归类。例如,它可以帮助判断医学测试显示的是危险的肿瘤还是无害的肿瘤。(图像改编自 Oracle。)LLMs 也能够执行分类任务,例如使用客户评论对产品的评论(正面或负面)进行分类。

聚类:根据相似性对事物进行分组而不需要你标记的任务。想象成玩具组织。你根据外观将汽车、娃娃和动作人偶分成单独的堆。 (图像改编自 Oracle。) 大型语言模型(LLMs)也能执行聚类任务。例如,根据相似特征或问题对客户反馈进行聚类。

上下文窗口:机器学习模型(如 ChatGPT)查看以理解当前讨论内容的单词或数据点范围。它类似于模型的短期记忆,帮助其理解当前关注的单词或短语。

数据集:计算机用于学习或做出决策的信息集合。这可以包括文本、图像、声音或数字。将其视为机器学习模型的“学习材料”。
截止日期:训练数据最后更新的日期。之后,我们无法访问新信息。截至 2023 年 9 月,ChatGPT 的截止日期是 2022 年 1 月。要获取更近期的信息,可以使用添加浏览功能或访问私有资源的插件。
数据挖掘:挖掘大量数据以寻找有用信息或模式的行为。它有助于理解混乱或随机的信息,如大量的文本或图片。
深度学习(DL):基于神经网络的一种机器学习类型,擅长在大量数据中找到微妙的模式。它使用计算层来获得更好和更详细的见解。想象一个智能盒子,可以判断一张图片是狗还是猫。盒子有多个层,寻找不同的特征,如毛发或耳朵,以确定动物。它一开始并不完美,但随着数据的增加而变得更好。
解码器:Transformer 组件,它接受一系列输入表示并生成一系列输出标记。(参见转换器架构)
扩散模型:生成式 AI 模型,其创建图像的过程类似于雕塑家塑造粘土的过程。它从一个原始、未定义的画布开始,逐渐塑造它,细化每个请求的细节,直到达到所需的输出。
训练过程从一组干净、结构化的图像数据集开始。通过一系列步骤逐渐“添加噪声”来创建新图像,直到数据完全变为随机噪声。模型通过学习定义每个步骤去噪过程的参数来学习如何逆转扩散过程。


训练数据集已标记。单词“狗,Cocker Spaniel,坐着”像是一个“提示”,告诉模型它期望生成的内容。
利用扩散模型生成图像的工具可以生成在其训练数据集中找到的主题的变体,这些图像可以是惊人的逼真或艺术化风格化。
嵌入:将单词或符号转换为计算机可以理解的数字集合(称为向量)的功能。这些数字集合帮助机器获取每个单词的意义、上下文或重要性。
编码器:Transformer 组件,它接受一系列输入标记并产生一系列隐藏表示。(参见 Transformer 架构)
可解释人工智能(XAI):试图使人工智能的推理过程对人类更加透明、可解释和可理解的技巧。
微调:在模型构建之后的一个附加功能。微调是关于专业化的,它涉及到对语言模型技能的细化。它涉及到将一个通用语言模型(一个基础模型)变成某个特定领域的专家。目标是教会模型新的技巧或提高它在某些领域的技能。你通过在特定数据集上训练基础模型来进行“调整”。
基础模型:在大量数据(如文本和代码)上训练的语言机器类型。它作为创建更多专用人工智能工具的起点。
生成式人工智能:一种创建新内容的人工智能类型,如文本、图像或声音。虽然使用了“生成”这个术语,但值得注意的是,人工智能并不是从头开始发明,而是重新排列它从所学数据中获取的现有数据。
幻觉:当生成式人工智能(如语言模型)产生基于给定事实或数据之外的东西时。机器可能犯的一个错误。
推理:在人工智能的世界里,这意味着基于现有数据进行有根据的猜测。虽然这被称为“推理”,但它更多的是在数据中寻找模式并做出预测,而不是真正的逻辑思考。
“知识”迁移(学习迁移):预训练的语言模型已经从大量数据中学习了很多。当你对其进行微调时,你是在让新的模型继承这种广泛的知识,然后在某个特定领域进行专业化。这样,微调的模型在它自己的训练中就取得了先机。

语言:用于交流和在一定程度上用于思考的符号或声音集合。人们用它来分享想法、情感和信息。它可以口头表达、书面表达或手势表达,并且具有不同的复杂性。
语言模型(LM):一种训练成模仿人类类似文本或语音的人工智能类型。它从大量的文本数据“语料库”中学习,并使用这些模式生成听起来像来自人的语言。

语言模型参数:语言模型在训练过程中学习到的数字。这些数字,如权重和偏差,指导模型如何将所提供的内容转换为答案或文本。例如,ChatGPT 的训练使用了 1870 亿个参数。
语言模型预训练:在使用之前已经在大量数据上训练过的语言模型。这意味着它可以在不需要额外训练的情况下开始生成文本或回答问题。

语言模型,微调:在特定数据上进一步训练的预训练语言模型。这使得它在处理特定领域的任务或问题时表现得更好。

层:语言模型架构中的构建块。将这些视为语言模型大脑中的步骤。每一层都会学习有关数据的一些信息,进行一些更改,并将其传递下去。它们代表了模型如何学习其知识。

机器学习(ML):研究如何让计算机自主学习。它们不是被告诉做什么(即,被编程做什么),而是使用统计学在数据(如数字、文字或图片)中寻找模式。
消息:AI 和用户之间交换的文本。对话可以短至一条消息,也可以是许多来回的回合。
自然语言处理(NLP):AI 的一部分,帮助计算机理解我们的语言。它构建工具,使计算机能够像我们一样阅读、理解和甚至写作。它处理诸如翻译语言和回答问题等任务。
插件:用于扩展或添加系统新功能的软件工具,否则系统将无法完成这些功能。在 ChatGPT 的情况下,插件是允许 ChatGPT 访问第三方资源或功能的软件组件。仅安装来自可信赖来源且尊重您隐私且不重复使用您数据的插件。

提示:您提供给 AI 模型以获得响应的问题或陈述。OpenAI 文档强调了提供上下文和偏好以定制 AI 响应以满足您需求的重要性。这些附加信息可以使用提示组件框架进行结构化。

提示设计(见提示工程)
提示工程:通常被称为提示设计,代表询问 AI(如 ChatGPT、Bard 等)的正确方式的艺术。您研究如何构建问题以从模型中获得最佳、最准确的答案。这完全是通过试错来找到最佳点。
回归:机器学习中的一个特殊任务,计算机试图预测一个特定的数字。想象一下通过一个人的身高来猜测他们的年龄。您在图表上绘制年龄与身高,并使用此信息来预测新人的年龄。因此,回归帮助您进行基于数字的猜测。

基于人类反馈的强化学习(RLHF):通过人类输入使 AI 变得更智能的功能。您提供反馈,模型从中学习。
SELF-ATTENTION:允许模型(如 ChatGPT)对所阅读的不同部分给予密切关注的特性,即使这些部分相隔很远。
SUPERVISED LEARNING (SL):一种机器学习类型,其中计算机在给定问题和正确答案(标记数据)的情况下,随着时间的推移学习自己解决类似问题。将其视为导师-学生设置。计算机得到一系列问题和它们的答案。它研究它们,以便以后能够自己回答类似的问题。
UNSUPERVISED LEARNING (USL):一种不需要标记数据的机器学习类型。想象一下侦探在没有指南的情况下拼凑拼图。计算机通过数据,自己找到模式。
TEXT NORMALIZATION:将文本转换为标准格式的过程,例如将所有文本转换为小写,删除特殊字符,并将数字转换为它们的文字形式。
TOKEN:构成语言模型处理输入和输出序列的最小语义单元。标记通常代表单个单词或子词,尽管它们也可以包括字符或其他语言单元。每个标记都被分配了一个唯一的标识符(通常是整数)。
TOKENIZATION:将文本分解成单个单元的过程,如单词或短语。这是为 NLP 任务准备文本数据的重要步骤。
TRANSFORMER ARCHITECTURE:构建高级 AI 工具(如 ChatGPT)的蓝图。它由两个主要部分组成:一个理解输入的编码器和一个创建输出的解码器。许多 transformer 是预训练的,这意味着它们在微调特定任务之前已经从大量数据中学习过。

PRE-TRAINED NEURAL NETWORK:已经在大型数据集上训练过的神经网络,以识别数据中的通用模式。它是特定 AI 工具(如 ChatGPT)的基础,并且可以针对特定任务进行微调。
TRANSFORMER LANGUAGE MODEL:使用 transformer 架构构建的语言模型。transformer 使语言模型能够有效地捕获上下文信息。

TRANSFORMER (GENERATIVE PRE-TRAINED TRANSFORMER, GPT):一种特殊的 transformer 类型。与具有编码器和解码器的标准 transformer 不同,GPT 只使用解码器。它在一堆文本上训练,目标是擅长理解和擅长创作类似人类的文本。
TUNING (FINE-TUNING):进一步训练预训练的语言模型(如 ChatGPT)的过程,在较小的数据集上进行,以适应特定任务或领域(例如,医疗保健)。模型已经从其一般训练中知道了很多。但是微调使其成为医疗保健或烹饪食谱等领域的专家。这是关于掌握细节。
训练:通过向语言模型,如 ChatGPT,展示大量数据来教授它执行特定任务的过程。这就像教育一个年轻的大脑。你向语言模型提供大量数据,模型从中提取模式并掌握词语的节奏。
向量:在短语语境中一个词的数值表示。基本上,它是一系列代表词不同方面的数字。让我们将词与人的类比。想象向量就像一个词的数字身份证。想象每个词就像一个人,向量就像他们的档案——身高、年龄和爱好,所有这些都转换成了数字。这个档案帮助计算机理解词在句子中的作用。所以,在数字的世界里,向量是词的身份证。

全副武装的消防员

通往山顶的红色引导线的山间路线

奥卡万戈三角洲的野生动物营

身着土著文化服饰的年轻巴西女性











调整提示以适应您的需求。例如,从教科书生成问题、生成旅行想法等。
通过提供新的清晰搜索条件来自定义提示,以收集相关信息。帮助我找到 [手机型号] 的评论。我想了解其功能、性能和用户体验。
通过指定您想要提取的信息类型来调整提示,以收集相关细节。
根据您的需求调整这些提示,通过调整标准和类别进行修改。
通过提供 AI 清晰的指南来调整这些提示,以创建您的聚类。
根据您的偏好和对话的上下文调整和定制这些提示词。不要忘记指定助手的角色。
根据您的特定翻译需求定制这些提示词。
根据您希望分析情感的具体文本修改这些提示词。
浙公网安备 33010602011771号