IBM-生成式人工智能基础笔记-全-

IBM 生成式人工智能基础笔记(全)

001:课程介绍 🚀

在本节课中,我们将要学习生成式AI的入门知识,了解其核心概念、应用潜力以及本课程的结构与目标。

想象一个由AI驱动的世界,它能让我们工作更高效、寿命更长、能源更清洁。这个世界已经到来。生成式AI对我们生活方式的各个方面都产生了巨大影响。

生成式AI模型能够模仿人类的思维和创造力,以生成新颖的内容并执行复杂的任务,就像你我一样。

组织可以利用生成式AI来提高生产力和盈利能力。个人可以使用生成式AI工具来提升效率,为工作增添实际价值,节省成本并最大化品牌价值。

如果你尚未涉足这一领域,本课程正适合你。我们邀请所有对快速发展的生成式AI领域抱有真诚兴趣的专业人士、爱好者、开发者和学生参与。无论你的背景或经验如何,这是一门面向所有人的课程。

本课程旨在让你对生成式AI的能力、应用、常见模型和工具有一个扎实的理解。在本课程结束时,你将能够描述生成式AI的能力及其在现实世界中的用例,识别生成式AI在不同领域和行业中的应用,并探索常见的生成式AI模型和工具。

课程结构 📚

这是一门精炼的课程,包含三个模块。预计每个模块需要花费一到两个小时完成。

在课程的第一个模块中,你将学习生成式AI的核心概念,了解其在不同领域的应用案例,并理解其在生成文本、图像、代码、音频和视频方面的能力。

在第二个模块中,你将探索不同行业和领域(如信息技术、娱乐、教育、金融和医疗保健)如何利用生成式AI。此外,在本模块中,你还将学习用于生成文本、图像、代码、音频和视频的常见模型和工具的功能与特性,例如 ChatGPTDALL-ESynthesia



第三个模块要求你参与一个最终项目,并完成一个计分测验,以检验你对课程概念的理解。你还可以访问课程术语表,并获得关于后续学习路径的指导。

学习资源与方法 🛠️

本课程融合了概念讲解视频和辅助阅读材料。观看所有视频以充分掌握学习材料的潜力。

你将体验到动手实验和一个最终项目,这些内容展示了生成式AI在多个领域的常见用例。每节课后都有练习测验,帮助你巩固所学知识。课程结束时,你还需完成一个计分测验。

课程还提供了讨论论坛,方便你与课程工作人员联系并与同伴交流互动。最有趣的是,通过专家观点视频,你将听到经验丰富的从业者分享他们对生成式AI不同方面的见解。

课程价值与展望 ✨

当生成式AI正在增强全球个人、组织和社区的创造力表达与专业能力时,请不要驻足观望。本课程为你提供了一个创造新体验的机会。


本节课中,我们一起学习了生成式AI的基本介绍、课程目标、结构安排以及丰富的学习资源。现在,你已经准备好开启探索生成式AI世界的旅程了。

002:为何学习IBM生成式AI

在本节课中,我们将探讨生成式AI为何成为当今各行业领导者的关注焦点,以及学习IBM生成式AI课程对个人职业发展的重要性。

生成式AI是每一位领导者、每一个组织、企业或政府都在思考的议题。随之而来的关注也带来了机遇。各组织正在寻找理解这项技术的人才。更重要的是,他们需要具备应用这项技术技能的人才。

与以往许多趋势性技术不同,生成式AI几乎触及了每个职业中的每一个角色。生成式AI技能预计将变得非常重要,不仅对计算机科学家如此,对所有人都是如此。这些技能将变得像文字处理、电子表格甚至基本商业素养一样必不可少。这正是这些“面向所有人的生成式AI”课程设立的原因。

当前,人们对AI产生了许多新的兴趣。企业正在将目光超越消费级AI。聊天机器人界面是展示生成式AI潜力的绝佳方式。然而,现实生活中的用例是将生成式AI嵌入现有流程,并使其成为几乎每个业务工作流程中不可或缺的功能。

IBM很自豪能够帮助企业将生成式AI整合到其运营中。通过这些课程,你将获得的技能应有助于你的职业生涯,并能立即应用到你的工作中。

企业对生成式AI的潜力感到兴奋,但同时也对潜在的危险感到担忧。这项使命至关重要,不容有失。这些课程将赋予你处理AI伦理问题的技能,这些技能基于IBM开创的、负责任的、脚踏实地的研究方法。


本节课中,我们一起学习了生成式AI的广泛影响力及其成为必备技能的原因,了解了企业如何超越简单的聊天机器人应用,将AI深度整合到业务流程中,并认识到IBM课程在提供实用技能和负责任AI伦理观方面的重要价值。

003:专项课程介绍 🚀

在本节课中,我们将全面了解IBM的《生成式AI基础》专项课程。该课程旨在帮助学习者,无论其技术背景如何,都能掌握生成式AI的核心概念、工具与应用,从而把握这一变革性技术带来的机遇。

你知道吗?全球的营销人员已经在使用生成式AI来创作内容、撰写文案、激发创意、分析市场数据以及生成图像。

根据彭博社的预测,生成式AI市场预计到2032年将达到1.3万亿美元。因此,深入了解生成式AI对你而言至关重要。那么,生成式AI适合所有人吗?答案是肯定的。你可以利用它的潜力,为自己创造更好的职业发展和生活。本专项课程面向所有渴望探索生成式AI力量的人,无需具备先前的AI技术知识或背景。即使是初学者也能从中受益,因为它全面涵盖了生成式AI的基本概念、模型、工具和应用。

完成本专项课程后,你将能够:

  • 解释生成式AI基础模型的基本概念、能力、模型、工具、应用和平台。
  • 描述提示工程,并应用强大的提示工程技术来编写有效的提示,从而从AI模型中生成期望的结果。
  • 讨论生成式AI的局限性,并解释其伦理关切及负责任使用的考量。
  • 认识到生成式AI在提升你职业生涯和帮助改进工作场所方面的能力。

本专项课程包含五门自定进度的课程,每门课程需要3到5小时完成。


课程一:生成式AI入门与应用领域

课程一是你理解生成式AI能力的第一步,其能力涵盖文本、图像、音频、视频、虚拟世界、代码和数据等多个领域。你将了解不同行业如何应用常见的生成式AI模型和工具,例如GPT、DALL-E、Stable Diffusion、IBM Granite和Synthesia。


课程二:提示工程的艺术

上一节我们介绍了生成式AI的广泛应用,本节中我们来看看如何有效地与AI交互。课程二介绍了提示工程的概念,以及它如何帮助你释放像ChatGPT这样的生成式AI工具的全部潜力。你将探索开发有效提示的技术、方法和最佳实践,并使用IBM Watsonx.ai、Spellbook和Dust等常用工具进行实践。


课程三:核心概念与构建模块

掌握了与AI对话的技巧后,我们需要深入理解其背后的原理。课程三专注于生成式AI的核心概念和构建模块,例如深度学习、基于Transformer架构的大语言模型、扩散模型和基础模型。你还将了解不同的生成式AI平台,如IBM Watsonx.ai和Hugging Face。


课程四:伦理考量与局限性

了解了技术原理,我们必须同时关注其带来的影响。课程四探讨与生成式AI相关的伦理考量:它如何影响数据隐私与安全、版权侵权、劳动力以及环境。你还会描述其局限性,例如数据偏见、缺乏可解释性、透明度和可理解性,并识别生成式AI的常见误用,如深度伪造和幻觉。


课程五:未来展望与职业机遇

最后,课程五讨论生成式AI的未来。你难道不想知道在那个未来里,你的职业机会有哪些吗?你将学习生成式AI如何影响和增强不同行业和领域的现有职能、技能和工作角色,以及如何利用生成式AI构建自己的应用程序,创造新的商业机会。

本专项课程的内容旨在吸引并赋能你。通过观看精选的概念视频、聆听AI专家分享他们的见解和技巧,以及在实验和项目中实践技术,你将在日常生活中使用生成式AI工具和应用程序时感到更加自信。

目前,65%的生成式AI用户是千禧一代或Z世代,72%是在职人员。通过本专项课程的学习,你将准备好加入生成式AI变革者的行列。

生成式AI,属于每一个人。


本节课中,我们一起学习了IBM《生成式AI基础》专项课程的整体架构与学习目标。该课程从入门应用、交互技巧、核心原理、伦理风险到未来展望,为你构建了完整的知识体系,帮助你自信地迈入生成式AI的世界,抓住未来的机遇。

生成式AI基础:04:专家观点:领域专家介绍 👨‍💼👩‍💼

在本节课中,我们将认识几位生成式人工智能领域的专家,了解他们的背景、职责以及他们如何看待这一技术。


欢迎来到本视频,在这里我们将与专家们见面。

让我们听听专家们的自我介绍,包括他们的姓名、职位以及他们工作的组织。

大家好,我叫阿比·戈内贾,我是人工智能领域的主题专家,也是IID的一名人工智能研究员。

大家好,我叫塞皮达·萨扎尔,我是IBM K工程团队的一名AI工程师。我很高兴能在这里与大家探讨生成式AI。

我叫布拉德利·斯坦菲尔德,我是IBM的一名高级软件架构师。

大家好,我是梅尔,在人工智能和数据工程领域拥有超过12年的经验。我目前担任Simply Contract Technologies的数据架构师。

嗨,我是马蒂·布莱利,我是Evergreen AI的首席执行官兼创始人。

接下来,让我们看看专家们如何介绍他们的背景,包括多年的经验和资历。

关于我的背景,我在加拿大滑铁卢大学获得了人工智能领域的博士学位,在此之前,我正在攻读机器人学硕士学位。

完成学业后,我开始在这一领域工作,从事大数据分析。之后移居美国,我仍然在同一领域工作。最近,随着大语言模型和生成式AI的新趋势,我一直在努力为我们的客户在不同的用例中实施和应用这项技术。

我在IBM工作了十多年,大部分时间在教育领域的Skills Network工作。

我们在Evergreen AI从事多项与AI相关的工作,但我们专注于生成式AI。我们提供生成式AI培训、生成式AI战略咨询,帮助您理解生成式AI在组织中的定位。我们还有一个小的开发部门,可以帮助进行一些集成工作。但我为我们的一些培训项目感到自豪,这些课程为组织中的每个人提供AI基础、面向领导者和高管的AI培训,展示如何利用现有工具更好地完成工作。这适用于那些希望了解如何在当前工作流程中使用AI以提高效率、实现十倍改进的人们。

我曾在银行、金融、电子商务、制造和制药行业工作过。每个行业都有其独特的挑战,这些经历丰富了我对数据和人工智能实际应用的专业知识和视角。

除了处理数据和算法,我还将职业生涯的相当一部分投入到了指导和培训有抱负的AI专业人士及数据科学家。我致力于培养新一代的专家,以应对我们数字世界不断演变的挑战。我很高兴能与大家合作、学习并做出有意义的贡献。感谢大家的欢迎,我期待与大家一起踏上这段激动人心的旅程。

😊

是的。


本节课中,我们一起认识了多位生成式AI领域的专家,了解了他们多元化的背景和丰富的行业经验。从学术研究到企业应用,从战略咨询到技术实施,这些专家代表了推动生成式AI发展的核心力量。他们的分享为我们理解这项技术的实际应用和未来潜力提供了宝贵的视角。

005:生成式AI导论 🧠

在本节课中,我们将要学习生成式人工智能的基本概念。我们将了解什么是生成式AI,它如何演变而来,以及它与判别式AI有何不同。


人工智能,或称AI,已经存在多年,它塑造了我们生活的几乎每个领域,并彻底改变了我们的生活和工作方式。

AI的核心可以被定义为机器对人类智能的模拟。AI模型从海量的现有数据中学习。这个从数据中学习的过程被称为训练


判别式AI与生成式AI

AI有两种基本方法:判别式AI和生成式AI。

上一节我们介绍了AI的基本概念,本节中我们来看看这两种不同的AI方法。

判别式AI是一种学习区分不同数据类别的方法。一个判别式AI模型会被给予一组训练数据,其中每个数据点都标有其类别。然后,该模型通过找到新数据点落在决策边界的哪一侧来预测其类别。判别式AI模型使用高级算法来区分、分类、识别模式,并根据训练数据得出结论。

以下是判别式AI模型工作原理的一个例子:

  • 电子邮件垃圾邮件过滤器可以区分垃圾邮件和非垃圾邮件。

判别式AI模型最适合应用于分类任务;然而,它们无法理解上下文,也无法基于对训练数据的上下文理解来生成新内容。


生成式AI的引入

而这就是生成式人工智能,或称生成式AI,发挥作用的地方。

生成式AI模型学习基于训练数据生成新内容。它们能够捕捉训练数据的底层分布,并生成新颖的数据实例。

生成式AI从一个提示开始。这可以是文本、图像、视频或模型可以处理的任何其他输入。作为输出,模型会生成新的内容,包括文本、图像、音频、视频、代码和数据。生成式AI可以以与提示相同的形式产生输出,例如文本到文本;也可以以与提示不同的形式产生输出,例如文本到图像图像到视频

这里有一个简单的例子来理解判别式(或传统)AI与生成式AI之间的区别:

  • 判别式AI最适合回答诸如“这张图片画的是鸟巢还是鸟?”这类问题。
  • 生成式AI则会响应诸如“画一张有三个蛋在里面的鸟巢图片”这样的提示。

判别式AI模仿我们的分析和预测能力,而生成式AI则更进一步,模仿我们的创造能力。正如《哈佛商业评论》的评论所暗示的:“AI不仅可以提升我们的分析和决策能力,还可以增强创造力。”

生成式模型可以利用它们所学到的知识,基于这些信息创造出全新的内容。


生成式AI的技术基础

判别式模型和生成式模型都是使用深度学习技术创建的。深度学习涉及训练人工神经网络从海量数据中学习。

人工神经网络是由称为神经元的较小计算单元组成的集合,其建模方式类似于人脑处理信息的方式。

生成式AI的创造能力来自于生成式AI模型,例如:

  • 生成对抗网络
  • 变分自编码器
  • Transformer模型
  • 扩散模型

这些模型可以被视为生成式AI的构建模块。


生成式AI的演变

生成式AI并非一个新概念。它的根源可以追溯到机器学习的起源。在20世纪50年代末,当科学家提出机器学习时,他们探索了使用算法来创建新数据。在20世纪90年代,神经网络的兴起进一步推动了生成式AI的发展。在21世纪10年代初,深度学习在大型数据集可用性和增强计算能力的支持下,进一步推动了生成式AI的发展。

2014年,随着Ian Goodfellow及其同事引入GANs,生成式AI发生了转变。GANs以及其他模型,如VAEs和Transformers,为生成式AI的增长以及基础模型和工具的开发奠定了基础。

基础模型是具有广泛能力的AI模型,可以进行调整以创建更专业的模型或针对特定用例的工具。

一类特定的基础模型称为大语言模型,它们经过训练以理解人类语言,并且可以处理和生成文本。

2018年,OpenAI推出了一种基于Transformer的LLM,称为生成式预训练Transformer。多年来,不同的LLM,如GPT系列中的GPT-3和GPT-4、Google的Pathways语言模型以及Meta的大语言模型Meta AI,都显著增强了生成式AI生成连贯且相关文本的能力。在其他用例的模型方面也有类似的发展,例如用于图像生成的Stable Diffusion和DALL-E模型。

各种生成模型的发展导致了针对不同用例的生成式AI工具市场的增长。例如:

  • 用于文本生成的ChatGPT和Jasper。
  • 用于图像生成的DALL-E 2和Midjourney。
  • 用于视频生成的Synthesia。
  • 用于代码生成的GitHub Copilot和AlphaCode。

生成式AI的应用与影响

快速涌现的模型和工具为跨领域的生成式AI应用创造了广阔的范围。引用麦肯锡关于生成式AI经济潜力的报告:“生成式AI有潜力改变工作的结构,通过自动化个人部分活动来增强个体工作者的能力。”报告还预测,生成式AI对生产力的影响可能为全球经济增加数万亿美元的价值。


总结

本节课中我们一起学习了生成式AI的核心知识。我们了解到,生成式AI模型可以根据其训练的数据生成新内容。此外,我们还了解到生成式AI的创造能力建立在诸如GANs、VAEs、Transformers和扩散模型等模型之上。基础模型可以被调整以创建针对特定用例的专业模型或工具。最后,我们认识到生成式AI模型和工具在不同领域和行业中具有广泛的应用前景。

生成式AI基础:01:生成式AI的核心能力 🚀

在本节课中,我们将学习生成式人工智能(Generative AI)的核心能力,并探索它们在现实世界中的应用。生成式AI能够根据给定的输入,创造出全新的、连贯的内容,其能力范围广泛,涵盖了文本、图像、音频、视频、代码、数据乃至虚拟世界的生成。

上一节我们介绍了生成式AI的概览,本节中我们将深入探讨其各项具体能力。

以下是生成式AI的七项核心能力:

  1. 文本生成:生成清晰、流畅且符合语境的文本回复。
  2. 图像生成:合成具有艺术性或高度逼真、与真实图像相似的图片。
  3. 音频生成:进行音乐创作和合成音频。
  4. 视频生成:基于文本描述甚至静态图像,生成动态的电影或短视频。
  5. 代码生成:生成代码片段、函数或完整的程序。
  6. 数据生成与增强:生成合成数据以创建或扩充数据集。
  7. 虚拟世界创建:创造逼真且沉浸式的虚拟世界。

这些只是生成式AI能力的一部分。本质上,人类思维能够设想的任何潜在应用场景,都可能成为生成式AI的应用方向。

现在,让我们更深入地了解其中几项能力。

文本生成能力 📝

生成式AI文本生成能力的核心是先进的人工智能驱动的大型语言模型(Large Language Models, LLMs)。这些模型在大型数据集上进行训练,能够在各种语境下生成类人文本。它们学习数据中的模式和结构,以生成连贯且符合语境的回复。

这些模型能够生成文本、进行对话、提供解释、总结等。一些流行的LLMs包括OpenAI的生成式预训练变换器(GPT)和Google的PaLM语言模型。这些模型可以执行多种语言相关任务,例如:

  • 文本补全
  • 摘要
  • 问答
  • 翻译
  • 代码生成
  • 图文配对

与聊天机器人和虚拟助手的对话交互就是由LLMs驱动的。

图像生成能力 🎨

生成式模型可以基于深度学习技术(如生成对抗网络 GANs 和变分自编码器 VAEs)生成高质量、逼真的图像。这些生成的图像展现出真实的纹理、自然的色彩和精细的细节,给人以真实相机拍摄的印象。

例如:

  • StyleGAN 可以生成高质量、高分辨率的虚构人脸、动物或自然景观的新图像。
  • DeepArt 可以从简单的草图创作出完整的艺术品。
  • DALL-E 可以根据用户的描述生成全新的图像。

除了在艺术、设计、娱乐、游戏和研究领域的应用外,生成的图像还可以用于增强训练数据,并辅助医学成像和科学可视化。

音频生成能力 🔊

在音频生成方面,生成式模型可以:

  • 生成新的音乐作品。
  • 使用文本转语音(TTS)技术将文本转换为音频。
  • 创建合成语音和自然听感的语音。

这些模型还能够转换、修改、清理语音,降低噪音并提升音频质量。它们还具备相当程度地模仿人声的能力。

例如:

  • WaveGAN 可以创建新的、逼真的原始音频波形,包括语音、音乐和自然声音。
  • OpenAI的 MuseNet 可以结合各种乐器、风格和流派来生成新颖的音乐作品。
  • Google的 Tacotron 2Mozilla TTS 使用先进的TTS系统来创建合成语音,模仿人类的音调、音高、调制、发音、节奏和表达。

生成式模型生成的音频在媒体创意、娱乐、培训、教育、游戏、虚拟现实等多个领域有应用。

视频生成能力 🎬

生成式AI模型可以创建动态、清晰的视频,范围从基本动画到复杂场景。这些模型通过结合时间连贯性和自然语言处理,将图像转化为动态视频。

时间连贯性指的是意义或语境随时间推移的一致性和连续性。这使得模型能够在视频中展现出流畅的运动和合理的过渡。

例如,流行的AI模型 VideoGPT 遵循用户提供的文本提示来生成新视频。用户可以指定所需内容来指导视频生成过程,包括补全、编辑、合成、预测和风格迁移。生成的视频可用于艺术、娱乐、教育、游戏、医学和研究等领域。

代码生成能力 💻

生成式模型可以根据所需功能,生成新的代码片段、函数或完整程序。这些模型在现有代码库上进行训练,能够:

  • 补全或创建代码。
  • 合成或重构代码。
  • 识别并修复代码中的错误。
  • 测试软件。
  • 创建文档,包括注释、功能描述和使用示例。

例如,GitHub CopilotIBM Watson Code Assistant 是基于AI的编程助手,可以帮助自动补全代码、协助完成困难任务,并为给定的输入生成代码。

AI生成的代码可用于软件和Web开发、机器学习和自然语言处理、数据科学与分析、机器人技术与自动化、虚拟游戏和AR/VR环境开发以及音视频和语音处理。软件开发人员可以利用代码生成能力来编写、调试和测试代码。

数据生成与增强能力 📊

生成式模型可以生成新数据并增强现有数据集。生成合成数据集有助于增加数据的多样性和可变性,从而带来更稳健、更有效的性能。

这些模型可以为图像、文本、语音、表格数据和统计分布、时间序列数据、金融数据等生成新样本并增强数据集。

生成式AI的数据生成与增强能力在医学、医疗保健、游戏、教育与培训、艺术与创意、自动驾驶汽车等众多领域有应用。

虚拟世界创建能力 🌐

生成式AI模型的另一项强大能力是创建高度逼真和复杂的虚拟世界。你可以创建模拟真实行为、表情、对话甚至决策的虚拟形象(Avatar)。你还可以创建具有逼真纹理、声音和遵循物理世界原理的物体的复杂虚拟环境。

元宇宙平台使用生成式模型为个体用户创造独特和个性化的体验。生成式AI还可以创建具有独特个性的虚拟身份,这些虚拟形象可以被赋予特定的个人特质,并反映在它们的行为和对话中。

生成式AI的虚拟世界能力在游戏、娱乐、教育、增强与虚拟现实、元宇宙平台以及虚拟影响者和数字人格等领域有应用。

总结

在本节课中,我们一起学习了生成式AI模型的一些核心能力及其在现实世界中的应用。

  • 生成式AI可以创建连贯且符合语境的文本内容。
  • 它能生成逼真的高质量图像、合成语音、新音频和动态视频。
  • 生成式AI模型能够生成和补全代码,并合成新数据以增强现有数据集。
  • 生成式AI模型还能够创建高度逼真和复杂的虚拟世界,包括虚拟形象和数字人格。

这些能力共同构成了生成式AI强大而多样的应用基础。

生成式AI基础:07:专家观点:生成式AI能力解析 🧠

在本节课中,我们将聆听AI专家解析生成式AI的常见能力,了解它如何为企业和专业人士带来变革。


生成式AI提供了多种能力,使企业和专业人士受益。它尤其擅长内容创作,例如生成文本、图像、音乐甚至视频,从而简化营销和创意流程。

基于大语言模型的一些常见用例包括摘要信息提取内容生成分类。它也可以作为协同生成工具。

生成式人工智能的应用不仅限于生成原始数据,还包括生成模式、配置、设置等多种形式。具体到工业领域,合成数据能以多种方式帮助各行各业。

一个我们与客户合作时非常常见的用例是RAG(检索增强生成)。这是一个当前非常流行和常见的用例,因为客户拥有许多私有文档,他们不希望将这些文档暴露在公有云或公开环境中,但他们希望从这些文档中快速检索信息。

生成式AI不仅仅是一个花哨的概念,它是一个游戏规则改变者。想象一下,拥有一个能激发你的创造力、理解你的需求并为你节省时间的数字助手,这正是生成式AI所做的。因此,告别猜测,拥抱未来。生成式AI的到来是为了让一切变得更快、更好、更个性化。


上一节我们了解了生成式AI的核心能力,接下来我们看看这些能力具体如何使企业和专业人士受益。

生成式AI可以通过多种方式帮助我们。例如,在文本生成方面,GPT等模型可以帮助生成可用于营销材料的文本。在图像生成方面,GANs等技术可以创建非常接近真实图像和视频的内容。它还能帮助进行音乐和音频生成、数据合成与增强。

AI驱动的内容生成节省了时间,并通过自动化撰写报告、创建社交媒体帖子和设计图形等任务来降低成本。此外,生成式AI通过个性化推荐和交互式聊天机器人增强了客户体验,从而提升了参与度和满意度。在设计和产品开发领域,它通过快速生成多种设计变体,有助于快速原型设计和探索创新解决方案。

例如,在医疗保健行业,涉及合成数据生成和合成图像生成的操作可以保护患者隐私,即保护患有特定疾病的人的隐私。生成式AI也可用于金融分析中的欺诈检测。众所周知,它在制药行业被用于发现更多的药物模式。因此,这是一个应用范围非常广泛的结构,生成式AI正在不断提供巨大帮助。

它能绘制令人惊叹的图画,撰写引人入胜的故事,甚至像专家一样翻译语言。个性化推荐也不在话下,这个AI伙伴能准确找到你想要的东西,无论是电影、产品,甚至是职业道路。在医疗保健和航空等场景中,它能创建逼真的模拟用于培训,使学习变得安全高效。但这还不是全部,生成式AI自动化了任务,让你能腾出时间专注于更重要的事情。

因此,所有这些任务都有助于我们增强创造力、个性化体验并做出数据驱动的决策,最终提高效率、竞争力和客户满意度,这是我们的最终目标。


本节课中,我们一起学习了专家对生成式AI能力的解读。我们了解到,生成式AI的核心能力涵盖内容创作(文本、图像、音频、视频)、信息处理(摘要、提取、分类)以及通过RAG等技术进行私有知识检索。这些能力为商业和专业人士带来了节省时间、降低成本、增强创造力、提升个性化体验和驱动数据决策等多重益处,最终助力实现提高效率、竞争力与客户满意度的目标。

生成式AI基础:1.4:专家观点:探索生成式AI的演进历程 🚀

在本节中,我们将聆听专家们的见解,共同探讨生成式人工智能(Generative AI)的发展历程,并了解它与传统人工智能方法的区别。


生成式人工智能与人工智能共同演进,但近年来获得了更多关注。它已存在超过20年,但过去并不流行。随着生成对抗网络(GANs)和变分自编码器(VAEs)等技术的出现,生成式AI获得了巨大发展动力,几乎已成为行业的未来。

生成式AI的演进,以其创造新颖原创内容能力的显著进步为标志。早期的生成式AI模型在连贯性和质量上有所不足。但自从GPT-3,以及随后的GPT-4和DALL-E等模型出现后,它们能够生成高度复杂的文本和图像,从而增强了各领域的创造力和自动化水平。


演进历程概览

以下是生成式AI技术发展的几个关键阶段:

  • 基于规则的机制与传统模型:系统仅在提供的上下文内工作,并遵循预设的规则。
  • 机器学习与统计模型:这些模型能够从数据中发现模式。相较于基于规则的系统,它们通过半监督学习、监督学习或强化学习,能够更智能地处理任务。
  • 深度学习与神经网络:它们能以更先进的方式在数据集中发现模式,并处理非结构化格式的数据。
  • 生成对抗网络(GANs):这开启了生成任务和创造新数据的新时代。
  • 长短期记忆网络(LSTM)与Transformer:这些神经网络架构帮助我们更先进地处理某些用例,以及非结构化格式的数据和时间序列数据集。

上一节我们回顾了生成式AI的技术演进路径,接下来我们看看它与传统AI方法的核心区别。


与传统AI方法的区别

区分生成式AI与传统AI方法至关重要。传统AI侧重于分析和预测现有数据,例如分类、回归、推荐等任务。生成式AI则不同,特别是在生成对抗网络(GANs)和Transformer模型出现之后,它能够创造与训练数据相似的新数据。

过去五六十年,人工智能的发展是从基础水平走向应用和预测水平。生成式AI则更多地关注于利用人工智能技术生成人类质量的输出。

2017年,一篇名为《Attention is All You Need》的论文开启了生成任务的新纪元。如今,开源社区中已有许多类似GPT的模型。其核心理念是拥有一个经过预训练的大模型和庞大的数据集,可以轻松针对特定任务进行微调。

简单来说,传统AI执行指令,而生成式AI则能自主构思和创造,就像一位酷炫的AI发明家。


总结

在本节课中,我们一起学习了生成式AI的演进历程。我们从早期的规则系统,经过机器学习和深度学习阶段,一直探讨到以GANs和Transformer为代表的现代生成模型。同时,我们也明确了生成式AI与传统AI的核心区别:传统AI擅长分析和预测,而生成式AI的核心能力在于创造与创新。理解这一演进和区别,是掌握生成式AI基础的重要一步。

009:生成式AI的应用场景 🚀

在本节课中,我们将学习生成式人工智能(Generative AI)在不同领域的具体应用。通过了解这些应用场景,你将能够认识到生成式AI如何改变各行各业的工作方式。

概述

生成式AI能够创造新的内容,从代码、文本到图像和音乐。这种能力使其在多个行业中找到了广泛的应用。本节我们将逐一探讨生成式AI在IT与运维、娱乐、教育、银行金融、医疗保健、人力资源以及通用工作场景中的具体应用。


IT与运维领域的应用

上一节我们介绍了生成式AI的基本概念,本节中我们来看看它在IT与运维(IT & DevOps)领域的应用。生成式AI有助于改进软件交付流程和基础设施管理。

以下是生成式AI在IT与运维中的主要应用:

  • 代码生成:生成式AI的代码生成能力减少了手动编码的工作量和在重复性任务上花费的时间。
  • 代码审查:由生成式AI驱动的代码审查工具(如 GitHub CopilotSynk DeepCode)会检查代码库和编码标准,以提高代码质量和可维护性。
  • 自动化测试:生成式模型可以生成模拟用户行为的合成测试用例和测试数据。测试用例的变化会影响软件的效率、可靠性和健壮性。像 ApplitoolsTestim 这样的工具通过增加数据集的深度和多样性来保证充分的测试覆盖率。
  • 监控与异常检测:为了监控和检测代码中的异常,像 IBM的Watson AIOpsMoogsoft AIOps 这样的工具会分析系统日志、指标和其他数据。这有助于进行主动维护和故障排除,减少停机时间并防止关键故障。
  • 持续集成与部署GitLab Duo 通过自动创建发布说明、变更日志以及更新部署模板和脚本来支持持续集成与部署(CI/CD)流程。

IT和运维领域的其他应用还包括自然语言界面、自动化基础设施管理和预测性维护。


娱乐领域的应用

了解了生成式AI如何优化技术流程后,我们转向创意产业。在娱乐领域,生成式AI工具可以生成各种合成内容。

以下是生成式AI在娱乐行业的主要应用:

  • 内容生成:可以生成音乐、剧本、故事、视频、电影和电子游戏等内容。
  • 内容本地化与个性化:能够翻译、本地化和个性化内容。
  • 游戏与体验开发:像 Side Effects的Houdini 这样的游戏开发工具利用生成式AI的力量来创建游戏、动画、增强现实和虚拟现实体验,以及具有独特行为的角色。
  • 虚拟形象:最近,由生成式AI驱动的虚拟影响者和虚拟形象也流行起来,它们可以与用户互动,创造引人入胜的体验。

教育领域的应用

娱乐之后,我们来看看对个人发展至关重要的领域。生成式AI另一个产生巨大影响的领域是教育,从内容生成到个性化和自适应学习体验,再到模拟体验式学习。

以下是生成式AI在教育领域的主要应用:

  • 语言翻译:凭借其语言能力,它们可以提供语言翻译,使内容能以不同语言访问。
  • 作业与反馈:可以批改作业以提供即时反馈,并创建支持个体学习者节奏和优势的学习路径与评估策略。
  • 个性化学习:可以根据学习者的表现和偏好生成分类法(学习路径)。生成式算法可以检测特殊需求和学习障碍,以帮助学习者和教育者制定特定的课程计划。
  • 学习追踪:生成式算法也被用于追踪学习者随时间推移的进度,这被称为知识追踪。这有助于为个人需求提供合适的节奏和内容。
  • 综合支持:辅导支持、虚拟和模拟环境以及包容性教育也从中受益。

例如,Nolej 可以在几分钟内提供AI生成的电子学习内容,包括针对目标主题的交互式视频、术语表、练习题和摘要。Duolingo 是一个语言学习平台,它使用GPT-3来纠正法语语法并为英语创建测试项目。


银行与金融领域的应用

从教育转向经济领域,银行和金融机构极大地受益于生成式AI自动检测风险、生成见解和提供具备金融知识的建议的能力。

以下是生成式AI在金融领域的主要应用:

  • 行业专用模型Kore.ai 是第一个银行业专用的LLM,帮助银行应用程序提供类人的、具备金融知识的响应。
  • 风险评估:例如,DataRobot 可以通过模拟潜在的欺诈场景来生成合成用例,以检测信用风险、欺诈风险和市场波动。
  • 信用评分PersonticsAIO Logic 利用生成式模型来检测风险、确定利率并构建定制贷款。它们自动化评估客户信用度并设定信用额度或保险费率。
  • 市场分析:由生成式AI驱动的工具,如 BloombergGPT,可以分析新闻文章、社交媒体和其他分类文本数据,以更有效地进行市场情绪分析和管理投资组合。
  • 客户服务:生成式AI工具建立了对话系统,并使用机器人顾问、聊天机器人和虚拟助手来协助财务规划。

反洗钱、监管合规与报告、财务预测、投资组合优化和算法交易是一些极大受益的领域。需要注意的是,其中一些应用和工具同时利用了生成式和判别式AI模型。


医疗保健领域的应用

现在让我们讨论一些在医学和医疗保健研究、药物发现、诊断和患者护理方面的应用。

以下是生成式AI在医疗领域的主要应用:

  • 医学影像分析:凭借其生成类似于患者数据的合成图像的能力,生成式模型提高了用于医学图像分析的深度学习模型的健壮性。这些模型可以为数据非常有限的罕见医疗状况合成数据。这有助于促进研究、训练AI模型并为罕见病例开发新的诊断工具。
  • 药物发现:在药物发现中,这些模型通过生成新分子、加速药物发现过程和降低开发成本来提供帮助。
  • 远程医疗:远程医疗和远程监护也受益于生成式AI驱动的对话工具。例如,Rasa 可以与患者建立具备医学知识的对话,以提供即时医疗建议、健康相关支持和个性化治疗计划。

该领域的其他应用包括电子健康记录管理、医疗保健欺诈检测以及医学模拟和培训。


人力资源领域的应用

让我们看看生成式AI如何赋能人力资源部门,以自动化重复性任务、提供有价值的见解并简化HR流程。

以下是生成式AI在人力资源领域的主要应用:

  • 流程自动化:例如,Watson X Orchestrate 帮助自动化HR任务,如创建职位需求、筛选和入围相关简历、安排面试、候选人入职等。
  • 人才招聘Talenteria 专注于人才招聘。
  • 员工互动Leena AI 使用对话式AI系统来自动化HR任务和员工互动。
  • 绩效管理McCormick 专注于工作场所和绩效管理,自动生成绩效文档和评估。

HR中生成式AI的其他应用包括培训与发展、分析与决策,以及合规与政策实施。


对工作方式的普遍影响

虽然我们今天只谈到了几个领域,但人们最终相信生成式AI将对所有行业产生重大影响。另一个产生巨大影响的领域是我们的工作方式。

根据麦肯锡关于生成式AI经济潜力的报告,当前的生成式AI和其他技术有潜力自动化当今占用员工60%至70%时间的工作活动。到2030年至2060年间,今天一半的工作活动可能会被自动化。生成式AI日益增长的理解自然语言的能力最终将影响甚至通常与高等教育和习得技能相关的知识型工作。


总结

本节课中,我们一起学习了生成式AI在各个领域的流行应用。然而,重要的是要注意,生成式AI的潜在应用在所有行业和生活的各个方面几乎是无限的。

  • IT与运维中,应用包括代码生成、代码审查、自动化测试、监控与异常检测、自动化文档以及持续集成与部署流程。
  • 娱乐中,生成式AI通过生成各种合成内容以及翻译、本地化和个性化内容,提供了令人兴奋的可能性。
  • 教育中,生成式AI改变了教育的覆盖范围和质量,影响着学习者、教育者和教育技术。
  • 金融中,应用领域包括风险评估、信用评分、情绪分析、投资组合管理、合规、预测、交易和客户服务。
  • 医学和医疗保健中,我们看到应用在医学研究、诊断、医学培训、患者护理和远程医疗方面。
  • 人力资源中,应用领域包括人才招聘、员工互动、绩效管理、培训与发展、HR分析和政策实施。
  • 工作场所,生成式AI的应用正在改变我们的工作方式,使我们更高效、更成功。

010:文本生成工具 🛠️

在本节课中,我们将学习生成式AI在文本生成领域的核心工具。我们将了解大型语言模型如何工作,并探索以ChatGPT和Bard为代表的主流文本生成工具及其应用。

概述

文本生成是生成式AI的核心能力之一。其基础是大型语言模型,它们通过学习海量文本数据中的模式和结构,能够理解上下文、语法和语义,从而生成连贯且符合语境的文本。本节我们将介绍这些模型的基本原理,并详细探讨几种流行的文本生成工具。

大型语言模型基础

上一节我们介绍了生成式AI的基本概念,本节中我们来看看文本生成的核心引擎——大型语言模型。

大型语言模型是生成式AI文本生成能力的核心。它们基于在训练期间学习到的模式和结构来工作。LLMs通过解读上下文、语法和语义,生成连贯且符合语境的文本。其核心原理是学习词语和短语之间的统计关系,这使得LLMs能够为任何给定语境调整并创造写作风格。

公式表示其核心思想可简化为:
生成的文本 = 模型(输入提示 | 训练数据中的统计模式)

许多文本生成模型都以LLMs为基础。其中两个著名的例子是生成式预训练变换模型和PaLM模型。这些模型已发展为多模态模型,提供多种能力。

主流文本生成工具

了解了基础模型后,我们通过两个流行工具来具体了解它们的能力:ChatGPT和Bard。

ChatGPT:基于GPT的对话引擎

ChatGPT基于GPT系列大型语言模型,并采用了先进的自然语言处理技术。最初,ChatGPT仅接受文本提示作为输入来生成新内容。随着版本更新,现在它可以同时接受图像和文本输入。

ChatGPT为文本生成提供了多样化的能力,尤其擅长进行流畅且基于上下文的对话。

以下是ChatGPT的一些关键能力示例:

  • 上下文对话:你可以开启一个对话来学习某个概念。例如,输入提示“我听说过生成式AI,想了解更多”。ChatGPT会根据上下文回复一些基本信息。接着,你可以通过提问“如何利用生成式AI来提高我的讲故事技巧?”来推进对话,ChatGPT会根据你提供的上下文和问题给出相应回答。
  • 创意任务协助:它也能帮助你完成各种创意任务。例如,输入提示“帮我创建幻灯片来展示一个学习平台的功能”,ChatGPT会为具体的幻灯片提供标题、内容和视觉元素的建议。
  • 多语言支持:虽然ChatGPT最精通英语,但它能理解并用多种其他语言回应。例如,提示它用法语和西班牙语写“你好”,它就能生成所需的输出。这使得它成为学习新语言或任何科目的有用工具。

Google Bard:基于PaLM的搜索增强工具

另一个流行的文本生成工具是Google Bard。它基于谷歌的先进语言模型PaLM。

PaLM是变换器模型与谷歌Pathways AI平台的结合。Pathways AI基于“路径”架构,即负责特定任务的专门模块,例如自然语言处理或机器翻译。除了庞大的文本和代码训练数据集,它还能从互联网上的资源中提取信息来回应提示。

你可以尝试不同的提示来探索Bard的能力:

  • 信息总结:尝试用提示获取某个主题的最新新闻摘要,例如“提供关于乌克兰战争的最新新闻摘要”。它会提供多个版本的草稿作为回应,你可以选择其中一个或重新生成。
  • 创意与问题解决:尝试提示它为推广一个时尚品牌提供数字营销活动策略。它会为营销活动提供一步一步的方法。

工具的能力对比与扩展应用

与ChatGPT和Bard交互后,你会发现它们各有侧重。ChatGPT在生成动态回复和维持对话流方面更有效。而Bard由于能通过谷歌搜索和谷歌学术访问网络资源,在研究某个主题的最新新闻或信息时可能是更好的选择。

需要认识到,包括GPT和PaLM在内的生成式AI模型都在不断进化,因此它们的能力和特性可能会发生变化。

除了ChatGPT和Bard,还有其他文本生成工具:

  • Jasper:生成任何长度的高质量营销内容,并能贴合品牌声音。
  • Writesonic:为不同类型的文本提供特定模板,例如文章和博客、广告和营销内容。
  • Copy.ai:擅长为社交媒体、营销和产品描述创建内容。

还有一些工具专用于特定用例:

  • 摘要工具:例如Resoomer,通过提取关键思想或概念来生成文本摘要。
  • 分类工具:例如YouClassify,用于为文本片段分配一个或多个类别。
  • 情感分析工具:生成能反映人类语言中所表达的基础情感的文本,例如Brand24。
  • 多语言翻译工具:例如Language Weaver和Yandex.Translate。

隐私考量与开源替代方案

一个重要注意事项是,许多开源的生成式AI工具会收集并审查与其共享的数据以改进其系统。在与这些工具交互时,为避免共享任何机密或敏感信息,这是一个重要的考虑因素。

那么,我们是否有开源且保护隐私的替代方案?答案是肯定的。

  • GPT4All:可以安装在你的机器上,作为具有隐私意识的聊天机器人运行,无需互联网或图形处理单元。
  • H2O AI 和 PrivateGPT:这类聊天机器人旨在通过在没有互联网连接的情况下在本地机器上运行,利用LLMs的能力来保护用户隐私。

不仅如此,你还可以通过将这些工具链接到你组织的文档和数据库,来定制它们以供特定组织内部使用。

文本生成工具的优势总结

生成式AI文本生成工具提供了诸多好处:

  • 学习辅助:它们提供循序渐进的解释,是良好的学习助手。
  • 提升效率:能够快速生成不同形式的文本,为作者和创作者带来效率。
  • 激发创意:这些工具增强了创造力并激发了新想法。
  • 虚拟助手:通过实现引人入胜的交互式对话,它们可用作虚拟助手和聊天机器人。
  • 提高生产力:通过自动化重复性写作任务,可以提高组织生产力。
  • 促进全球化沟通:凭借多语言支持,它们能够为全球受众实现沟通和内容本地化。

总结

本节课中我们一起学习了文本生成工具的核心知识。我们了解到LLMs通过解读上下文、语法和语义来生成连贯且符合语境的文本。GPT和PaLM等LLMs是许多生成模型的基础。两个流行的生成工具是OpenAI的ChatGPT和谷歌的Bard。ChatGPT基于GPT,而Bard基于PaLM。两者都能生成不同类型的文本、翻译语言,并以交互和信息丰富的方式回答你的问题。我们还讨论了一些其他工具,包括Jasper、Copy.ai、Writesonic。开源的、保护隐私的文本生成器包括GPT4All、H2O AI和PrivateGPT。

011:图像生成工具 🎨

在本节课中,我们将学习生成式AI在图像生成领域的基本能力,并介绍几种常见的图像生成模型与工具的核心功能。

概述

生成式AI图像生成模型能够创建全新的图像,并能对真实或生成的图像进行定制化修改,以获得期望的输出。例如,你可以生成一个“戴着帽子、帽子上有本书的小孩”的图像,随后还可以更改生成图像中书封面的颜色。

上一节我们介绍了生成式AI的基本概念,本节中我们来看看具体的图像生成工具及其能力。

图像生成的基本流程

让我们使用一个免费的AI图像生成器(例如FreePik)来生成一张新图像。你需要输入一段描述你希望创建图像的文本提示。

例如,你可以输入以下提示词:“一艘船在日落时分的平静湖面上航行,周围是郁郁葱葱的绿植和宁静的天空。”

提示词的质量决定了生成图像的准确性和质量。

接下来,选择图像风格并生成图像。生成器会提供多张图像供你选择下载,你也可以通过修改提示词来生成其他图像。

图像生成模型的更多可能性

除了基础的文生图,图像生成模型还具备多种高级功能。

以下是几种关键的图像处理能力:

  • 图像到图像转换:指将一个领域的图像转换到另一个领域,同时保留原始的内容和风格。
    • 例如:将草图转换为逼真图像、将卫星图像转换为地图、提升安防摄像头图像的分辨率、增强医学影像的细节。
  • 风格迁移与融合:涉及从一张图像中提取风格,并将其应用到另一张图像上,从而创建混合或融合图像。
    • 例如:将一幅画作转换为照片风格。
  • 图像修复:指重建图像中缺失或损坏的部分,使其变得完整。
    • 此功能可用于艺术修复、取证、在保持连续性和上下文的前提下移除图像中不需要的物体,以及将虚拟物体混合到现实场景中以实现增强现实。
  • 图像扩展:指通过生成与原始图像相似的新部分来扩展原始图像。
    • 这可用于生成更大尺寸的图像、提高分辨率以及创建全景视图。

核心生成模型介绍

生成模型和工具的图像生成与修改能力,随着其底层模型的演进而不断发展。

以下是几个重要的图像生成模型:

  • OpenAI的DALL-E:基于在大型图像及其文本描述数据集上训练的GPT模型。DALL-E能够生成多种风格的高分辨率图像,包括逼真的照片和绘画。新版DALL-E还提供了生成多种图像变体,以及通过图像修复和扩展进行图像转换的能力。
  • Stable Diffusion:一个开源的文生图扩散模型。扩散模型是一种能创建高分辨率图像的生成模型。Stable Diffusion主要用于基于文本提示生成图像,但也可用于图生图转换、图像修复和扩展。
  • NVIDIA的StyleGAN:该模型将图像内容建模和图像风格建模分离开,从而能够精确控制风格,并操纵特定特征(如姿势或面部表情)。StyleGAN已演进到能生成具有更真实细节的更高分辨率图像。

常用图像生成工具

你可以使用一些免费工具来探索生成式AI的文生图能力,例如Crayon、FreePik和Pixlr。这些工具能以不同的形式和风格生成图像。

此外,还有一些提供更专业风格的工具:

  • DeepArt.io:一个在线平台,能将照片转化为不同风格的艺术作品。
  • MidJourney:一个平台,它培育了一个图像生成器社区,帮助艺术家和设计师使用AI创作图像,并探索彼此的作品。

许多生成式AI图像生成器还提供API接口,允许开发者将其功能集成到不同的软件程序和工具中。一些提供API的流行图像生成器包括DALL-E、MidJourney和Crayon。

科技巨头的布局

微软和Adobe等技术巨头也已涉足AI图像生成器领域。

  • Microsoft Bing Image Creator:基于DALL-E模型。你可以通过访问Bing.com/create或通过Microsoft Edge浏览器使用此工具。这使得Microsoft Edge成为首个集成AI图像生成器的浏览器。
  • Adobe Firefly:是一系列旨在与Adobe Creative Cloud应用程序(如Photoshop和Illustrator)集成的生成式AI工具。Firefly使用Adobe Stock图片、开放许可内容和公共领域内容进行训练。它能接受超过100种语言的文本提示,并包含多种工具,允许你操控颜色、色调、光照、构图,还提供生成式填充、文本效果、生成式重新着色、3D转图像和图像扩展等功能。

总结

本节课中我们一起学习了:

  1. 基于生成式AI的模型和工具可以通过文本或图像提示生成新图像。
  2. 它们还提供图生图转换、风格迁移、图像修复和图像扩展等能力。
  3. 几个突出的图像生成模型包括DALL-E、Stable Diffusion和StyleGAN。
  4. 市场上有多种图像生成工具,提供多样化的图像生成和转换功能。
  5. 部分图像生成器可作为API被集成。
  6. Adobe Firefly是旨在与Adobe创意云应用程序集成的一系列生成式AI工具。

通过掌握这些工具和概念,你可以开始利用生成式AI的强大能力进行图像创作和编辑。

012:音视频生成工具 🎵🎬

在本节课中,我们将学习生成式AI在音频和视频创作领域的应用。我们将了解这些工具如何运作,它们具备哪些核心能力,以及如何利用它们来创造引人入胜的媒体内容和虚拟世界体验。


概述 📋

生成式AI正在彻底改变音频和视频内容的创作方式。市场研究预测,生成式AI音乐市场将从2022年的2.29亿美元,以28.6%的年复合增长率增长至2032年的26.6亿美元。这些工具能够帮助企业和个人,无论其经验水平如何,简化流程,将复杂的创意构想变为现实。

上一节我们介绍了生成式AI的基本概念,本节中我们来看看它在音视频生成领域的具体应用。


生成式AI音频工具 🎤

生成式AI音频工具主要分为三类:语音生成工具、音乐创作工具和音频质量增强工具。

语音生成工具

语音生成工具主要是文本转语音工具,它们能将文本转换为音频。虽然朗读技术并非全新,但生成式AI架构升级了其工作方式。

以下是其工作原理:

  1. 深度学习算法在大量人类语音数据集上进行反复训练。
  2. 算法能够分解并高效复制发音、语速、情感和语调等声音特征。
  3. 最终,生成式AI TTS工具能创造出更准确、更自然的语音。

这些工具对有视觉障碍、语言障碍或其他阅读困难的人士尤其有帮助。它们也能让你更轻松地“听”文章或笔记,或者为你的演示文稿配上出色的旁白。

你可以使用以下工具:

  • LOVO
  • Synthesia
  • Murf AI
  • Listnr

这些工具提供了丰富的AI语音、语言和情感库,你甚至可以创建独特的声音或克隆自己的声音。部分工具还允许你编辑音轨、修正发音、调整语调和语速,以制作出专业水准的最终产品。

音乐创作工具

假设你想尝试创作音乐,生成式AI可以成为你的得力助手。例如,Meta的AudioCraft就是一个经过音效和20,000小时Meta自有或授权音乐训练的生成式AI工具。

其他工具还包括:

  • Shutterstock的Amper Music
  • AIVA
  • Soundful
  • Google的Magenta
  • 由G4驱动的Wave工具

以下是使用流程:

  1. 从广泛的音乐库、不同流派、乐器风格和旋律中进行选择。
  2. 输入一个文本提示
  3. 根据你的请求,工具可以创作简短的旋律或即兴重复段、建议或添加乐器、谱写新歌,或为你的视频创建配乐。

此外,生成式AI还能帮助你进行混音、母带处理,并将最终作品发布到流行的流媒体平台。

音频增强工具

这类工具经过预训练,能够识别特定声音,可以为你的音频添加有趣的效果,或去除不需要的噪音。

例如:

  • Descript:可以帮助去除背景噪音、增强低质量录音,并添加所需的音效。
  • Krisp:可以清理文件中的 unwanted noise。

许多音乐生成工具也具备音频编辑和增强功能。


生成式AI视频工具 🎥

有些项目需要的不仅仅是出色的音效。2022年,Runway AI就利用生成式AI能力助力制作了奥斯卡获奖电影《瞬息全宇宙》。即使你不制作大片,也可以在日常生活中使用生成式AI视频工具。

假设你正在制作一个关于城市树木缺乏的纪录片,你可以:

  1. 登录 Runway的Gen-1工具,将现有视频片段转换为不同的风格。
  2. 或使用 Runway的Gen-2工具,通过文本、图像或视频输入来创建视频。

此外,你还可以使用 Pika Labs视频工具包Synthesia 应用。这些工具允许你上传照片,如果没有照片,可以使用文本提示生成所需图像。你还可以用它们录制旁白、增强音频、转换视频文件格式并发布视频。Synthesia甚至允许你创建自定义虚拟形象,以增强品牌辨识度。


重塑虚拟世界 🌐

生成式AI可以增强你的虚拟世界体验。你可以创建具有混合特征和异域风情的独特、富有想象力的虚拟世界。生成模型还能实时响应,提高模拟的准确性。

元宇宙平台利用生成式AI来创造更个性化、更具吸引力的用户体验。游戏元宇宙允许你快速生成3D对象,甚至创建具有特定性格特征的虚拟形象,这些特征会体现在他们的表情、行为和决策中。

例如:

  • The Sandbox:一个用户可以在其中即时构建、拥有并向全球推广其游戏的元宇宙。
  • Scenario AI:帮助创建和连接定制化的移动游戏资产。

总结 🎯

本节课中,我们一起学习了生成式AI音视频工具的强大能力。通过一个简单的文本提示,你就能生成多种语言的人声级语音、录制歌曲、添加音效或去除噪音、润色视频和动画,并构建增强版和充满异域风情的虚拟世界。这些工具正在降低创意门槛,让每个人都能成为媒体内容的创作者。

013:代码生成工具 🛠️

在本节课中,我们将学习生成式AI在代码生成方面的基本能力,探讨相关工具的优势与局限,并介绍几种常见的代码生成模型和工具。

概述

生成式AI模型和工具能够基于自然语言输入生成代码。它们基于深度学习和自然语言处理技术,理解上下文并生成符合语境的代码。接下来,我们将详细探讨这些能力。

代码生成的基本能力

基于深度学习和自然语言处理,这些模型能够理解上下文并生成合适的代码。以下是代码生成工具的核心功能:

  • 生成新代码:根据文本提示生成全新的代码片段或程序。
  • 代码补全:预测并补全部分代码片段。
  • 代码优化:生成现有代码的优化版本。
  • 代码转换:将代码从一种编程语言转换为另一种。
  • 代码文档化:为代码生成摘要和注释,以改进文档。
  • 解决方案推荐:描述您试图解决的问题,代码生成器会推荐算法、数据结构和合适的编程方法。

通用文本生成模型的代码能力

上一节我们介绍了代码生成的基本能力,本节中我们来看看像GPT这样的通用文本生成模型在代码生成方面的具体表现。

OpenAI的GPT在类人文本生成方面表现出色,在代码创建方面也展示了令人印象深刻的能力。

以下是基于GPT的工具(如ChatGPT)生成简单Python代码的示例:

# 用户提示:“写一段Python代码来生成问候某人的消息”
print("Hello! What's your name?")
name = input()
print(f"Nice to meet you, 数据科学与人工智能笔记(全)!")

有趣的是,它还会提供关于如何运行这段代码的指导。为了有效生成代码,提供清晰的提示至关重要,需要指定编程语言以及其他相关要求和约束。

为了演示GPT如何帮助调试代码,可以在ChatGPT中输入错误的代码作为文本提示。ChatGPT会提供正确的代码并解释所做的修正。

此外,GPT还能将代码从一种编程语言翻译到另一种,并生成代码文档和注释以提高可读性。

基于GPT的模型和工具已经发展到能够生成更长、更准确的代码,这使得它们可用于开发应用程序、网站和插件。更进一步,GPT的演进使其能够根据图像生成代码。例如,您可以输入课程大纲的图像来生成一个功能完整的应用程序代码。

Google的Gemini也提供了代码生成和调试能力,支持超过20种编程语言。

ChatGPT和Gemini是学习新编程语言的宝贵工具,因为它们能提供逐步的详细解释以帮助理解。它们在生成具有基本逻辑和编程概念的代码方面表现出色。

然而,它们可能无法从头开始生成大型或复杂的代码。虽然这些工具理解编程概念和语法,但可能不完全理解语义。因此,生成的代码可能在技术上是准确的,但仍可能无法按需运行。需要注意的是,这些模型的知识受限于其训练数据。特定版本的GPT可能不了解其训练后发布的编程框架和库。例如,GPT-3.5的知识截止日期是2021年9月。

因此,如果您需要更现代的代码生成器,可以考虑使用专门为代码生成设计的模型和工具。

专用代码生成工具

了解了通用模型的优缺点后,我们来看看一些专门为代码生成设计的工具,它们提供了更聚焦的功能。

GitHub Copilot

GitHub Copilot是一个AI代码生成器,可以根据各种编程语言和框架生成代码。它由OpenAI Codex驱动,这是一个生成式预训练语言模型,帮助开发者生成基于解决方案的代码。Copilot在自然语言文本和公开来源(包括GitHub仓库)的源代码上进行训练。它可以作为扩展集成到流行的代码编辑器(如Visual Studio)中,并能生成遵循最佳实践和行业标准的代码片段。

Polycoder

Polycoder是一个开源的AI代码生成器。它基于GPT架构,并在用12种编程语言编写的各种GitHub仓库数据上进行训练。它在编写C语言代码方面特别准确。Polycoder提供了一个广泛的内置模板库,可作为各种用例代码生成的蓝图。它可以帮助精确地创建、审查和优化符合要求的代码片段。

IBM Watson Code Assistant

不同的代码生成器提供特定的功能和特性。然而,当需求是让混合云开发者能为多样化需求编写代码时,IBM Watson Code Assistant是一个选择。它建立在IBM watsonx.ai的基础模型之上,适用于任何技能水平的开发者。

您可以将Watson Code Assistant与代码编辑器集成。它使开发者能够通过实时推荐、自动完成功能和代码重构辅助,准确高效地编写代码。此外,您可以将代码或项目文件输入Watson Code Assistant进行分析。它会识别模式、提出改进建议并生成代码片段或模板。开发者可以为特定项目需求定制生成的代码。

还有许多其他AI驱动的代码生成器和代码助手工具可帮助开发者更快地编写准确代码。例如,Amazon Code Whisperer可以集成到代码编辑器中并提供实时代码推荐;Tabnine有助于准确的代码补全;Replit是一个为用户提供编码、学习和协作的交互式空间的平台。

优势与注意事项

使用这些专用工具能带来显著效益,但也需注意潜在风险。

借助自动代码编写和优化能力,基于AI的代码生成器帮助开发者提高生产力和代码质量。它们支持快速原型设计以迭代设计想法。这些工具还通过支持多语言代码翻译,有助于实现跨平台兼容性和迁移。基于AI的代码生成器遵循一致的模式和编码标准,可以建议重构模式以遵循最佳实践。

然而,应谨慎使用这些工具,以确保AI生成的代码不会导致伦理问题。例如,安全漏洞,因为这些工具可能被用于生成恶意代码,或者基于训练数据产生数据偏见。

总结

本节课中我们一起学习了:

  1. 基于生成式AI的模型和工具可以根据文本和图像提示生成新代码、优化现有代码并生成基于解决方案的代码。
  2. ChatGPT和Gemini适用于简单的代码生成、调试和学习编程。
  3. 著名的代码生成器如GitHub Copilot、Polycoder和IBM Watson Code Assistant,提供了多样化的功能,如实时推荐、代码重构和解决方案模板。
  4. 总体而言,代码生成器提高了生产力,加速了开发周期,促进了编码最佳实践并培养了一致的编码标准。

生成式AI基础:05:专家观点:生成式AI工具的有效利用 🧠

在本节课中,我们将聆听AI专家分享他们使用生成式AI工具(用于创建文本、图像和代码)的个人经验,并探讨使用这些工具的益处与挑战。


专家经验分享

首先,我们来听听专家们对不同类型生成式AI工具的实际使用体验。

一位专家表示,他广泛尝试了各类生成式AI,包括文本生成、代码生成、图像、视频、音乐和3D文件等。他明确指出,目前文本生成和代码生成工具在“首次尝试即获得理想结果”方面表现最佳。这不仅因为这些模型经过了更多优化,也因为外界有更多关于如何精心设计提示词(prompt)以获得优质输出的经验分享。

核心概念:精心设计的提示词是获得理想输出的关键。这通常涉及使用清晰、具体的指令,例如:

代码:请用Python编写一个函数,计算斐波那契数列的前N项。

工具选择与微调

上一节我们了解了专家的初步体验,本节中我们来看看如何为不同任务选择合适的工具。

不存在一个能处理所有生成式AI用例的大型语言模型。对于任何给定任务,都有多个大型语言模型可供考虑和使用。这些模型可能由开源社区提供,也可能由具备训练能力的组织发布。

此外,还存在微调的概念。这意味着你可以考虑使用一个大型语言模型,并针对你的特定数据或客户数据进行微调,而无需巨大的计算资源或海量数据。

核心概念:模型微调(Fine-tuning)的公式可以简化为:
最终模型 = 预训练基础模型 + 特定领域数据微调

以下是针对不同创作类型的流行工具选择:

文本生成

  • GPT-3/ChatGPT 和 Google Bard 是非常流行的平台,它们也具备代码生成能力。
  • 其他工具还包括 Jasper、Phrasee.IO 和 Microsoft Copilot。

图像生成

  • 图像生成领域主要分为三类:图像生成、视频生成和设计生成。
  • 流行的图像生成模型包括 DALL-E 和 Stable Diffusion。
  • 从平台角度看,Midjourney 是最受欢迎的平台之一。值得注意的是,DALL-E 可以与 ChatGPT 结合使用,ChatGPT 的高级版本也正在集成 DALL-E 的功能。

代码生成

  • 虽然 ChatGPT 和 Bard 也能生成代码,但 GitHub Copilot 在此方面表现更佳。
  • 专门用于代码生成的模型还包括 IBM Watson Code Assistant、Polycoder 和 OpenAI Codex。

这些工具都是创建所需材料(特别是文本)的流行且足够好的选择。


使用工具的益处与挑战

在了解了各种工具后,本节我们将探讨使用生成式AI工具带来的好处以及需要面对的挑战。

使用这些工具的主要益处在于,它们能帮助你创建一个良好的基线内容,作为你进一步开发内容的基础。

然而,你不能完全依赖这些技术,因为生成的所有内容都存在局限性。当进入更小众的领域,如音乐或3D模型生成时,要获得理想结果通常更加困难。这些工具生成结果需要更长时间,并且目前阶段需要更多的尝试和纠错。

专家对未来持乐观态度,预计工具会变得更易用、更强大,并且更重要的是向多模态发展——即通过单一界面无缝处理所有不同类型的生成任务。他建议,即使你现在对某些类型不感兴趣,也不妨尝试所有工具,因为未来它们可能会变得非常有用。

核心概念:多模态AI指能够处理和生成多种类型数据(如文本、图像、音频)的模型。


总结

本节课中,我们一起学习了AI专家使用生成式AI工具的一手经验。我们了解到,文本和代码生成工具目前相对成熟,而图像、3D等领域的工具则需要更多技巧和耐心。关键在于理解没有“万能”模型,应根据任务选择合适工具,并可利用微调来优化模型。使用这些工具能高效提供创作基线,但也需认识到其局限性并保持批判性思维。最后,我们展望了未来多模态AI工具的发展趋势,并鼓励大家积极尝试,为未来做好准备。

生成式AI基础:05:探索跨领域生成式AI应用 🚀

在本节课中,我们将聆听专家们的观点,共同探索生成式AI在不同行业领域的潜在应用。我们将看到,这项技术正从教育、金融到医疗等多个方面,深刻地改变着我们的工作和生活。


教育领域的应用 📚

上一节我们了解了生成式AI的广泛潜力,本节中我们来看看它在教育领域的具体应用。

在Skills Network,我们已经开始将生成式AI应用到多个环节。我们不仅开发了能够自动批改作业和测验的工具,更重要的是,它能在学习者答错时提供反馈。这得益于生成式AI的能力,我们只需设计一个简单的提示词,例如:

根据以下评分标准批改此作业,如果存在错误,请生成一段文字帮助学习者从错误中学习。

这项功能几乎无需额外成本即可实现。

此外,我们还有一个名为“TI”的个人导师,它是我们的个人教学助手。当你在实验中遇到困难、不知如何继续或收到错误信息时,只需将错误信息交给TI,它就会帮助你解决问题,无论是定位代码中的错误,还是提供修复思路。这使得学习过程更像双向对话,你可以随时提问并获得即时帮助,而无需在留言板上等待数天或数周。

更重要的是,有了这位全程陪伴的个人导师,学习者能随时获得作业的审阅和批改。这对我们来说非常实用,因为有些课程拥有成千上万甚至更多的学习者,仅凭有限数量的讲师和助教,批改如此多的作业是不可能的。生成式AI有效地填补了这一空白。

以下是生成式AI在教育中的几个关键应用点:

  • 自动化评估与反馈:根据既定标准批改作业,并提供个性化的学习建议。
  • 个人学习助手:即时解答学习过程中的疑问,提供代码调试帮助。
  • 规模化教学支持:解决大规模在线课程中师资与评估资源不足的问题。

金融领域的应用 💰

了解了教育领域的变革后,我们转向金融行业,看看生成式AI如何在这里发挥作用。

生成式AI正在改变金融世界。首先,它像一名侦探,能够识别交易中的可疑活动以防止欺诈。其次,它通过分析大量市场运作数据,帮助交易员做出更明智的决策。此外,它还赋能了那些友好的在线聊天机器人,帮助客户处理咨询和交易。

像摩根大通和高盛这样的大型机构已经在使用生成式AI。摩根大通的“COIN”系统用于快速理解法律文件,节省了时间和金钱。高盛则利用它来预测市场走势,为交易员提供优势。生成式AI正在变革金融业,而这仅仅是个开始。准备好迎接一个资金更安全、投资更智能、银行体验前所未有的流畅的未来吧。

以下是生成式AI在金融中的主要应用方向:

  • 欺诈检测:分析交易模式,实时识别和预防欺诈行为。
  • 智能投顾与市场分析:处理海量数据,生成市场洞察和投资策略建议。
  • 自动化文档处理:快速解析合同、报告等复杂金融文件,提取关键信息。
  • 客户服务:驱动智能客服,高效处理客户查询和标准化交易。

医疗与生命科学领域的应用 🏥

看过了金融行业的应用,接下来我们进入一个至关重要的领域——医疗与生命科学。

生成式AI在医疗领域具有变革性潜力。它有助于药物发现,通过生成具有所需特性的分子结构,显著加速研发进程。同时,它还能协助医学影像分析,通过增强图像分辨率和检测异常来提高诊断准确性。

本课程中描述的生成式AI应用包括但不限于IT与开发运维、医疗健康、金融、人力资源、市场营销和娱乐。具体到医疗健康行业,生成式AI带来了许多进步,例如医学图像生成。通过创建合成图像数据,它使我们能够构建、训练和验证更强大的、基于医学影像的机器学习模型。它还能帮助药物发现。在制药行业,生成式AI一个流行的应用方向是生成个性化医疗方案。它被用于创建氨基酸序列、蛋白质模式和基因组模式,利用这些信息为相关症状制定个性化的医疗方案。其核心思想是,从现有数据和信息中创建新的、未知的模式,这一过程因生成式AI而变得更为容易。

以下是该领域一些著名的生成式AI项目或合作案例:

  • DeepMind的AlphaFold:能够根据氨基酸序列预测蛋白质的3D结构。
  • AI赋能影像分析:通过生成对抗网络(GANs)生成合成数据,用于构建更强大的卷积神经网络,从而更准确地检测乳腺癌,帮助医生决策,造福患者。
  • Insilico Medicine:利用生成式AI识别新的候选药物,加速早期发现阶段。
  • 英伟达与伦敦国王学院的合作:使用AI模型创建合成的大脑MRI扫描图像,用于培训放射科医生,同时避免了隐私问题。

总结

本节课中,我们一起学习了生成式AI在多个核心领域的应用实践。我们看到,在教育领域,它化身个人导师与评估助手,实现个性化与规模化教学;在金融领域,它成为风控侦探与智能分析师,提升安全与效率;在医疗领域,它加速药物研发、增强影像诊断并推动个性化医疗。这些案例表明,生成式AI并非遥远的概念,而是正在持续落地、解决实际行业痛点的强大工具,其“从数据中创造新内容与模式”的核心能力,正在开启一个充满智能辅助与创新解决方案的未来。

016:生成式AI与代理式AI对比 🧠

在本节课中,我们将要学习生成式人工智能与代理式人工智能的核心区别。我们将探讨它们各自的工作原理、应用场景以及它们如何共同构建更强大的未来AI系统。

概述

生成式AI与代理式AI是人工智能领域的两种不同方法。生成式AI是我们熟悉的聊天机器人、图像生成器等,它们本质上是反应式系统。代理式AI则不同,它们是主动式系统,能够自主规划并执行一系列动作以实现目标。

生成式AI:反应式的内容创造者

上一节我们介绍了两种AI的基本概念,本节中我们来看看生成式AI的具体特点。

生成式AI系统等待用户的指令(即提示词),然后基于其训练所学到的模式,生成相应的内容。它的核心工作是预测,根据给定的输入,计算出最可能出现的下一个词、像素或音符。

以下是生成式AI的关键特征:

  • 反应式:需要用户输入提示词才能启动。
  • 内容生成:其输出是文本、图像、代码或音频等内容。
  • 模式匹配:本质上是复杂的模式匹配机器,学习了海量数据中的统计关系。
  • 任务终点:生成内容后,其工作便告结束,不会主动采取进一步行动。

其工作流程可以概括为:用户提示 (Prompt) -> AI生成 (Generate) -> 输出内容 (Output)

代理式AI:主动的目标达成者

了解了生成式AI的被动性后,我们再来看看代理式AI的主动性。

代理式AI系统同样是基于用户提示开始工作,但它的目标不是生成单一内容,而是利用这个提示去规划和执行一系列动作,以达成某个目标。它能以最小化的人工干预,自主运行一个完整的生命周期。

以下是代理式AI的工作周期:

  1. 感知:感知其环境或接收输入信息。
  2. 决策:基于感知,决定下一步要采取的行动。
  3. 执行:执行所决定的行动。
  4. 学习:从行动的结果中学习,并循环此过程。

共同的基础与不同的应用

尽管路径不同,但生成式AI和代理式AI通常共享一个共同的技术基础:大语言模型

  • 对于聊天机器人这类生成式AI,LLM是其核心“大脑”。
  • 对于代理式AI,LLM则充当其“推理引擎”,提供规划和思考的能力。

在深入技术细节之前,让我们通过一些现实世界的应用案例来更直观地理解它们的区别。

生成式AI的应用:人类主导的创作助手

生成式AI擅长在需要人类创意指导和最终裁决的场景中充当助手。

例如,一个视频创作者可以使用生成式AI来审阅脚本草稿、建议缩略图概念,甚至生成背景音乐。然而,在每一步中,人类创作者都在审查和提炼AI生成的内容。AI负责生成可能性,而人类负责策展和最终决策。

代理式AI的应用:自主的多步骤管理器

代理式AI则在需要持续管理和多步骤流程的场景中表现出色。

设想一个个人购物代理。当你给出“购买某产品”的指令后,它会主动执行以下步骤:跨平台搜索商品库存、监控价格波动、处理结账流程,甚至协调物流配送。它只在必要时(如确认支付或收货地址)才向你寻求输入,其余时间自主工作。

背后的引擎:思维链推理

那么,代理式AI是如何实现这种复杂决策的呢?答案在于利用生成式AI(特别是LLM)的推理能力,即思维链推理。

这是一种让AI将复杂任务分解为更小、更逻辑化步骤的过程,类似于人类解决难题的方式。LLM非常擅长此道。

例如,一个负责组织会议的代理AI,可能会利用GenAI生成这样的内部对话来进行规划:

“首先,我需要理解会议的规模、会期和预算等要求。然后,我应该研究符合这些参数的可用场地。接着,对于符合条件的场地,我需要核查其 availability...”

通过这种自我对话,代理AI在采取行动前探索了问题空间。在这里,生成式AI充当了驱动代理决策的认知引擎

展望未来:智能协作体

展望未来,最强大的AI系统可能既非纯粹的生成式,也非纯粹的代理式,而是智能协作体

它们将理解何时需要通过生成来探索各种选项,何时需要通过代理行动来执行确定方案。就像一个智能助手,它知道何时该为我生成同人小说的下一章,以便在我完成视频拍摄后就能审阅。

总结

本节课中我们一起学习了生成式AI与代理式AI的核心区别。生成式AI是反应式的内容生成器,专注于根据提示创造新内容。代理式AI是主动的目标达成者,能够规划并执行一系列动作以完成任务。两者常以大语言模型为基础,但应用方式不同。未来的趋势是二者融合,形成能够自主决策与创造性协作的智能系统。

017:课程介绍与提示工程入门 🚀

在本节课中,我们将要学习提示工程的基础概念,了解如何通过设计有效的问题来引导生成式AI模型,从而获得更精确、更相关的输出。课程面向所有初学者,无论背景如何,旨在帮助大家掌握与AI高效对话的核心技能。

概述

专家之所以能给出所有答案,关键在于你提出了正确的问题。有趣的是,这正是我们为生成式AI模型设计提示时所遵循的原则。我们使用提示来查询和提问AI应用,例如聊天机器人、图像、音频或视频生成工具,甚至虚拟世界。提示能够优化生成式AI模型的响应。其力量在于你所提出的问题——知道如何撰写一个有效且直接的提示,将使你能够生成更精确、更相关的内容。

学完本课程后,你将能够:

  • 解释提示工程的概念及其在生成式AI模型中的重要性。
  • 应用创建提示的最佳实践。
  • 评估常用的提示工程工具。
  • 应用常见的提示工程技术和方法来撰写有效的提示。

课程结构 📚

这是一个聚焦的课程,包含三个模块,每个模块需要一到两个小时完成。

上一节我们介绍了课程的整体目标,本节中我们来看看具体的课程安排。

以下是三个模块的主要内容:

  1. 模块一:提示工程基础

    • 你将学习提示工程的概念,从如何定义提示及其构成元素开始。
    • 你将学习应用撰写有效提示的最佳实践。
    • 你将评估常见的提示工程工具,例如IBM Watson X Prompt Lab、Spellbook和Dust。
  2. 模块二:提示工程方法与技巧

    • 你将学习各种提示工程方法,如访谈模式、思维链和思维树。
    • 你将发现巧妙设计提示的技巧,例如零样本和少样本提示,以产生精确且相关的响应。
  3. 模块三:实践与评估

    • 本模块邀请你参与一个最终项目,并提供一个分级测验来检验你对课程概念的理解。
    • 你还可以访问课程术语表,并获得关于后续学习路径的指导。

学习资源与活动 🛠️

课程精心编排了概念视频和辅助阅读材料。观看所有视频以充分掌握学习材料的潜力。

以下是课程中包含的主要学习活动:

  • 实践实验室与最终项目:你将享受动手实验和一个最终项目,该项目演示了如何在IBM生成式AI教室中通过创建有效提示来优化结果。
  • 练习与分级测验:课程包含练习测验以帮助你巩固学习。在课程结束时,你还需要完成一个分级测验。
  • 讨论论坛:课程提供讨论论坛,方便你与课程工作人员联系并与同伴互动。
  • 专家观点视频:最有趣的是,通过专家观点视频,你将听到经验丰富的从业者分享他们对提示工程中使用的工具、方法以及撰写有效提示的艺术的见解。

总结

本节课中我们一起学习了提示工程的核心价值——通过提出正确的问题来释放生成式AI的全部潜力。我们概述了课程目标、结构以及丰富的学习资源。准备好学习关于撰写提示的一切,以解锁生成式AI的全部潜力了吗?让我们开始吧。

生成式AI基础:01:什么是提示词 🧠

在本节课中,我们将要学习生成式AI中的一个核心概念:提示词。我们将定义提示词及其构成要素,并解释为何编写有效的提示词对于引导AI模型产生期望结果至关重要。

生成式AI模型的一项显著能力是其输出与人类创作的内容高度相似:相关、有上下文、富有想象力、细致入微且语言准确。而生成这种输出的关键因素之一,就是提示词。

那么,什么是提示词?提示词是您提供给生成式模型的任何输入,用以产生期望的输出。您可以将其视为给模型的指令。例如:

  • 写一小段文字描述你最喜欢的度假胜地。
  • 编写HTML代码,为在线表单生成一个城市下拉选择框。

这些都是用于产生特定输出的直接提示。提示词也可以是一系列逐步细化输出的指令,以达到理想结果。例如:

  • 写一个关于一位研究火星生命的科学家的短篇故事。他在研究期间面临了哪些挑战?

通过这些例子可以清楚地看到,提示词包含问题、上下文文本、引导模式或示例,以及基于这些以自然语言形式提交的请求,为模型提供的部分输入。生成式AI模型收集信息、进行推断并提供创造性的解决方案。这些指令帮助模型基于提供的输入,产生相关且合乎逻辑的回应或输出。

让我们看更多例子来更好地理解这一点。

假设您希望模型写一个关于一位农民在10年内成为成功商人的奋斗与成就的短篇故事。如果您的提示词是“一个小镇富人的故事,他的奋斗与成就”,模型将产生一个通用的输出。这就是我们所说的朴素提示,即以最简单的方式向模型提问。

为了向模型准确传达您的意图,您可以进行简单的调整,从而显著改善结果。您的提示词必须具备清晰的上下文、恰当的结构并且易于理解。

因此,您可以将提示词重写为:
写一个关于一位农民在10年内成为富有且有影响力的商人的奋斗与成就的短篇故事。

再看另一个例子,您希望模型生成您想象中的日落风景图像。将提示词写为“山间的日落图像”可能无法得到期望的输出。这个提示词过于简短,缺乏对您脑海中图像的详细描述。

您可以将其重写为:
生成一幅描绘宁静日落的图像,场景是坐落在群山之间的河谷。

要掌握编写有效提示词的艺术,让我们逐一理解一个结构良好的提示词的构建模块。

以下是构建有效提示词的四个核心要素:

指令
为模型提供关于您希望执行任务的明确指导,引导生成式AI模型的行为,以影响其回应的形成。例如:写一篇600字的文章,分析全球变暖对海洋生物的影响。

上下文
上下文有助于建立指令所处的环境背景,并为生成相关内容提供一个框架。为了理解这一点,让我们为上一个例子中的提示词添加一些上下文:
近几十年来,全球变暖经历了显著变化,导致海平面上升、风暴强度增加以及天气模式改变。这些变化对海洋生物产生了严重影响。写一篇600字的文章,分析全球变暖对海洋生物的影响。
这个提示词将帮助模型生成与上下文一致的内容。

输入数据
输入数据是您作为提示词一部分提供的任何信息片段。这可以作为生成式模型的参考,以获得包含特定细节或想法的回应。为了提供输入数据,同样的提示词可以重构如下:
您已获得一个包含太平洋温度记录和海平面测量值的数据集。写一篇600字的文章,分析全球变暖对太平洋海洋生物的影响。

输出指示器
输出指示器为评估模型生成输出的属性提供了基准。它可以在提示词中概述您期望输出应具备的语气、风格、长度和其他品质。在提示词写一篇600字的文章,分析全球变暖对海洋生物的影响中,输出指示器明确了生成的输出应是一篇600字的文章。它将根据分析的清晰度以及相关数据或案例研究的整合程度来评估。

这些要素中的每一个都在帮助生成式AI模型理解您的需求并给出期望输出方面发挥着作用。

本节课中,我们一起学习了提示词是您提供给生成式模型以产生期望输出的任何输入或一系列指令。这些指令有助于引导模型的创造力,并协助产生相关且合乎逻辑的回应。一个结构良好的提示词的构建模块包括指令、上下文、输入数据和输出指示器。这些要素帮助模型理解我们的需求并生成相关的回应。

生成式AI基础:03:什么是提示词工程 🎯

在本节课中,我们将要学习提示词工程的核心概念。我们将定义什么是提示词工程,解释其在生成式AI模型中的相关性与重要性,并详细阐述通过提示词工程来制定有效提示词的过程,以引导模型产生相关回应。

提示词工程是指设计有效提示词以生成更优质、更符合期望的回应过程。

尽管生成式AI模型有潜力辅助人类创造力,但如果未能提供精确的提示词,这些模型可能会产生不充分的结果,甚至是虚假和误导性的信息。提示词工程融合了批判性分析、创造力和技术敏锐度。它不仅仅局限于提出正确的问题,还包括在正确的语境下构建问题,提供正确的信息,并明确表达对期望结果的预期,以引出最恰当的回应。

让我们通过一个例子来理解这一点。一艘船正在大西洋航行。为了规划航程,船长需要知道特定地点在特定时间的天气预报。在这种情况下,向模型提供一个简单的提示词,例如“大西洋的天气预报”,可能无法获得期望的结果。为了获得最准确的结果,船长需要“设计”提示词。

在设计提示词时,船长需要定义语境,包含诸如天气预报的目标位置(经纬度)和预测的时间范围等细节。例如:

一艘船的船长正计划在大西洋进行一次战略航行。为了帮助船长有效导航,请提供2023年8月28日至9月1日未来一周的天气预报。目标位置的坐标在北纬20度至30度,西经40度至20度之间。

船长还必须指明是否需要特定的输出,例如模型是否应返回可能影响航程的其他天气要素信息。例如:

为了帮助规划大西洋的有效航行,请提供关于指定时间段和地点内,预期风型、浪高、降水概率、云量以及任何可能影响航程的潜在风暴的详细信息。

重要的是要认识到,提示词工程是一个结构化的迭代过程,涉及优化提示词并尝试可能影响模型输出的各种因素。

接下来,让我们了解通过提示词工程创建有效提示词所涉及的逐步过程。

以下是创建有效提示词的步骤:

  1. 定义目标:该过程的第一步是建立一个明确的目标。你必须确切知道希望模型生成什么。例如,目标是“形成一份关于人工智能与汽车相关的益处和风险的简要概述”。
  2. 创建初始提示词:明确了目标后,现在可以创建初始提示词。根据目标,这可能表现为一个问题、一个指令甚至一个情境。例如:“撰写一篇文章,全面分析人工智能融入汽车领域相关的益处和弊端。”
  3. 测试提示词:现在应该测试并分析你所创建提示词的回应。虽然回应可能相关,但可能缺乏你所追求的独特视角。例如,对初始提示词的回应直接列出了人工智能融入汽车行业的益处和弊端,但没有强调可能出现的伦理问题,也没有讨论其正面和负面影响。
  4. 分析回应:你必须仔细审查回应,检查其是否符合你的目标。如果不符合,请记下不足之处。例如,所使用的初始提示词未能涵盖人工智能在汽车行业中相关益处和风险的全面范围。
  5. 优化提示词:利用通过测试和分析获得的知识,现在可以修改提示词。这可能包括增强其特异性、加入额外语境或重新措辞。初始提示词可以优化如下:“撰写一篇信息性文章,讨论人工智能在革新汽车行业中的作用。阐述关键方面,如益处、弊端、伦理考量以及自动驾驶和实时交通分析等特定领域的正面和负面影响,同时审视技术复杂性和网络安全担忧等潜在挑战。”
  6. 迭代过程:重复最后三个步骤(测试、分析、优化),直到你对回应感到满意。因此,经过几轮优化后,最终的提示词可能呈现为这种形式:“撰写一篇文章,重点介绍人工智能如何重塑汽车行业,聚焦于自动驾驶和实时交通分析等方面的积极进展,同时深入探讨与复杂技术方面(如决策算法)和潜在网络安全漏洞相关的担忧。强调这些担忧可能对车辆安全产生的影响。确保分析透彻、有实例支持并鼓励批判性思考。”

现在,让我们总结一下提示词工程在生成式AI模型中的重要性和相关性。

提示词工程的重要性体现在以下几个方面:

  • 优化模型效率:提示词工程有助于设计智能提示词,使用户能够充分利用这些模型的能力,而无需进行大量重新训练。
  • 提升特定任务性能:提示词工程使生成式AI模型能够提供细致入微且具有上下文的回应,使其对特定任务更加有效。
  • 理解模型限制:通过每次迭代优化提示词并研究模型的相应回应,可以帮助我们理解其优势和弱点。这些知识可以进一步指导未来的功能增强或模型的完整开发。
  • 增强模型安全性:熟练的提示词工程可以防止因提示词设计不当而导致有害内容生成的问题,从而增强模型的安全使用。

本节课中,我们一起学习了提示词工程是设计有效提示词以充分利用生成式AI模型能力、产生最佳回应的过程。我们还学习了通过提示词工程优化提示词的流程。最后,我们探讨了提示词工程在优化模型效率、提升性能、理解模型限制以及增强安全性方面的重要性。

020:提示词创建最佳实践 🎯

在本节课中,我们将学习如何为生成式AI模型创建有效的提示词。通过掌握最佳实践,你可以更好地引导模型生成符合你期望的风格、语气和内容的回答。


概述:什么是有效的提示词?

撰写有效的提示词对于充分发挥生成式AI模型的潜力至关重要。通过应用最佳实践,你可以监督模型输出的风格、语气和内容。创建有效提示词的最佳实践主要围绕四个核心维度展开:清晰度上下文精确度角色扮演

上一节我们介绍了有效提示词的重要性,本节中我们将逐一深入探讨这四个维度。


清晰度:让指令简单明了

清晰度要求你的提示词易于理解,没有歧义。以下是实现清晰度的关键点:

  • 使用简单直接的语言:简单的语言能更轻松地传达指令。
  • 避免专业术语:复杂的术语可能会让模型或用户感到困惑。
  • 明确任务描述:模糊的提示词可能导致回答偏离你的意图。

让我们通过一个例子来理解。考虑以下提示词:

“讨论在植物完全展开的托叶上借助阳光发生的烹饪过程。同时提及一个绿色物质,以及光、空气和水对植物地上部分的重要性。”

这个提示词存在多处问题:

  1. 它没有明确提及想要讨论的过程(光合作用)。
  2. 使用了“完全展开的托叶”等复杂术语。
  3. 描述模糊,任务不清晰。

为了确保清晰度,我们可以将其重写为:

“解释植物光合作用的过程,详细说明叶绿素的作用,以及阳光、二氧化碳和水如何参与这一生物功能。”

修改后的提示词使用了简单、清晰、简洁的语言,并明确声明了要讨论的主题。


上下文:提供背景信息

上下文帮助模型理解情境或主题。这包括提供简短的介绍、解释相关情况,或融入人物、地点、事件等具体细节。

例如,提示词“写下1775年革命战争爆发期间发生了什么”缺乏足够的背景和具体细节来引导模型的理解。

为了建立正确的上下文并包含相关信息,我们可以将其重写为:

“描述导致美国革命战争的历史事件,重点关注波士顿倾茶事件、萨拉托加战役等关键事件。强调美洲殖民地与英国政府之间的紧张关系,并解释这些事件如何导致1775年革命战争的爆发。”


精确度:明确你的要求

精确度有助于在提示词中勾勒出你的具体请求。如果你在寻找特定类型的回答,请清晰地表达出来。在提示词中融入示例可以帮助模型理解你期望的回答类型,并引导其思考过程。

例如,提示词“谈谈经济学中的供求关系及其影响”没有精确地勾勒出特定的回答类型,也没有提供示例。

为了确保精确度,我们可以将其重写为:

“解释经济学中的供求概念。描述需求增加如何影响价格,并借助一个说明性示例(如智能手机市场)进行阐述。同样,通过类比石油生产中断等情况,解释供应减少对定价的影响。”

这个提示词清晰地表达了需要借助示例来解释概念。


角色扮演:从特定视角出发

从特定角色或人物视角撰写的提示词,可以帮助模型生成与该视角一致的回答。提供必要的上下文细节能使模型有效地扮演特定角色。

例如,提示词“写一篇日志,描述一个未知外星星球上奇特的动植物。”只会给出关于外星星球的科学细节,而不会从专业人士的视角进行解释。

你可以将提示词重写为:

“假设你是一名刚刚登陆未知外星星球的宇航员。写一篇日志,描述你遇到的奇特动植物,例如天空的颜色和回荡在异星景观中的陌生声音。表达你记录这段非凡旅程时的兴奋、好奇以及一丝忧虑。”

在这个例子中,你明确提供了上下文细节,并假设自己是一名宇航员。因此,这个提示词将生成与宇航员视角一致的回答。


总结

本节课中,我们一起学习了为生成式AI模型撰写有效提示词的最佳实践。我们了解到,这主要围绕四个维度展开:

  • 清晰度:使用简单、无歧义的语言。
  • 上下文:提供背景和所需细节。
  • 精确度:具体明确,并提供示例。
  • 角色扮演:通过假设人物角色并提供相关上下文来增强回答。

掌握这些实践方法,并根据具体需求进行调整,你将能更有效地引导生成式AI模型,获得更优的结果。

生成式AI基础:05:常见提示词工程工具 🛠️

在本节课中,我们将要学习提示词工程工具的常见功能,并介绍几款常用的工具。提示词工程是设计精确且符合语境的提示词,以与生成式AI模型交互,从而生成相关且准确输出的过程。为了辅助这一过程,市面上有多种提示词工程工具可供选择。

这些工具提供了丰富的功能和特性,旨在优化提示词的创建,以实现期望的结果。它们对于可能不精通自然语言处理技术,但又希望在使用生成式AI模型时获得特定结果的用户尤为有用。

接下来,我们首先来探索这些工具普遍提供的核心功能。

常见功能概览

以下是提示词工程工具通常具备的一些关键功能:

  • 提示词建议:根据给定的输入或期望的输出,提供提示词建议。
  • 结构优化:建议如何构建提示词,以实现更好的语境沟通。它们帮助精心设计能够为模型提供必要上下文、以理解用户意图的提示词。
  • 迭代优化:可以根据工具的初始响应,迭代地优化提示词,以找到最有效的版本。
  • 偏见缓解:提供功能来帮助减轻生成式AI模型响应中的偏见。它们可以指导如何设计提示词,以减少偏见或不恰当输出的可能性。
  • 领域特定支持:帮助创建针对特定领域(如法律、医疗或技术)的提示词。
  • 预定义提示库:提供针对各种用例的预定义提示词库,这些提示词可以根据具体需求进行定制。

了解了核心功能后,接下来让我们具体看看几款常见的提示词工程工具。

常见工具介绍

1. IBM Watsonx.ai Prompt Lab
IBM Watsonx.ai 是一个集成的平台,用于轻松地训练、调优、部署和管理基础模型。该平台包含 Prompt Lab 工具,使用户能够基于不同的基础模型试验提示词,并根据自身需求构建提示词。为帮助您入门,Prompt Lab 为不同用例(包括摘要、生成和提取)提供了示例提示词。要创建符合您特定需求的提示词,您可以通过添加指令和示例来训练模型,向模型展示如何响应输入。

2. Spellbook (Scale AI)
Spellbook 是 Scale AI 提供的一个集成开发环境。通过 Spellbook,您可以基于大型语言模型构建应用程序,并为各种用例(包括文本生成、文本提取、分类、问答、自动补全和摘要)试验提示词。在提示词工程方面,Spellbook 包含一个提示词编辑器,供您编辑和测试提示词。您可以使用提示词模板来利用结构化提示词生成文本,也可以访问预构建的提示词作为示例。

3. Dust
Dust 提供了一个用于编写提示词并将其链接在一起的 Web 用户界面。您可以管理链式提示词的不同版本。它还提供了一种自定义编码语言和一组标准模块,用于处理 LLM 提供的输出。Dust 也支持集成其他模型和服务。

4. PromptPerfect
这是一款用于高效提示词工程的工具,可用于为不同的 LLM 或文生图模型优化提示词。它支持常见的文本模型(如 GPT、Claude、Stable LM 和 LLaMA)和图像模型(如 DALL-E 和 Stable Diffusion)。要编写或优化提示词,您首先需要选择要为其优化提示词的相关模型,不同模型有不同的优化策略。您还可以选择与预览质量、语言和审核相关的附加功能。在编写提示词时,您可以尝试自动补全功能,该功能会在您键入时提供建议。您可以进一步优化已编写的提示词。例如,工具可以展示用户编写的原始提示词和由 PromptPerfect 生成的相应优化后提示词。为了更进一步的优化,您可以在流线模式下逐步优化和完善提示词:编写提示词 -> 优化 -> 再次编辑提示词 -> 优化,直到您对输出满意为止。

除了上述专门工具,还有一些其他流行的平台和接口也提供了提示词工程资源或帮助您试验提示词。

其他资源与平台

  • GitHub:提供了大量关于提示词工程和 LLM 的代码仓库。这些仓库中的指南、示例和工具有助于提升提示词工程技能。
  • OpenAI Playground:一个基于 Web 的工具,帮助您使用 OpenAI 的各种模型(如 GPT 系列)试验和测试提示词。
  • Playground AI:一个平台,帮助您使用 Stable Diffusion 模型试验用于生成图像的文本提示词。
  • LangChain:一个 Python 库,提供了构建和链接提示词的功能。
  • 提示词市场 (如 PromptBase):有趣的是,提示词也可以进行买卖。PromptBase 就是一个提示词市场的例子,它支持为流行的生成式AI工具和模型(如 Midjourney、ChatGPT、DALL-E、Stable Diffusion 和 LLaMA)提供提示词。通过 PromptBase,您可以购买针对特定需求和特定模型或工具的提示词。例如,您可以购买一个用于通过 Midjourney 生成滑稽卡通角色的提示词。同样,如果您拥有出色的提示词设计技能,也可以通过 PromptBase 上传和出售提示词。该平台还支持直接在其平台上设计提示词并在其市场上出售。

总结

本节课中,我们一起学习了提示词工程工具。我们了解到,这些工具提供了多种功能和特性来优化提示词,包括提供提示词建议、增强语境理解、支持迭代优化、缓解偏见、提供领域特定支持以及维护预定义提示词库。我们还介绍了几款常见的工具和平台,例如 IBM Watsonx.ai Prompt Lab、Spellbook、Dust 和 PromptPerfect,以及其他有用的资源和市场。掌握这些工具将帮助您更高效地与生成式AI模型进行交互。

生成式AI基础:06:专家观点:有效提示词的最佳实践 🎯

在本节课中,我们将学习由生成式AI专家分享的关于如何撰写有效提示词的最佳实践。提示工程是与AI模型交互、获取理想结果的关键步骤。

清晰与具体是首要原则

上一节我们了解了提示工程的重要性,本节中我们来看看其核心原则。与AI模型交互时,清晰和具体的指令至关重要。这不同于与人交谈时使用开放式问题以鼓励探索;与AI合作时,我们需要更加直接和明确。

以下是撰写提示词时需遵循的三大通用且重要的原则:

  1. 明确你的请求
  2. 绝对清晰地提供上下文(例如,针对哪个应用场景)。
  3. 列出你希望从回答中获得的所有特性

优化提示词的实用技巧

理解了核心原则后,我们来看看一些具体的优化技巧。可以想象成在给一个极具创造力的机器人下达指令。

以下是提升提示词效果的一些关键方法:

  • 保持清晰简洁:避免冗长,为AI留出发挥创意的空间。
  • 实验提示长度:有时一个短句足够,有时则需要更多细节。
  • 提供背景信息:为模型提供上下文,帮助其生成更贴切的回答。
  • 使用自然语言:用清晰、无歧义的自然语言与模型交互,避免复杂术语。
  • 包含示例:提供问题、答案或期望的回答结构/风格的示例,这属于“少样本学习”概念,能引导模型按需生成结果。
  • 指定专家角色:使用特定语言,如“作为一名医疗专家”或“作为一名产品经理”,这有助于语言模型聚焦于相关领域的信息。例如,提示词可以是:
    作为一名产品经理,请以标准的问题陈述格式,帮我撰写一个问题陈述。
    
  • 提供约束与指导:可以限制内容范围、避免某些结构、设定令牌数量限制或提供上下文窗口。
  • 迭代与优化:基于初始结果,反复评估和优化你的提示词。
  • 平衡创意与约束:在模型的创造性和你提供的背景相关性之间找到平衡。

实践与探索

掌握了具体技巧后,最后我们谈谈如何通过实践来精通此道。新模型通常具备更强的记忆能力,能记住对话上下文。如果回答中缺少某些信息,可以要求其添加或重写,直到获得满意的答案或找到正确的提示方式。

以下是成为提示词高手的最后几点建议:

  • 迭代直至满意:不断尝试,直到得到想要的答案。
  • 直接询问AI:如果不确定如何提问,可以直接询问AI,例如:“获取流程图的最佳提示方式是什么?”
  • 熟能生巧:尝试不同的指令表达方式,直到找到最佳匹配。
  • 因“模”制宜:不同的模型(机器人)有不同的特长,使你的提示词适应其优势。
  • 赋予上下文:提供故事背景或情绪基调,帮助AI理解你的目标。

记住,撰写提示词是一门艺术。通过保持清晰、把握平衡并投入一些巧思,你就能解锁生成式AI惊人的创造潜力。

本节课中,我们一起学习了撰写有效提示词的核心原则与一系列实用技巧,从保持清晰具体到迭代优化,为与生成式AI的高效协作奠定了基础。

023:探索生成式人工智能中的提示词工程 🧠

在本节课中,我们将学习提示词工程的核心概念、常用技巧与工具。多位专家将分享他们的见解,帮助我们理解如何通过精心设计的提示词,从生成式AI模型中获得更准确、更符合预期的输出。

什么是提示词工程?

提示词工程是一门撰写优质、高效提示词的技术。模型将利用这些提示词,生成一致且出色的输出结果。

提示词工程的具体技巧通常取决于你所使用的具体应用,但其基本要素是明确的:你需要思路清晰,提供充分的上下文,并列出你希望从模型中获得的具体功能。

提示词工程是近两年随着生成式AI的兴起而出现的一个术语。它的核心在于理解如何向大型语言模型发出提示,以获得你想要的回应。

核心技巧与策略

上一节我们定义了提示词工程,本节中我们来看看专家们推荐的具体技巧和策略。

以下是几种关键的提示方法:

  • 零样本提示:这是目前人们使用ChatGPT等工具的典型方式,即直接要求模型做某事。“样本”即示例,零样本意味着不提供任何示例,只是说“做这个”。
  • 单样本提示:在提出请求时,提供一个示例格式。例如:“请为我撰写这个内容。这里有一个我希望你使用的格式示例。”这样,模型就能利用这个格式来组织所需信息,并以更好的方式格式化输出。
  • 少样本提示:为模型提供两个或更多示例。有趣的是,这些示例本身不一定需要内容正确,但格式必须正确。你甚至可以先用生成式AI根据你提供的格式创建更多示例,然后将这些新示例也加入你的提示词中。
  • 思维链:在提示词中要求模型分步思考。例如:“我将给你一系列步骤,请你先制定计划,然后一步一步地执行。”这有助于语言模型保持思路清晰。它会先制定一个计划,然后逐步执行每条指令,最后整合出答案。对于处理复杂任务,学习使用思维链提示非常有效。

此外,一个最重要且最常被提及的技巧是:为模型设定一个角色。例如,让它扮演JavaScript专家、产品经理或小型企业组织的CEO。你为它提供的角色示例越具体,输出的质量就越高。

关键参数与迭代

除了提示方法,与模型交互时还可以调整一些关键参数。

首先,我们应该明确指定任务,清晰地告诉模型我们在寻找什么,并提供一些上下文。有时我们可以提供一些示例,这利用了少样本学习的概念,让模型了解我们期望的输出形式。

我们可以进行迭代反馈,让模型根据不同的提示词进行学习。通过微调,我们可以观察哪种提示方式效果更好,能提供我们想要的回应。

我们还可以通过参数控制模型的生成方式。例如,温度Top-KTop-P等参数能使我们的模型更具生成性。我们可以调整这些参数,并结合之前提到的示例,让模型了解我们期望的输出结构。

因此,提示词工程实际上是一项使我们能够与模型交互,并要求它以我们期望的格式和方式提供回应的任务。

常用工具与实践

了解了核心概念后,我们来看看专家们常用的提示词工程工具有哪些。

以下是专家们提到的一些实用工具和方法:

  • Watsonx.ai Prompt Engineering Lab:这是目前最突出的提示词工程工具之一,特别适用于针对特定应用练习和开发有效的提示词。
  • 官方指南与工具:像OpenAI、Microsoft Copilot等平台,都有关于如何撰写优秀提示词的章节。你可以利用这些工具来帮助你撰写提示词,并预览可能获得的回应类型。
  • 直接与模型对话:例如,一位专家分享道,他曾直接询问ChatGPT:“我想让你为我分析一个工作流。以什么格式提供给你最好?”模型回复了一个结构建议。当他按照该结构提供信息后,模型就能精确地进行匹配,完成他想要的各种有趣任务。

需要注意的是,像Llama 2这样的模型有自己特定的语法规则需要遵循。如果不正确遵循,效果可能会不理想。虽然模型通常仍会输出内容,但我们的目标是以最少的试错、时间和资源浪费,获得我们想要的输出。因此,提示词工程在当前极具价值,它相对容易学习,绝对值得投入相当的时间去掌握。

总结

本节课中,我们一起学习了提示词工程在生成式AI中的关键作用。我们了解到,提示词工程是通过精心设计输入指令来引导AI模型生成理想输出的技术。核心技巧包括零样本、少样本、思维链提示以及为模型设定角色。同时,我们可以利用迭代反馈和调整参数来优化结果。最后,掌握如Watsonx.ai Lab等专业工具,并遵循特定模型的语法,能显著提升我们与AI交互的效率与效果。对于初学者而言,投入时间学习提示词工程是高效利用生成式AI的重要一步。

024:文本到文本提示词技术 📝

在本节课中,我们将学习如何通过精心设计的文本提示词来提升大型语言模型的可靠性与输出质量。我们将探讨多种核心提示词技术及其带来的益处。

近年来,自然语言处理领域因大型语言模型的应用取得了显著进步。然而,随着LLM规模和复杂度的增加,其可靠性、安全性和潜在偏见等问题也随之浮现。有效使用文本提示词是应对这些挑战的一个可行方案。文本提示词是精心设计的指令,用于引导LLM的行为以生成期望的输出。生成内容的质量和相关性,取决于提示词的有效性以及LLM本身的能力。

接下来,让我们探索那些能使文本提示词更有效、并能提升LLM输出可靠性的技术。

任务明确化 🎯

上一节我们提到了提示词的重要性,本节中我们首先来看看任务明确化技术。文本提示词应向LLM明确说明目标,以提高回答的准确性。

例如,提示词“将这句英文翻译成法语”就是一个实现任务的清晰指令。

上下文引导 🧭

上下文引导是一种技术,通过文本提示词为LLM提供具体指令,以生成相关输出。

例如,如果你想让模型生成一篇关于纽约市地标的短文,使用“写一段关于纽约市的短文”这样的提示词可能会得到一个笼统的回应。而一个更具体的提示词,如“写一段关于纽约市的短文,重点介绍其标志性地标”,由于包含了上下文信息,将能生成更贴切的输出。

领域专业知识 ⚕️

领域专业知识对于提升LLM的可靠性也至关重要。当你需要LLM在医学、法律或工程等专业领域生成内容,且准确性和精确性至关重要时,文本提示词可以使用领域特定的术语。

假设你想获取关于甲状腺功能减退症的医学信息,你的提示词可以这样写:“请解释甲状腺功能减退症的病因、症状和治疗方法,包括最新研究和医学指南。”

偏见缓解 ⚖️

偏见缓解是一种技术,通过文本提示词提供明确的指令,以生成中立的回应。

例如,假设你担心模型在回应关于领导力特质的提示时存在性别偏见。为了解决这个问题,你可以使用这样的文本提示词:“写一段100字的关于领导力特质的段落,不偏向任何性别,并提供所有性别的平等示例。”

框架设定 📐

框架设定是另一种技术,通过文本提示词引导LLM在所需边界内生成回应。

假设你想让模型总结一篇关于气候变化的冗长文章。你的文本提示词可以是:“用100字总结这篇关于气候变化的文章,聚焦其主要发现和建议。”

零样本提示 🚀

你知道吗?如今,经过海量数据训练并被调整以遵循指令的LLM,可以在无需针对特定任务进行训练的情况下执行任务。零样本提示是一种方法,生成式AI模型无需先验训练即可对提示词生成有意义的回应。

例如,提示词可以是:“选出这句话中的形容词。句子是:‘Anita烤出了社区里最好的蛋糕。’”这里的输出将是“最好的”。

然而,你通常无法通过一次提示就获得理想的回应,可能需要多次迭代。这就引出了用户反馈循环技术。

用户反馈循环 🔄

在用户反馈循环技术中,用户对文本提示词提供反馈,并根据LLM生成的回应迭代优化提示词。这个循环允许用户逐步改进模型的输出质量,直到达到期望的状态。

例如,用户通过文本提示词要求模型写一首诗。LLM生成了一首诗。用户说:“让它更有趣些。”LLM调整诗歌以包含更多幽默元素。用户认可了修改后的诗。

少样本提示 🧠

类似地,对于复杂任务,当你无法清晰描述需求时,会使用一种称为少样本提示的技术。它支持上下文学习,即在提示词中提供示例,以引导模型的表现。这些示例作为后续希望模型生成回应的样本的条件。

例如,假设模型的任务是生成简短的旅行推荐。作为少样本提示,你为模型提供以下引导性上下文:

  • “推荐一个以美丽海滩闻名的夏季旅行目的地。”
  • “推荐一个以美丽秋叶闻名的秋季旅行目的地。”

在使用这些少样本提示后,模型可以为其他类型的假期生成旅行推荐。例如,如果任务是“推荐一个值得探索的城市”,模型将生成答案:“考虑访问像巴黎这样充满活力的城市,以其丰富的历史、艺术和标志性地标而闻名。”这就是模型如何基于少样本提示中提供的最少训练数据,为不同类型的假期生成旅行推荐。

有效使用文本提示词的益处 ✨

当你使用我们刚刚讨论的方法将文本提示词与LLM结合使用时,会带来诸多益处。以下是其中一些:

  • 增强LLM的可解释性:可解释性指的是用户理解和解释模型决策过程及其生成输出背后原因的程度。它帮助用户、开发者和利益相关者理解模型如何工作、为何做出某些预测或生成特定文本,以及是否可以在各种应用中信任它。可解释性对于解决与AI相关的伦理问题至关重要,它帮助所有利益相关者评估并确保LLM的行为符合特定领域的伦理准则和法律要求。
  • 解决伦理考量:除了提高LLM的可靠性和可解释性,有效的文本提示词还有助于解决伦理问题。
  • 建立用户信任:当用户能够理解LLM的工作原理,并看到他们的指令对LLM行为的直接影响时,就会在用户和LLM之间建立起透明且有意义的互动,从而培养信任。

总结 📝

本节课中,我们一起学习了多种可以通过文本提示词提升LLM可靠性和输出质量的技术。具体来说,我们探讨了任务明确化、上下文引导、领域专业知识、偏见缓解、框架设定和用户反馈循环。我们还学习了零样本和少样本提示技术。最后,我们了解了有效使用文本提示词与LLM结合的多项益处,例如增强LLM的可解释性、解决伦理考量和建立用户信任。

025:访谈模式方法 🎤

在本节中,我们将学习提示工程中的“访谈模式方法”。我们将解释其核心概念,并学习如何应用此方法来编写更有效的提示,从而让生成式AI模型产生更具体、更符合需求的回答。

上一节我们介绍了提示工程的基本概念,本节中我们来看看一种更高级的策略——访谈模式方法。

什么是访谈模式方法? 🤔

访谈模式方法是一种提示工程策略,其核心在于通过模拟对话或访谈的形式与AI模型进行交互。这种方法不是提供一个静态的、一次性的指令,而是开启一个动态的、迭代的对话过程。

核心公式可以概括为:
用户提供初始指令 -> 模型提出追问 -> 用户回答 -> 模型处理信息并生成优化回答

访谈模式如何工作? ⚙️

这种方法需要对提示进行细致的优化,以确保模型生成的响应能精确满足你的目标。它通常遵循以下步骤:

以下是该方法典型的工作流程:

  1. 用户提供初始指令:你首先给模型一个角色和任务框架。
  2. 模型提出追问:模型根据你的指令,向你提出一系列必要的后续问题,以收集关键信息。
  3. 用户回答问题:你逐一回答模型提出的问题。
  4. 模型处理并生成回答:模型根据你提供的所有信息,进行处理和整合,最终提供一个精心优化的回答。

你提供的信息越详细,最终得到的结果就越好。

实战示例:旅行顾问 🧳

为了更好地理解,让我们通过一个例子来说明。假设你想让模型扮演旅行顾问,为你规划假期行程。

以下是你可以使用的访谈模式提示:

你将扮演一位经验丰富的旅行专家。你的目标是与我进行一次全面的旅行规划对话。请首先提出一系列详细的问题(一次一个),以收集所有必要信息,从而根据我的具体偏好、兴趣和预算,制定出最量身定制且令人难忘的旅行行程。

针对这个提示指令,模型可能会提出以下后续问题:

  • 你最喜欢去哪种类型的旅行目的地?
  • 你能用活动和体验来描述一下你理想的假期吗?
  • 你通常如何规划旅行?在选择目的地时,哪些因素对你最重要?
  • 在规划旅行目的地时,是否有特定的文化或历史方面让你特别感兴趣?
  • 旅行时你偏好哪种住宿选择?为什么?
  • 你如何平衡预算考虑与获得难忘旅行体验的愿望?

在这个例子中,每个问题都建立在前一个问题的基础上,形成了一个关于旅行偏好的结构化、信息丰富的对话。根据你对这些问题的回答,模型将规划出一个符合你偏好和需求的、令人难忘的旅行行程。

方法优势总结 🏆

在本视频中,我们了解到访谈模式方法优于传统的单次提示方法,因为它允许在与生成式AI模型交互时进行更动态、迭代的对话。

访谈模式涉及与模型进行来回的信息交换,这有助于实时澄清疑问并引导模型的响应方向。这反过来增强了用户优化所获结果的能力。

本节课中我们一起学习了:访谈模式方法的定义、其分步工作流程,以及如何通过一个旅行规划的实例来应用它。掌握这种方法,你将能更有效地引导AI模型,获得更精准、个性化的输出。

生成式AI基础:2.3:思维链方法 🧠

在本节中,我们将学习一种名为“思维链”的方法。这种方法通过将复杂任务分解为更小的步骤,来引导生成式AI模型进行逻辑推理,从而提升其解决问题的准确性和可解释性。

思维链方法是一种通过一系列提示或问题,将困难或复杂的任务分解为更小、更易管理的步骤的方法。每个提示都建立在前一个提示的基础上,引导AI模型逐步思考问题并生成期望的回应。这种方法使模型能够展示其推理过程,并提高其准确解决类似问题的能力。通过向模型提供问题及其解决方案,思维链帮助模型以结构化和逻辑化的方式处理任务。

上一节我们了解了思维链的基本概念,本节中我们来看看它为何在生成式AI中被广泛应用。

这种方法在生成式AI中被广泛使用,因为它能增强逻辑推理能力,并确保过程中的每一步都被考虑到,从而得到更准确的结果。它还能提高可解释性,允许用户追溯AI得出结论的过程,并简化调试。此外,它有助于克服语言模型的局限性,因为语言模型本身并非为多步推理而设计,除非被提示这样做。

思维链建模中最常见的两种模型是少样本思维链零样本思维链。少样本思维链通过提供示例来展示如何分解问题,而零样本思维链则鼓励模型独立地逐步思考。

为了更清晰地理解这两种方法,让我们通过一个例子来说明。我们将从少样本方法开始。

示例问题是关于一家商店以每个3美元的价格出售橙子,并提供“买二赠一”的优惠。

解决方案通过以下步骤展开:首先认识到每第三个橙子是免费的,因此三个橙子的成本等同于支付两个橙子的钱。扩展这个逻辑,六个橙子的成本等同于四个橙子的钱,即12美元。

现在,系统被给予一个类似的问题。这次的问题是,一家商店出售笔盒,提供“买一赠一”优惠,每个笔盒5美元。利用提示中作为样本示例提供的相同思维链推理,系统首先理解优惠结构,然后基于推理生成回应。因此,它能够得出正确答案:成本将是25美元。因为10个笔盒中,只需支付5个的费用。

在零样本方法中,不提供任何示例,而是鼓励系统独立找出答案。提示中会添加诸如“让我们逐步思考”或“让我们一步步解决这个问题以确保答案正确”等短语,以帮助系统独立设计方法解决问题。

让我们以同样的笔盒问题为例,看看如何使用零样本方法解决。提示如下:“如果一家商店以‘买一赠一’优惠出售笔盒,每个笔盒5美元,那么10个笔盒需要多少钱?让我们逐步思考。”在这种情况下,系统不依赖事先的样本或示例,而是尝试独立推理问题。它首先解释优惠,理解每两个笔盒中,顾客只需支付一个的费用。

然后,它将这种理解应用于问题。它将10个笔盒分成5个“付费与免费”的对,意识到只需支付5个笔盒的费用,并计算出总价为25美元。因此,即使没有先看到样本,系统也能够逐步推理逻辑并得出正确答案。

尽管思维链方法有诸多优势,但也存在一些挑战需要考虑。

以下是思维链方法面临的主要挑战:

  • 将回应分解为步骤可能会减慢模型速度,这对于聊天机器人等需要快速响应的应用可能并不理想。
  • 这种方法可能使简单问题变得不必要的复杂,让AI显得效率低下。
  • 早期步骤中的错误可能会延续下去,导致最终答案错误。

在本节课中,我们一起学习了思维链方法。我们了解到,思维链方法通过将复杂任务分解为更小的步骤,提高了AI模型的逻辑推理能力和准确性。两种主要的思维链方法是少样本思维链(提供示例以指导问题解决)和零样本思维链(鼓励模型独立逐步思考)。虽然思维链增强了决策能力和可解释性,但它也可能减慢处理速度、使简单任务复杂化,并可能延续早期步骤的错误。

027:思维树方法 🧠

在本节课中,我们将要学习一种名为“思维树”的高级提示工程方法。这种方法通过结构化、多路径的推理,帮助生成式AI模型解决复杂问题。我们将了解其核心概念、应用过程,并通过实例分析其优势与挑战。

概述

思维树方法通过将提示结构化为一个具有层级分支的树,来增强AI的推理能力。每个分支代表不同的思考路径,允许AI同时评估多种可能性,权衡潜在结果,并聚焦于最有希望的选项。这种方法为复杂问题提供了明确的指导,并探索了多种解决方案。

思维树方法的核心概念

想象一下,你和朋友需要选择一家餐厅吃饭。首先,你们会考虑想吃什么类型的食物。然后,根据预算和愿意出行的距离来缩小范围。最后,你们选定一个符合口味和偏好的地点。这就是思维树方法在现实中的一个例子。

思维树方法的核心在于结构化并行评估。它引导模型像人类一样思考:先发散出多种可能性(分支),再对每个分支进行评估和收敛,最终形成一个综合性的解决方案。

思维树方法的应用过程

以下是使用思维树方法进行提示工程的一般过程:

  1. 定义问题:清晰地陈述需要解决的复杂问题。
  2. 构建思维分支:在提示中引导模型从多个角度或维度思考问题的可能原因或解决方案路径。
  3. 并行评估:要求模型对每个分支进行深入分析,评估其利弊、风险和可行性。
  4. 综合与收敛:指导模型整合各分支的评估结果,形成一个结构化的、分步骤的行动计划或决策建议。

实例分析:在线商店销售下滑

让我们通过一个实例来具体理解思维树方法的应用。假设一家在线商店在过去三个月销售额神秘下降了20%,但网站流量保持稳定。我们可以构建如下提示:

“我们的在线商店在过去三个月销售额下降了20%,但网站流量保持稳定。可能是什么原因导致的?我们应该如何解决?请思考三种可能的原因,并从多个方向尝试解决问题,最终给出一个结构化的行动计划。”

模型的响应过程

  1. 识别原因(构建分支):模型首先识别并清晰列出了销售下滑的三个最可能原因:

    • 转化率低
    • 产品或定价问题
    • 外部市场因素
  2. 多方向解决方案(并行评估):模型针对每个主要原因提出了针对性的解决策略:

    • 对于转化率低:优化网站用户体验和结账流程。
    • 对于产品或定价问题:分析产品竞争力和定价策略。
    • 对于外部市场因素:研究市场趋势和竞争对手动态。
  3. 结构化实施计划(综合收敛):模型最终提出了一个分阶段的行动计划,涵盖短期、中期和长期的行动。

方法解析

在这个例子中,思维树提示通过鼓励模型探索多条推理路径,实现了对相互关联维度的深入分析。模型没有给出泛泛而谈的回应,而是将问题分解为三个独立的原因,从用户体验、定价和市场趋势等不同功能视角评估纠正策略,并综合成一个循序渐进的行动计划。这模仿了人类专家处理复杂、多层面问题的方式:测试并行假设,摒弃较弱选项,构建全面解决方案。

扩展应用:职业转型决策

思维树方法的应用不仅限于商业问题,也能扩展到个人决策领域,例如应对职业转型的困惑。

考虑以下提示:

“我正在考虑转换职业,但感到不确定。请基于我当前的技能和兴趣,阐述三条我可以选择的路径,例如:在当前领域提升技能、转向相关领域、或进行彻底转变。针对每条路径,分解出需要做出的子决策和步骤,评估潜在的风险和收益,并帮助我确定在选择最佳方向时应考虑哪些因素。”

模型的响应分析

模型遍历了每条思考路径:

  • 路径一:在当前领域提升技能
    • 优势:保持与行业趋势一致。
    • 局限:需要时间和资金投入。

  • 路径二:转向相关领域

    • 优势:拓宽职业机会。
    • 局限:现有技能与新角色的兼容性问题。
  • 路径三:彻底转变职业

    • 优势:可能获得更大的个人满足感。
    • 局限:财务风险高,存在失败可能。

最终,模型将最终决定权留给用户,并提供了关键的考虑因素,如个人兴趣、风险承受能力和市场需求。

这个例子展示了思维树方法如何支持在不确定性中进行深思熟虑的决策,通过并行评估不同选项的优劣,帮助用户更清晰地看到全局。

思维树方法的挑战与局限

尽管思维树提示法对于结构化推理和处理复杂的多步骤问题非常有效,但它也存在一些局限性。

以下是其主要挑战:

  • 过度生成:可能导致模型探索过多分支或偏离到不太相关的路径,使得回应冗长或重点被稀释。
  • 路径均等假设:此方法可能默认所有推理路径都同等有效,但在高风险或时间敏感的场景中,确定优先级至关重要。
  • 错误自信风险:如果模型围绕有缺陷的逻辑或不准确的事实创建了详细的推理链,可能会给薄弱的结论带来虚假的可信度,导致错误自信。

因此,用户需要仔细解读模型的输出,并结合自身判断进行决策。

总结

本节课中我们一起学习了思维树方法。

  • 思维树方法是一种高级提示工程技术,它使生成式AI模型能够通过结构化、逐步推理多种解决路径来处理复杂问题。
  • 它鼓励模型探索不同的可能性,并行评估它们,并交付深思熟虑、有充分支持的结论。
  • 这种方法对于需要分层决策的现实世界情况特别有用。
  • 同时,思维树提示法也存在一些局限性,例如过度生成的风险、过度分支到低价值路径,以及需要用户仔细解读。

当经过深思熟虑地使用时,这种方法为在AI支持下驾驭模糊性和做出明智决策提供了一个强大的框架。

028:选择提示词工程方法的关键考量 🎯

在本节中,我们将聆听专家分享,了解在选择最佳提示词工程方法时需要考虑哪些关键因素。掌握这些考量点,能帮助你更有效地与AI模型互动,获得更理想的输出结果。

上一节我们探讨了提示词工程的基本概念,本节中我们来看看如何根据具体情境选择合适的方法。

概述

选择提示词工程方法时,需要考虑多个方面。以下是专家指出的核心考量因素。

核心考量因素

以下是选择提示词工程方法时需要评估的几个关键维度。

1. 任务目标

首先,必须明确生成式AI要完成的具体任务。不同的任务需要不同的提示方法。例如:

  • 文本生成与摘要
  • 代码生成
  • 代码翻译
  • 图像生成

2. 模型能力

必须考虑模型本身的能力。不同的模型设计用于处理不同的用例。需要调整提示词以充分利用特定AI模型的优势,并提供足够的上下文以获得连贯的响应。

3. 清晰度与具体性

清晰度至关重要。如果你心中有一个明确的任务,必须尽可能详细、清晰地描述它。否则,输出结果可能过于通用,甚至可能产生被称为“AI幻觉”的不准确内容。核心公式可以概括为:
优质提示 = 清晰度 + 上下文 + 具体特征

4. 上下文与背景知识

上下文分析是主要出发点。需要考虑模型的上下文敏感性,即需要为模型提供多少上下文或背景知识,才能使其以我们期望的方式回答问题。提供的背景知识量非常重要。

5. 数据需求

需要考虑数据要求。有时任务需要更多数据,有时模型需要的数据量较少。

6. 反馈机制

建立反馈机制很重要。通过反馈,我们可以了解特定提示如何产生响应,从而改进与模型的交互方式,并提升其生成输出的质量。

总结

本节课中,我们一起学习了选择提示词工程方法时的关键考量。专家强调,清晰度、平衡性以及对AI模型的理解是核心。确保你的提示清晰简洁,在具体性和开放性之间取得平衡,并通过不同方法进行实验以获得最佳结果。通过综合考虑任务目标、模型能力、上下文、数据需求等因素,你可以在提示词工程中确保成功。

生成式AI基础:5.3:文本到图像提示词技术 🎨

在本节课中,我们将学习如何通过特定的提示词技术,提升生成式AI模型所创建图像的质量与表现力。我们将介绍五种核心的提示词技巧,帮助你写出更有效的图像生成指令。

图像是沟通的重要组成部分,广泛应用于市场营销、广告、教育、新闻等诸多领域。然而,有些图像在传达情感方面比其他图像更为出色。图像提示词是对你想要生成图像的文本描述。它可以简单到一个单词或短语,也可以更详细地描述图像的构图、色彩和氛围。

为了提升通过生成式AI模型获得的图像的影响力,使其更具说服力和吸引力,你可以使用图像提示词技术。这些技术旨在提高生成式AI模型所产生图像的质量、多样性和相关性。

有多种图像提示词技术可用于改善图像效果。接下来,我们将逐一了解这些技术。

风格修饰词

风格修饰词是用于影响生成式AI模型所产生图像的艺术或视觉属性的描述符。这些描述符可以帮助模型在遵循输入提示词结构和内容的同时,生成具有创新风格的图像。

你可以修改图像的各种视觉元素,如颜色、对比度、纹理、形状和大小,从而生成具有美学吸引力、视觉上令人愉悦的输出。你的提示词可以包含关于各种艺术风格、历史艺术时期、摄影技术、所用艺术材料类型,甚至是你希望模型模仿的知名品牌或艺术家特征的信息。所有这些信息都有助于生成模型理解期望的输出图像外观或风格。

以下是图像提示词中使用风格修饰词的一些例子:

  • 一个宁静的湖泊,**印象派风格**,柔和的色彩。
  • 一只猫坐在窗台上,**赛博朋克美学**,霓虹灯,雨夜。
  • 未来城市景观,**极简主义**,干净的线条,单色调。

质量增强词

高质量的图像比低质量的图像更具说服力和可信度。低分辨率图像通常会出现模糊和像素化,使观看者难以辨别其中的细节。另一方面,高分辨率图像保证了基本的可见性和可读性。使用高质量的图形设计可以提升图像的感知价值。

质量增强词是用于图像提示词中的术语,旨在增强视觉吸引力,并提高输出的整体保真度和清晰度。这些特定术语可以指导生成式AI模型执行降噪、锐化、色彩校正和分辨率增强等步骤。你可以在图像提示词中使用诸如“高分辨率”、“超详细”、“锐利”、“互补色”等术语作为质量增强词。它们可以增强图像的特定特征,从而产生更连贯的输出。

让我们看一些例子来理解如何在图像提示词中使用质量增强词:

  • 一张**高分辨率**的蜜蜂微距照片,**突出纹理**,**锐利对焦**。
  • 一幅**4K分辨率**的日落数字绘画,**鲜明色彩**,**细腻线条**。
  • 一幅肖像画,使用**互补色**,**背景模糊**,主体**突出**。

重复技巧

这种技术利用迭代采样来增强模型生成图像的多样性。重复涉及强调图像中的特定视觉元素,为模型创造一种熟悉感,使其能够专注于你想要突出的特定想法或概念。这可以通过在图像提示词中重复相同的单词或相似的短语来实现。重复有助于强化通过图像传达的信息,并提高模型对该元素的记忆性。

模型不会仅根据提示生成一张图像,而是生成多张具有细微差别的图像,从而产生一组多样化的潜在输出。当生成模型面对抽象或模糊的提示词,且存在多种有效解释时,这种技术尤其有价值。

让我们看一些在图像提示词中使用重复词的例子:

  • **微小**、**密集**的星星布满**巨大**、**广阔**的夜空。
  • 一个**宁静**、**清澈**的湖泊,周围是**茂密**、**翠绿**的森林。

加权术语

加权术语指的是使用能够产生强烈情感或心理影响的词语或短语。例如,“免费”、“限时优惠”和“保证”等词常用于广告中,以引发紧迫感、安全感和信任感。同样,“奢华”、“高端”和“独家”等词用于营造排他性和精致感。

生成式AI模型允许你为正负术语赋予权重,以强调或淡化某种情感。在图像提示词中使用加权术语有助于创建令人难忘、有说服力并能引起观众情感反应的图像。

以下是一些在图像提示词中使用加权术语的例子:

  • 一个**温暖**(权重:+10)、**噼啪作响**(权重:+8)的壁炉。
  • 一个**闪闪发光**(权重:+6)、**霓虹灯照亮**(权重:+8)的城市雨夜。
  • 一只**色彩斑斓**(权重:-6)、**异国情调**(权重:+10)的鸟。

修正畸形生成

该技术用于修改可能影响图像效果的畸形或异常。图像中的畸形可能包括扭曲(特别是在人体部位如手或脚上)、像素化或其他影响图像视觉吸引力和清晰度的质量问题。通过使用良好的负面提示词,可以在一定程度上缓解这些问题。

以下是一些在图像提示词中使用的修正畸形生成技术的例子:

  • 一个美丽的天使,**没有畸形的手**,**没有多余的肢体**。
  • 一张清晰的产品照片,**没有模糊**,**没有像素化**。
  • 一幅对称的建筑画,**没有扭曲**,**比例正确**。

总结

本节课中,我们一起学习了图像提示词技术在提升生成式AI模型图像生成能力方面起着至关重要的作用。风格修饰词、质量增强词、重复技巧、加权术语和修正畸形生成是五种可用于改善图像效果的技术。通过结合运用这些技巧,可以创造出更令人难忘、更具吸引力和说服力的视觉内容,从而有效地传达预期信息。

030:课程总结 🎓

在本节课中,我们将回顾整个课程的核心概念,总结你所学到的关于提示工程的知识与技能。

恭喜你完成了提示工程基础课程。现在你已经牢固掌握了如何设计有效的提示、使用生成式AI工具来构建提示,以及运用文生文和文生图技术。你将发现许多进一步学习和应用新技能的机会。在继续前进之前,让我们回顾一下你在整个课程中学到的关键概念。

核心概念回顾

上一节我们完成了课程学习,本节中我们来系统地回顾所有核心知识点。

提示的定义

你了解到,提示是提供给生成式AI模型的任何输入或一系列指令,模型据此收集信息、进行推断并提供最佳响应。

提示的构成要素

一个结构良好的提示包含以下基本构建模块:

  • 指令:明确告诉模型要做什么。
  • 上下文:提供相关的背景信息。
  • 输入数据:给出模型需要处理的具体信息。
  • 输出指示器:指定期望输出的格式或类型。

提示工程

设计有效提示以充分利用生成式AI模型能力的过程被称为提示工程。这个过程能提升模型性能、理解模型限制并增强模型安全性。

撰写有效提示的最佳实践

以下是撰写有效提示的一些最佳实践:

  • 使用简单明了的语言以确保清晰度。
  • 提供背景细节以构建上下文。
  • 具体明确并提供示例以提高精确度。
  • 提供相关上下文以进行角色扮演。

提示工程工具

提示工程工具提供各种功能来优化提示。你可以使用这些工具:

  • 根据给定输入建议提示
  • 构建提示结构以实现更好的上下文沟通。
  • 迭代优化提示,以找出最有效的提示、减轻偏见并为特定领域创建提示。

文生文提示技术

你学习了使文本提示有效并提高大语言模型输出可靠性的文生文提示技术。这些技术包括:

  • 任务规范技术
  • 上下文引导
  • 领域专业知识
  • 偏见缓解
  • 框架设定
  • 零样本提示
  • 用户反馈循环
  • 少样本提示

访谈模式方法

访谈模式方法允许与生成式AI模型进行动态、迭代的对话。它不是提供单一的静态提示,而是涉及与模型进行来回的信息交换,这有助于实时澄清查询并引导模型的响应。

思维链方法

思维链方法增强了生成式AI模型的认知能力。它引导模型进行逐步的思考过程。通过向AI模型提供相关的问题及其对应的解决方案,训练其理解解决问题背后的逻辑,使其能够解决其他类似问题。

思维树方法

思维树方法是一种创新技术,建立在思维链方法之上。它涉及以分层结构构建提示,以指导模型的推理和输出生成。这使得模型能够同时探索各种可能性和想法,像决策树一样分支展开。

多模态提示

多模态提示通过整合多种输入类型(如文本、图像和音频)来扩展生成式AI的能力,从而在不同场景中实现更丰富、更准确的理解、互动和创造力。

对弈方法

对弈方法涉及生成多个提示-响应对,并根据清晰度、精确度和上下文相关性等标准对它们进行评估。这种迭代方法有助于持续改进提示设计。

图像提示技术

图像提示技术增强了通过生成式AI模型获得的图像的影响力,使其更具说服力和吸引力。常用的图像提示技术包括:

  • 风格修饰符
  • 质量增强器
  • 重复
  • 加权术语
  • 固定形态生成

实践与项目

现在你已经回顾了本课程涵盖的基本概念。请记住查阅课程末尾的术语表,以复习讨论过的关键术语及其定义。

本课程包含实践实验和一个最终项目。通过完成实验,你获得了以下主题的实践经验:

  • 熟悉我们的AI提示工具。
  • 尝试基础提示和角色扮演模式。
  • 提示工程中的访谈提示方法。
  • 提示工程中的思维链方法。
  • 提示工程中的思维树方法。
  • 多模态提示。
  • 对弈方法。
  • 用于图像生成的有效文本提示。

我们建议你继续实践在本课程中学到的概念。我们希望这些原则能磨练你的技能,并帮助你在职业生涯中取得进步。

总结

本节课中我们一起学习了提示工程的核心概念、多种高级技术以及最佳实践。你掌握了从构建基础提示到运用思维链、思维树等复杂方法的能力,并了解了多模态提示和对弈评估等前沿思路。通过课程中的实验,你将理论知识应用于实践。

恭喜你完成本课程。我们感谢你参与这段学习旅程,并祝你一切顺利。

生成式AI基础:1.1:课程介绍

在本节课中,我们将要学习生成式AI,特别是基础模型,如何重塑全球各行各业。本课程将聚焦于生成式AI的核心原理,这些原理是创建强大AI模型、平台和应用的基础。掌握这些原理,可以最大化你的生成式AI学习体验。

本课程面向所有初学者,无论你是专业人士、爱好者、从业者还是学生。只要你对快速发展的生成式AI领域有真正的兴趣,这门课程就适合你。这是一门面向所有人的课程,无论你的背景或经验如何。

课程结束时,你将能够:

  • 识别构成生成式AI基础的核心概念。
  • 列举常用生成式AI模型的能力。
  • 解释基础模型如何生成文本、图像和代码。
  • 描述动态AI平台(如IBM Watson X和Hugging Face)的用途。

课程结构与内容

本课程是一个精炼课程,包含三个模块,预计每个模块需要1到2小时完成。

模块一:核心原理与模型

在模块一中,你将探索深度学习架构的原理与组件,并理解大型语言模型是如何创建的。你将区分常用生成式AI模型的能力,例如:

  • 变分自编码器
  • 生成对抗网络
  • 基于Transformer的模型
  • 扩散模型
  • 基础模型

模块二:模型应用与平台

上一节我们介绍了核心模型,本节中我们来看看它们的具体应用。在模块二中,你将通过T5、双向自回归Transformer模型、Imagen和代码序列模型等实例,学习预训练基础模型如何生成文本、图像和代码。此外,你还将了解动态AI平台(如IBM Watson X和Hugging Face)如何帮助企业创造价值并获得竞争优势。

模块三:实践与评估

模块三要求你参与一个最终项目,并完成一个计分测验来检验你对课程概念的理解。你也可以访问课程术语表,并获得关于后续学习路径的指导。


学习资源与互动

本课程融合了概念讲解视频和辅助阅读材料。观看所有视频以充分掌握学习材料的潜力。

以下是课程提供的实践与互动环节:

  • 动手实验:你将体验展示基础模型能力的动手实验。
  • 最终项目:在模块三中参与一个最终项目。
  • 练习测验:每节课后都有练习测验,帮助你巩固学习。
  • 计分测验:课程结束时需完成一个计分测验。
  • 讨论论坛:提供讨论论坛,供你与课程工作人员联系并与同伴交流。
  • 专家观点视频:通过专家观点视频,聆听经验丰富的从业者分享他们对课程所涵盖概念的见解。

总结

本节课中我们一起学习了《生成式AI基础》课程的整体框架、学习目标和内容结构。如果你一直想掌握这项正在突破机器学习边界的技术,那么你来对地方了。让我们开始学习吧。

032:深度学习与大型语言模型 🧠

在本节课中,我们将要学习生成式人工智能的核心概念,特别是深度学习与大型语言模型。我们将解释深度学习如何工作,并描述大型语言模型如何执行类人任务。

深度学习如何发生?

深度是通过层级结构创造的。你处理的信息层数越多,对周围世界的理解就越深入。这是人脑的工作方式,也是深度学习技术背后的驱动原理。

人工神经网络

人工神经网络是实现深度学习的关键。ANN由多个称为神经元的计算单元组成,这些神经元组织在三个相连的层中:输入层、一个或多个隐藏层以及输出层

当一个庞大的数据集被输入网络时,输入层的神经元捕获数据,隐藏层的神经元随后研究这些数据。

参数:网络的内部变量

隐藏层中的每个神经元都包含固有的偏置参数;两个神经元之间的连接则建立了权重参数

参数可以被定义为网络的内部值,随着神经元在庞大数据集上反复训练而得到优化。偏置和权重参数的数量越多,网络的计算能力就越强,从而带来更高的预测准确性。

监督学习

有时,深度学习算法在监督式已标记的数据集上进行训练,其中每个输入数据点都有已知的输出。这种监督学习有助于创建过滤电子邮件、检查信用评分、检测欺诈以及实现图像和语音识别系统的工具。


虽然更好的标记可以带来更高质量的算法训练,但它也引入了一些限制。监督学习算法被限制为只能提供预定义的响应,并且获取标记数据既耗时又昂贵。

无监督学习

更常见的情况是,深度学习算法在无监督未标记的数据上进行训练,其中训练数据由没有明确目标输出的输入数据组成。

以下是两种常见的无监督学习应用:

  • 聚类:算法根据实例的固有属性将相似的实例分组在一起。
  • 降维:算法捕获数据中最重要的特征,同时丢弃冗余或信息量较少的特征。

因此,无监督学习算法可以更自由地发现数据集内的模式和层次结构,从而产生更高效、更准确的结果。

这就是为什么深度学习算法产生高质量响应的能力,在很大程度上取决于它们被要求探索和查询的庞大数据集的质量。

神经网络架构的影响

另一个可以区分深度学习算法响应水平的因素是神经网络架构。在深度学习中部署的架构会影响算法产生的响应。

主要有三种类型的深度学习架构被区别使用:

  • 卷积神经网络:包含一系列层,每一层都对前一层进行卷积或数学运算。当应用于基于网格的数据(如图像)时,CNN可以快速从图像中提取有用信息,以识别模式、分类图像和分割图片。CNN在图像处理、视频识别和自然语言处理中很有用。
  • 循环神经网络:更擅长处理序列数据,如文本或语音。它们拥有一个记忆组件,使其能够捕获随时间变化的依赖关系和上下文信息。RNN在机器翻译、情感分析和语音识别中很有用。
  • 基于Transformer的模型:不使用卷积或循环来处理数据。相反,它们具有一个双栈结构,其中编码器和解码器处理异常大量的参数,以更深入地理解语言模式。

大型语言模型的诞生

Transformer中的深度学习算法可以分析和捕获层次序列中单词的上下文和含义,并预测输出序列中的下一个单词。

其结果就是创建了能够执行自然语言处理任务的大型语言模型,例如内容生成、预测分析、语言翻译和流程自动化。这些大型语言模型构成了生成式AI应用的基础机制。

LLM的示例包括OpenAI的生成式预训练Transformer GPT-3GPT-4、Google的PaLM 2以及Meta的Llama

实例:GPT-4

例如,GPT-4是一个语言处理AI,它基于互联网上海量的文本数据(包括书籍、文章和网站)进行训练。该模型拥有超过170万亿个参数。这帮助它执行自然语言处理任务,例如创建内容、建立对话系统和翻译语言。

人们利用这些能力来撰写高质量的论文和案例报告,或进行机器翻译和摘要。组织则利用这些能力来驱动聊天机器人和虚拟代理,甚至将国际商务通信或其网站内容翻译成当地语言。

未来展望

随着深度学习架构和技术的演进,LLM也将更努力地思考,以提供更准确和可接受的结果,帮助生成式AI模型执行日益复杂的任务。

总结

本节课中,我们一起学习了生成式AI的核心概念,并理解了大型语言模型如何执行类人任务。LLM利用Transformer网络的力量,在庞大的数据集上对深度学习算法进行预训练。这些算法捕获数据集内的模式和层次结构,以生成准确的类人响应。这项技术使得生成式AI具有可扩展性。

生成式AI基础:03:生成式人工智能模型 🧠

在本节课中,我们将学习生成式人工智能的核心模型。这些模型是构建生成式AI应用的基石,每种模型都有其独特的工作原理和应用特点。

生成式AI领域有四个模型产生了重大影响:变分自编码器、生成对抗网络、基于Transformer的模型以及扩散模型。每个模型都采用了不同类型的深度学习架构并应用了概率技术。接下来,我们将深入了解它们的工作原理。

变分自编码器

变分自编码器是所有生成式AI模型中最受欢迎的,原因有二:第一,它们能处理多样化的训练数据,如图像、文本和音频;第二,它们能快速降低图像、文本或音频的维度,以创建更新、改进的版本。

以下是其工作原理的简要介绍:

  1. 编码器:这是一个自给自足的神经网络,它研究输入数据的概率分布。简单来说,这意味着它会分离出最有用的数据变量。这使得编码器能够创建数据样本的压缩表示,并将其存储在潜在空间中。你可以将潜在空间视为模型架构内的一个数学空间,其中高维数据以压缩格式表示。
  2. 解码器:或称反向编码器,同样是一个自给自足的神经网络,它将潜在空间中的压缩表示解压缩,以生成期望的输出。

基本上,算法使用最大似然原理进行训练,这意味着它们试图最小化原始输入数据与重建输出之间的差异。

尽管变分自编码器在静态环境中训练,但其潜在空间是连续的。因此,它们可以通过从数据的概率分布中随机采样来生成新样本。由于它们能用少量训练数据生成逼真且多样的图像,变分自编码器被用于图像合成、数据压缩和异常检测等任务。

例如,娱乐行业使用变分自编码器创建游戏地图和动漫头像;金融行业使用它们预测股票的波动率曲面;医疗保健领域则利用变分自编码器通过心电图信号检测疾病。

生成对抗网络

生成对抗网络是另一种使用图像和文本输入数据的生成式AI模型。在这个模型中,两个卷积神经网络在对抗性游戏中相互竞争。

以下是其核心机制:

  • 一个CNN扮演生成器的角色,在大量数据集上训练以产生数据样本。
  • 另一个CNN扮演判别器的角色,试图根据判别器的响应来区分真实样本和伪造样本。

基于判别器的反馈,生成器力求产生更逼真的数据样本。生成对抗网络可以生成新的逼真图像、执行风格迁移或图像到图像的转换,甚至创建深度伪造内容。

金融行业使用生成对抗网络训练贷款定价模型或生成时间序列工具。例如,SpaceGAN处理地理空间数据,而Video StyleGAN2以创建视频游戏角色而闻名。

与变分自编码器不同,生成对抗网络的训练可能具有挑战性,因为它们需要大量数据和强大的计算能力。它们还可能产生虚假材料,这是一个伦理问题。

基于Transformer的模型

基于Transformer的模型在几年前被引入,当时循环神经网络开始面临一个称为“梯度消失”的问题。由于这个问题,循环神经网络难以处理长文本序列。

为了应对这一挑战,Transformer被构建出来,它带有注意力机制,能够聚焦于文本中最有价值的部分,同时过滤掉不必要的元素。这使得Transformer能够对文本中的长期依赖关系进行建模。

例如,当你输入一个简单的提示时,双栈Transformer架构使用编码器-解码器机制来生成连贯且与上下文相关的文本。由于Transformer模型可以查询广泛的数据库,它们能够创建大型语言模型并执行自然语言处理任务,如图片创建、音乐合成甚至视频合成。

这标志着我们在内容创作方法上的重大突破,并为创新提供了许多机会,正如我们在GPT-3.5及其版本、BERT和T5中所看到的那样。

扩散模型

扩散模型是生成式AI模型世界中较新的成员。它们通过应用扩散原理,解决了因潜在空间中的噪声而导致的数据系统性衰减问题。这些模型试图防止信息丢失。

就像在扩散过程中分子从高密度区域移动到低密度区域一样,扩散模型使用两步过程将噪声移入和移出数据样本:

  1. 前向扩散:算法逐渐向训练数据添加随机噪声。
  2. 反向扩散:算法逆转噪声以恢复数据并生成期望的输出。

OpenAI的DALL-E 2、Stability AI的Stable Diffusion、XL以及Google的Imagen都是成熟的扩散模型,能够生成高质量的图形内容。

与变分自编码器类似,扩散模型也试图通过首先将数据投影到潜在空间,然后将其恢复回初始状态来优化数据。然而,扩散模型使用动态流进行训练,因此训练时间更长。

那么,为什么这些模型被认为是创建生成式AI模型的最佳选择?因为它们训练了数百层,甚至可能是无限数量的层,并且在图像合成和视频生成的实验中显示出显著的效果。

随着无监督算法不断带来惊喜,对生成式AI模型的实验仍在持续进行。

总结

本节课中,我们一起学习了作为生成式AI基石的四个核心模型:变分自编码器能快速降低样本维度;生成对抗网络利用竞争网络产生逼真样本;基于Transformer的模型使用注意力机制对文本长期依赖关系进行建模;扩散模型则通过消除潜在空间中的噪声来解决信息衰减问题。理解这些模型是掌握生成式AI技术的关键第一步。

034:基础模型 🧠

在本节课中,我们将要学习基础模型的核心概念。我们将了解其定义、关键特征、能力,并通过实例来加深理解。


概述

斯坦福大学基础模型研究中心将基础模型定义为一种构建AI系统的新范式:在一个海量数据集上训练一个模型,并将其适配到多种应用中。我们称这样的模型为基础模型。

接下来,让我们深入探讨这个定义。


定义解析:海量数据训练

定义的第一部分指出,基础模型是在海量数据上训练的。其运作方式如下:

基础模型是一个大型、通用目的、自监督的模型。它通过预训练在大量无标签数据上,建立了数十亿甚至数万亿的参数。

预训练是一种技术,在此期间,无监督算法被反复赋予自由,在不同信息片段之间建立联系。这使得基础模型能够发展出多模态、多领域的能力。

以下是基础模型的关键特征:

  • 多模态输入:它们可以接受文本、图像、音频或视频等多种形式的输入提示。
  • 复杂任务执行:它们能够执行复杂且富有创造性的任务,例如回答问题、总结文档、撰写文章、解方程、从图像中提取信息,甚至编写代码。
  • 广泛适用性:这种广泛的技能组合使这些模型与多个领域相关。

这与较小的生成式AI模型形成对比,后者通常在受限的领域数据上训练,并被要求执行有限的任务。

例如,OpenAI的DALL-E系列模型被认为是基础模型,因为它们可以执行许多与图像相关的任务。相比之下,AlexNet不被归类为基础模型,因为它只执行图像分类任务。

因此,我们可以明确:虽然所有基础模型都具有生成式AI能力,但并非所有生成式AI模型都是基础模型


大型语言模型

当基础模型在庞大的自然语言处理数据库上进行训练时,它们被称为大型语言模型

LLMs发展出了独立的推理能力,使它们能够独特地响应查询。例如:

  • OpenAI的GPT模型家族,包括预训练了超过1750亿参数的GPT-3,以及估计预训练了超过180万亿参数的GPT-4。
  • 谷歌的PaLM模型,预训练了5400亿参数。
  • Meta的LLaMA模型,预训练了650亿参数。
  • 谷歌的BERT模型,预训练了超过3.4亿参数。
  • Meta的Galactica(面向科学家的LLM),在4800万篇论文、讲义、教科书和网站内容上预训练。
  • 阿联酋技术创新研究所的Falcon-7B,在1.5万亿个词元上预训练。
  • 微软的Orca模型,预训练了130亿参数,小到可以在笔记本电脑上运行。

随着生成式AI工具在范围和规模上的发展,这些参数很可能会发生变化。


定义解析:适配多种应用

定义的另一个方面是,我们可以将基础模型适配到许多应用中。

这是可能的,因为基础模型的广泛训练使其能够学习新事物并适应新情况。小型企业可以利用这种能力,以可承受的成本创建定制化、更高效的生成式AI模型。

这就是为什么基础模型也被称为基础模型。它们帮助那些没有资源从头开始训练自己模型的企业和个人更容易地使用AI系统。通过这种方式,基础模型使企业能够将价值实现时间从数月缩短到数周。

以聊天机器人的演进为例。OpenAI的GPT-3和GPT-4基础模型驱动了ChatGPT聊天机器人。谷歌的PaLM模型驱动了Google Bard聊天机器人。这些都是当今异常聪明的聊天机器人。

然而,回想早期聊天机器人的运作方式,我们意识到它们是在较小的数据集上训练的,这限制了它们的生成能力。它们只能基于关键词预测回复,并且只能提供预定的响应。

相比之下,今天的聊天机器人在广泛的数据集上进行了多次预训练。因此,它们能够提高词语预测的准确性,并以更有帮助和创造性的方式回应。你可以尝试一下:如果你在ChatGPT中输入一个简单的句子提示,你很可能会得到不止一个基本回复。根据你的提示要求,聊天机器人可能会撰写一篇比较论文、创建一个信息图、设计一个清单或编写一个短篇故事。

OpenAI的GPT-3也是图像生成工具DALL-E的基础模型。对于单个文本提示,DALL-E可以生成四种高分辨率图像,支持多种风格,包括照片级真实图像和绘画。

这里需要澄清另一点:虽然所有大型语言模型都是基础模型,但并非所有基础模型都是大型语言模型


其他架构:扩散模型

一些基础模型使用扩散架构能力来提高其图像生成的规模和范围。例如:

  • DALL-E使用Transformer架构,但其最新版本使用扩散模型从文本生成图像。
  • Stability AI的Stable Diffusion使用扩散架构,根据用户的描述生成高分辨率图像,风格可以是写实、卡通或抽象。
  • 谷歌的Imagen使用基于LLM构建的级联扩散模型,从文本提示生成图像。

局限性与注意事项

随着基础模型在其优势和应用方面的发展,我们也看到了一些局限性:

  1. 偏见风险:如果训练基础模型的数据存在偏见,那么期望的输出也可能带有偏见。
  2. 幻觉问题:LLMs可能会产生“幻觉”响应,这意味着它们会生成虚假信息,因为它们误解了数据集中数据参数的上下文。

因此,你必须谨慎地验证生成式AI聊天机器人输出的准确性。只要稍加注意,你就可以享受基础模型带来的诸多好处。


总结

本节课中,我们一起探索了基础模型的概念。这些模型在数十亿参数上进行预训练,使其能够发展独立推理能力并执行大量复杂任务。鉴于其多模态、多领域的能力,它们可以作为生成式AI应用的基础或基石

035:推进生成式人工智能能力 🚀

在本节课中,我们将通过专家的视角,了解以GPT和DALL-E为代表的基础模型是如何显著推进生成式AI领域发展的。我们将探讨它们的技术原理、应用场景以及随之而来的伦理考量。


基础模型的突破性进展

上一节我们介绍了生成式AI的基本概念,本节中我们来看看具体模型的贡献。GPT和DALL-E等基础模型通过展示生成高度连贯、符合语境的文本和图像的能力,极大地推动了该领域的发展。

具体而言,ChatGPT和DALL-E是两个帮助社区熟悉生成式AI概念的开源平台。这两个大型模型在庞大数据集上进行了训练,能够处理其领域内的许多不同用例和主题。

核心技术:Transformer与生成式预训练

关于Transformer架构的研究,最终将生成对抗网络(GANs)的概念与Transformer结合,从而诞生了生成式预训练Transformer(GPT)。其优势在于语言模型本身非常鲁棒。

对于一个经过预训练的Transformer(特别是自然语言处理管道)来说,生成人工或合成文本是一个非常受欢迎的选择。因为它已经用大量优质信息进行了预训练,能够生成看似完美的文本。

例如,ChatGPT可以处理许多不同的文本生成用例,并且非常通用,因为它在训练阶段接触过许多不同的数据集。DALL-E在图像生成方面同样具有创造性和广泛的适用性。

模型的应用与优势

以下是这些模型的核心应用与优势:

  • GPT(生成式预训练Transformer):擅长生成类人文本。这使得聊天机器人、自动化内容创作、语言翻译等应用成为可能。
  • DALL-E:能够根据文本描述生成图像。它展示了AI在艺术、设计和广告等创意领域的潜力。

GPT模型是大型语言模型产业最重要的支柱之一,所有基于它的工具都非常流行。DALL-E则是一个基于自动编码器的软件,专门用于创建人工图像。两者都是各自应用领域内非常受欢迎的选择,它们所使用的生成式网络的预训练部分包含了海量信息,使其作为预训练模型极具价值。

微调与可及性

微调的概念也帮助社区和其他用户能够在不需要巨大计算能力或海量数据的情况下使用这些模型,降低了技术门槛。

伦理与社会影响

从早期阶段开始,拥有这些模型就促使社区讨论其伦理和社会影响。这让我们开始思考伦理问题,以确保我们关注这些模型响应中可能存在的偏见和伦理问题。我们需要对模型的响应施加一些限制,并关注围绕模型的治理与监控,从而能够信任这些大型语言模型或生成式AI为我们提供的结果。


总结

本节课中,我们一起学习了GPT和DALL-E如何作为基础模型推动生成式AI的发展。它们通过在庞大语料上预训练并结合Transformer等先进架构,在文本和图像生成的质量与多样性上设立了新的标杆,不断拓展AI在内容生成领域所能达到的边界。同时,它们的出现也促使我们更早地关注并思考AI应用的伦理与治理问题。

036:探索IBM Watsonx的生成式人工智能能力 🧠

在本节课中,我们将跟随AI专家的视角,深入了解IBM Watsonx平台所提供的强大生成式人工智能能力。我们将探讨其核心组件、关键功能以及如何满足企业级应用的需求。


概述

IBM Watsonx是一个集成了多种工具和生成式AI能力的综合性平台。它利用先进的AI模型来生成文本、代码和数据洞察,其自然语言处理功能能够创建详细且上下文准确的报告、摘要和响应,使其在客户服务、内容创建和数据分析领域极具价值。

核心组件与工作流程

上一节我们概述了Watsonx的价值,本节中我们来看看其具体的核心组件和典型工作流程。

1. 数据访问与准备:Watsonx.data

处理任何数据科学和生成式AI用例,首先需要访问正确的数据集。为此,Watsonx提供了 Watsonx.data 组件。

  • 功能:它旨在帮助企业克服数据孤岛问题,无论数据存储在何处,都能便捷地访问。
  • 生成式AI赋能:该组件融入了生成式AI的优势,支持交互式查询。用户可以使用自然语言询问所需数据,例如请求特定表格或执行数据预处理任务。

2. 模型选择与应用:Watsonx.ai

在准备好数据之后,下一步是选择和应用合适的大语言模型。Watsonx.ai 正是为此设计的模型集合。

  • 模型库:它是一个包含多种大语言模型的套件,既包括由IBM研究院开发的专有模型,也集成了开源大语言模型。
  • 模型质量:IBM在开发自有大语言模型时,确保用于训练的数据经过精心准备和清洗,避免了攻击性数据集和数据偏见问题。
  • 自动化工具:平台还提供了大量自动化软件和工具,极大地方便了数据科学家和数据工程师进行模型相关工作。

以下是Watsonx.ai平台可能包含的模型类型示例:

# 示例:Watsonx.ai 可能提供的模型类型(概念性代码)
available_models = {
    "ibm_models": ["granite-series", "watsonx-code"],
    "open_source_models": ["llama-2", "mistral", "flan-t5"]
}

3. 治理与监控:Watsonx.governance

部署和使用AI模型时,治理与监控至关重要。Watsonx.governance 平台专门负责这一环节。

  • 模型目录与仪表板:它不仅帮助用户对模型进行编目,提供一个统一的仪表板来查看所有模型及其不同版本和当前阶段。
  • 性能监控:更重要的是,它帮助用户从多个维度监控模型性能,例如幻觉(hallucination)偏见(bias) 等。当发现问题时,平台会发出警报,有时能自动缓解问题,并可以追溯到事务级别, pinpoint 具体是哪些数据导致了问题。

4. 代码与数据生成

除了文本处理,Watsonx还支持其他形式的生成任务。

  • 代码生成:支持代码生成(cogeneration),帮助开发者自动化重复性编码任务,提升软件开发效率。
  • 合成数据生成:平台生成合成数据的能力,有助于训练机器学习模型,在解决隐私顾虑的同时提供高质量的数据集。

5. 模型评估

评估大语言模型的结果比传统模型更为复杂,因为输出通常是图像或文本。Watsonx平台内置了评估机制。

  • 自动化评估:对于摘要生成等不同任务,平台默认包含了相应的评估指标(evaluation metrics)。当用户选择特定任务时,系统会自动选择合适的评估指标,帮助用户持续评估模型效果。

评估生成质量的公式可以抽象表示为:
评估分数 = f(生成内容, 参考标准, 任务目标)
其中 f 代表根据具体任务(如摘要、问答)设计的评估函数。


总结

本节课中,我们一起学习了IBM Watsonx平台的生成式AI能力。我们了解到,Watsonx远不止于基础应用,它是一个非常完善且细致的软件平台。它通过 Watsonx.dataWatsonx.aiWatsonx.governance 三大核心组件,覆盖了从数据准备、模型选择与应用到最终治理监控的完整AI生命周期,并提供了代码生成、合成数据生成等高级功能,是一个强大的企业级生成式AI解决方案。

037:文本到文本生成 📝

在本节课中,我们将要学习生成式AI中的文本到文本生成模型。我们将探讨这类模型的不同类型、工作原理、以及它们在现实世界中的应用和优势。

概述

文本到文本生成模型是一种机器学习模型,它能够根据给定的输入文本生成新的文本。这些模型在大型文本语料库上进行训练,学习语言中的模式、语法和上下文信息。它们可以生成多种格式的文本,包括代码、脚本、音乐、电子邮件和信件等。

文本到文本生成模型简介

文本到文本生成模型主要用于从给定的输入生成文本。它们通过学习海量文本数据中的规律来工作。

主要有两种类型的文本到文本生成模型:统计模型和神经网络模型。

以下是这两种模型的简要介绍:

  • 统计模型:这类模型使用统计技术来生成文本。一个常见的例子是马尔可夫链。
  • 神经网络模型:这类模型使用人工神经网络来生成文本,能够表示数据之间更复杂的关系。

模型架构:Seq2Seq与Transformer

上一节我们介绍了模型的基本类型,本节中我们来看看它们具体使用的架构。文本到文本生成模型主要采用序列到序列(Sequence-to-Sequence)或Transformer类型的架构。

  • 序列到序列模型:这类模型首先将输入文本编码成一个数字序列,然后将该序列解码成代表生成文本的新序列。其公式可简化为:输出序列 = 解码器(编码器(输入序列))。它常用于摘要、语音识别和机器翻译等任务。
  • Transformer模型:这类模型直接将输入文本映射到生成的文本,通常能产生比序列到序列模型更流畅、自然的文本。Transformer的一个关键特性是注意力机制,它能强调相关词汇的权重,为特定词汇或标记提供上下文。

流行的文本到文本生成模型

了解了基础架构后,我们来看看几个最流行的文本到文本生成模型的具体实例。

以下是三个具有代表性的模型:

  1. GPT(由OpenAI创建):这是一个大型语言模型,通过在大量文本和代码上训练而成。它能够生成文本、进行语言翻译、创作多种形式的创意内容,并对用户查询提供信息丰富的回答。
  2. T5(由Google AI开发):这是一个“文本到文本迁移Transformer”模型。它的核心思想是将所有NLP任务都框架为“文本到文本”问题,使用统一的编码器-解码器架构来执行翻译、分类等多种任务,并利用迁移学习能力。
  3. BART(由Facebook AI开发):这是一个双向自回归Transformer模型。它结合了类似BERT的双向编码器(能同时向前和向后处理文本)和类似GPT的自回归从左到右解码器。这种结构使其能够完成情感分析、问答、语言翻译和生成类人文本等任务。

应用与优势

现在我们已经认识了这些强大的模型,本节中我们来看看它们在实际中有何用途,又能带来哪些好处。

文本到文本生成模型是完成多种任务的强大工具。

以下是几个典型应用示例:

  • 文本摘要:模型可以处理输入文本,生成概括其要点的摘要,而不改变原意。
  • 对话智能:通过基于文本的查询响应提供个性化辅助,支持聊天机器人和虚拟助手。
  • 内容创作:生成产品描述、撰写电子邮件、创建简历等数字文本。

正因为这些广泛的应用,文本到文本模型提供了显著的优势:

  • 提高生产力:通过自动化任务,如生成营销文案或社交媒体帖子。
  • 提升准确性:减少人为错误,例如,模型可以无误地进行上下文相关的文档翻译。

总结

本节课中我们一起学习了生成式AI中文本到文本生成模型的核心知识。我们了解了这类模型的定义,认识了统计模型和神经网络模型两种主要类型,并深入探讨了序列到序列和Transformer两种关键架构。我们还具体分析了GPT、T5和BART这三个流行模型的特点。最后,我们回顾了这些模型在摘要、对话和内容创作等方面的多种用途,以及它们在提升生产力和准确性方面带来的重要价值。

038:文本到图像生成 🖼️

在本节课中,我们将学习文本到图像生成模型。你将了解这类模型的工作原理、主要类型,并认识两种最流行的模型:DALL-E和Imagen。

文本到图像生成模型是一种机器学习模型,用于根据文本描述生成图像。它们利用生成式人工智能技术,理解文字的含义并将其转化为独特的图像。

这些模型在大量的文本和图像数据集上进行训练,能够生成各种类型的图像,包括写实图像、抽象图像,甚至现实世界中不存在的图像。

文本到图像生成模型的类型

文本到图像生成模型主要分为两类:生成对抗网络和扩散模型。接下来我们分别看看它们。

生成对抗网络

生成对抗网络是一种可用于生成逼真图像的机器学习模型。其工作原理是让两个模型相互对抗训练:一个生成器模型负责生成图像,一个判别器模型负责区分真实图像和生成图像。生成器模型会随时间推移不断改进,直到其生成的图像与真实图像难以区分。

其核心对抗过程可以概括为以下公式:
min_G max_D V(D, G) = E_{x~p_data(x)}[log D(x)] + E_{z~p_z(z)}[log(1 - D(G(z)))]
其中,G是生成器,D是判别器。

扩散模型

扩散模型是另一种用于根据文本描述生成图像的机器学习模型。其工作方式是从一个随机噪声图像开始,逐步向图像添加细节,直到它与文本描述相匹配。扩散模型通常比生成对抗网络更高效,并能生成更具创意和抽象的图像。

扩散过程的核心是逐步去噪,其前向和反向过程可以用以下代码概念表示:

# 概念性代码:前向过程逐步添加噪声
for t in range(T):
    image = add_noise(image, t)
# 反向过程:从噪声中重建图像
for t in reversed(range(T)):
    image = remove_noise(image, t, text_description)

流行的文本到图像生成模型

在扩散模型中,有两种最流行的文本到图像生成模型:DALL-E和Imagen。以下是它们的详细介绍。

DALL-E

DALL-E是由OpenAI开发的文本到图像生成模型。它在海量的文本和图像数据集上训练,可以根据各种文本描述生成逼真的图像。为了实现最终图片的准确性,它还包含了一个评估机制。

DALL-E结合了其核心要素:自然语言处理、机器学习和计算机视觉。例如,它可以接受一个简单的描述,如“一只熊猫在玩杂耍球”,并将其转化为一张前所未有的、照片般逼真的图像。

不仅如此,DALL-E还可以基于简单的文本描述编辑照片,使编辑部分与原始图像无缝融合,这被称为“图像修复”。

DALL-E的特殊之处在于,深度学习使其能够理解单个对象(如熊猫和球)以及事物之间的关系。最新版本的DALL-E是一个大型模型,但远小于GPT-3,有趣的是,它比其前身还要小。尽管体积更小,但这个新版本生成的图像分辨率比旧版DALL-E高出四倍。

DALL-E的优势如下:

  • 评估理解能力:DALL-E生成的图像可以告诉我们,系统是真正理解了我们的描述,还是仅仅在重复它所学到的东西。
  • 促进AI安全发展:通过使我们理解AI如何解读我们的世界,DALL-E在开发有用且安全的AI方面发挥着至关重要的作用。

Imagen

Imagen是由Google AI开发的文本到图像生成模型。与DALL-E一样,Imagen也在海量的文本和图像数据集上训练,用于根据多种文本描述生成逼真的图像。

Imagen利用大型Transformer模型和深度语言理解的能力来生成高保真度的图像。一个重要发现是,像T5这样在文本上预训练的大型语言模型,在编码文本以生成图像方面非常有效。因此,增加Imagen中语言模型的规模,比增加图像扩散模型的规模更能提升图像保真度。

Imagen声称能够产生前所未有的照片真实感,这是其主要优势之一。其工作流程如下:模型接收文本(例如“两把白色雨伞升上天空。云在移动。正在下雨”),并将其转换为描绘该场景的图像。生成的图像可以是照片般逼真的,也可以是艺术化的诠释。

Imagen的优势如下:

  • 极高的照片真实感:能够生成细节丰富、极其逼真的图像。
  • 强大的语言理解:得益于大型语言模型,对文本描述的语义理解非常深刻。
  • 灵活的生成风格:既能生成写实图像,也能生成艺术化图像。

总结

本节课中,我们一起学习了文本到图像生成模型的工作原理。这些模型主要分为生成对抗网络扩散模型两大类。在扩散模型中,我们重点探讨了两种最流行的模型:DALL-EImagen。最后,我们了解了每种模型的优势和应用价值。掌握这些模型,是理解现代生成式AI在视觉领域应用的关键一步。

039:文本到代码生成 🧠➡️💻

在本节课中,我们将要学习文本到代码生成模型的工作原理。我们将了解这类模型如何将自然语言描述转化为实际的代码,识别不同的模型类型,并探讨它们的用途与优势。

模型工作原理

文本到代码生成模型是一种机器学习模型,它能够根据自然语言描述生成代码。这些模型利用生成式AI,通过神经代码生成的过程来编写代码。

神经代码生成是一个使用人工神经网络的过程,这些网络的设计灵感来源于人脑中的神经网络。这些神经网络在大量代码示例的数据集上进行训练,然后进行微调,以生成代码片段、函数乃至完整的应用程序。生成的代码在结构和功能上与其训练过的示例相似。

主要模型类型

上一节我们介绍了模型的基本原理,本节中我们来看看两种主要的文本到代码生成模型。

以下是两种核心的模型架构:

  1. 序列到序列模型:这是一种能够将一个领域的内容“翻译”到另一个领域的机器学习模型。在文本到代码生成中,模型可以将自然语言描述翻译成代码序列。

    • 公式/概念自然语言序列 -> 编码器 -> 解码器 -> 代码序列
  2. Transformer模型:这也是一种机器学习模型,特别擅长学习词语之间的长距离依赖关系。在文本到代码生成中,模型被训练来理解自然语言描述中的词语与对应代码之间的关系。

    • 核心机制自注意力机制,允许模型在处理每个词时,权衡输入序列中所有其他词的重要性。

流行的文本到代码模型

了解了基础架构后,让我们具体看看一些基于上述架构的流行模型。

以下是几个具有代表性的文本到代码生成模型:

  • CodeT5:由Google AI开发的序列到序列模型。它是第一个代码感知、基于编码器-解码器的预训练编程语言模型。CodeT5在大量文本和代码数据集上训练,能够支持广泛的代码智能应用,例如代码摘要、问答和语言翻译。

  • Code-to-Sequence:由OpenAI开发的序列到序列模型。它采用了一种利用编程语言句法结构来更好地编码源代码的替代方法。该模型可以生成用于代码摘要、文档生成和检索等任务的代码。例如,它可以为代码片段分配描述其功能的自然语言标题。

  • Pangu-Coder:由微软研究院开发的Transformer模型。它是一个仅解码器的预训练语言模型,基于Pangu-Alpha架构(一种用于自然语言处理的大规模神经网络)。该模型可以生成用于函数定义、类定义和程序综合等任务的代码。例如,它能根据自然语言描述成功合成可运行的问题解决方案代码。

通用模型与工具

除了专门的代码生成模型,一些通用的基础模型和工具也具备强大的文本到代码生成能力。

以下是两个著名的例子:

  • GPT系列与Code Llama:OpenAI的GPT模型在类人文本生成方面表现出色,在代码创作上也展示了令人印象深刻的能力。Meta的Code Llama则专门用于生成和解释自然语言(特别是英语)代码。

  • GitHub Copilot 与 IBM Watson Code Assistant:这些是实用的生成式AI工具。GitHub Copilot由OpenAI Codex驱动,可以根据多种编程语言和框架生成代码。IBM Watson Code Assistant基于IBM watsonx.ai构建,通过实时推荐、自动完成功能和代码重构辅助,帮助开发者准确高效地编写代码。

用途与优势

文本到代码生成模型和工具在软件开发中有着广泛的应用,能带来诸多好处。

以下是其主要用途和优势:

  • 自动完成:在开发者键入时,建议并补全代码片段或语句,提升编码速度。
    • 示例:当开发者用Python编写代码注释时,工具能根据注释上下文建议相关的关键字、变量名或函数名。

  • 代码生成与文档:根据自然语言描述自动生成代码,并改善代码可读性和文档。

    • 示例任务:“创建一个能计算给定整数阶乘的Python函数。”
    • 生成代码
      def factorial(n):
          if n == 0:
              return 1
          else:
              return n * factorial(n-1)
      
  • 调试辅助:帮助识别和修复软件程序中的错误,减少调试时间。

    • 示例场景:聊天机器人生成无关响应。开发者描述问题后,模型可能生成用于微调模型的代码片段,帮助快速解决问题。
  • 代码翻译与重构:自动在不同编程语言间翻译代码,促进跨平台兼容和迁移;自动化识别过时或低效代码段并建议优化替代方案,简化应用现代化流程。

  • 框架推荐与测试数据生成:根据项目需求推荐合适的库和框架;自动创建代码片段来生成多样、真实的测试用例,填充数据库或数据结构。

  • 自动文档生成:根据代码功能自动生成注释、函数描述和文档,使代码库更易于理解和维护。

总结

本节课中,我们一起探索了文本到代码生成模型的各个方面。我们学习了这类模型通过神经代码生成进行工作的原理,认识了两种主要类型:序列到序列模型和Transformer模型。我们还了解了CodeT5、Code-to-Sequence和Pangu-Coder等流行模型及其用途。最后,我们详细探讨了文本到代码生成模型和工具在自动完成、调试、代码翻译、重构与现代化、框架推荐、测试数据生成以及代码文档化等方面的多种用途和显著优势。

生成式AI基础:第10章:IBM Watsonx.ai人工智能平台 🚀

在本节课中,我们将学习IBM Watsonx.ai平台。这是一个专为企业级AI应用设计的集成工具集,旨在帮助AI构建者高效、安全地开发和部署生成式AI与机器学习模型。


平台概述

上一节我们介绍了生成式AI的基础概念,本节中我们来看看如何将其应用于企业环境。用AI创作诗歌或艺术很有趣,但将AI应用于商业领域时,需要考虑更宏大的目标。企业级AI需要基于更高的标准构建,它必须可信、安全、可扩展且适应性强。IBM Watsonx正是这样一个帮助企业利用AI的平台。

IBM Watsonx是一个面向AI构建者的集成式AI与数据平台。该平台包含三个核心产品:

  1. Watsonx.ai:一个用于新型基础模型、生成式AI和机器学习的工作室。
  2. Watsonx.data:一个数据存储库。
  3. Watsonx.governance:一个用于AI监控与治理的工具包。

本视频将重点介绍Watsonx.ai。


Watsonx.ai 核心功能

Watsonx.ai是一个由基础模型驱动的集成工具工作室,用于处理生成式AI和构建机器学习模型。通过Watsonx.ai,你可以轻松地训练、调优、部署和管理基础模型。这能帮助你在更短的时间内,使用更少的数据构建AI应用。

以下是使用Watsonx.ai可以实现的主要目标:

  • 构建机器学习模型
  • 试验基础模型
  • 管理AI生命周期

根据你的目标,你可以选择Watsonx.ai提供的任务。这些任务可以通过平台上的工具来完成。Watsonx.ai中的任务和工具与模型的AI生命周期紧密对齐:准备数据 -> 构建实验并训练模型 -> 部署模型并构建应用 -> 持续管理和优化模型。


关键工具介绍

Watsonx.ai提供了多种工具来支持AI开发流程。以下是其中几个核心工具:

1. 模型访问与Prompt Lab
Watsonx.ai允许访问IBM精选的Hugging Face开源模型,以及一系列IBM训练的不同规模和架构的模型。作为AI价值创造者,你还可以将自己的模型和数据带入Watsonx.ai。

例如,通过 Prompt Lab 工具,AI构建者可以试验基础模型,并构建满足其需求的提示词。Prompt Lab使用户能够通过实验性提示词来支持一系列自然语言处理任务,包括:

  • 问答
  • 内容生成
  • 摘要
  • 文本分类与信息提取

2. 模型调优工作室
作为AI创造者,你可能希望基于自己的数据为特定业务用例定制模型。Watsonx.ai通过 Tuning Studio 工具使你能够做到这一点。该工具提供了先进的调优方法,只需点击几下即可设置。后续版本将包含提示词调优和微调基础模型的示例,以获得更好的性能和准确性。

3. 自动化流水线
将模型投入生产是一个涉及多步骤的过程。Watsonx.ai提供了 Pipeline 工具来管理和自动化模型生命周期。流水线工具可用于自动化以下步骤:

  • 加载数据
  • 训练模型
  • 部署模型
  • 评估模型

这可以缩短模型投产时间,并提高模型的准确性和可靠性


工作流程与优势

让我们通过一个示例了解Watsonx.ai中的不同工具如何协同工作,创建一个简化的AI模型工作流。

过去,AI模型必须经过训练才能执行非常具体的任务。但现在,借助基础模型的力量,你可以用更少的时间和数据构建强大的AI应用。

  1. 在Prompt Lab中,你可以通过易于使用的工具构建和优化提示词,引导模型满足你的需求,达成预期结果。
  2. 如需进一步定制,你可以在Tuning Studio中导入数据集,用少至100个示例来调优你的模型,使其为你的业务用例更加精准。
  3. 模型准备就绪后,即可创建企业级部署并开始构建你的应用程序。

就这样,通过Watsonx.ai,你的团队能够在一个协同环境中工作,该环境简化了整个AI生命周期的工作流程,从而为企业倍增AI的力量。它实用、高效且易于使用


安全与隐私

IBM Watsonx.ai确保你正在处理的数据和模型的安全性。你创建的数据和模型仅对你自己可见。你的数据以加密格式存储,你创建的模型也仅属于你的账户。IBM无法访问你的数据或模型,未经你的许可,它们也永远不会被IBM或任何其他个人或组织使用。


总结

本节课中,我们一起学习了IBM Watsonx,这是一个帮助企业在负责任和透明的前提下创建AI的AI与数据平台。Watsonx的产品之一Watsonx.ai,是一个用于训练、调优和部署生成式AI模型的集成工具工作室。Watsonx.ai提供的主要工具包括Prompt LabTuning StudioPipeline工具

041:Hugging Face平台 🤗

在本节中,我们将学习Hugging Face平台。这是一个开源的AI平台,旨在让科学家、开发者和企业能够协作构建个性化的机器学习工具。我们将了解其核心目的、提供的工具与能力,以及它如何与Watson X AI等平台合作,共同助力企业发展。

平台概述与目的

Hugging Face是一个开源人工智能平台。其创建目的是为开源AI社区建立一个中心,用于共享模型、数据集和应用程序。这使得各类用户都能接触和使用AI,即使是那些没有独立构建机器学习应用预算或资源的用户。因此,Hugging Face被誉为推动了AI的民主化,因为它汇集了众人之力,让人们能够从众多精炼的小型模型中受益,挑战了“一个通用模型统治一切”的假设。

最初,Hugging Face社区专注于创建基于Transformer的模型,以利用自然语言处理(NLP)的能力。然而,如今该平台提供了各种用于生成文本、图像、音频和视频的机器学习工具。

核心资源与工具

目前,Hugging Face平台托管了超过25万个开源模型、5万个数据集和100万个开源演示应用,并且这个列表还在持续增长。

科学家和开发者使用Hugging Face来构建、训练和部署他们的AI模型。他们可以访问平台的开源Transformer库,该库拥有超过2.5万个预训练模型,支持PyTorch、TensorFlow和Google JAX。

以下是这些框架的简要说明:

  • PyTorch:一个深度学习库。
  • TensorFlow:一个机器学习平台。
  • Google JAX:一个机器学习框架。

该库中的模型执行多种任务,例如文本生成、问答、摘要、自动语音识别和图像分割等。用户可以通过名称筛选这些模型以找到现有模型,也可以将自己的模型分享到库中。

开发者还可以在“Spaces”选项卡上托管生成式AI应用的演示,允许用户进行交互和验证。

企业如何受益

上一节我们介绍了平台的核心资源,本节中我们来看看企业如何从中受益。

Hugging Face为企业提供“企业中心”,企业可以从中访问预训练模型和数据集。这使得企业能够利用现有基础设施,而不是从头开始构建模型。这不仅减少了他们的碳足迹、扩展所需的时间和成本,还允许企业使用专有数据和相关用例来训练模型。

此外,Hugging Face帮助企业:

  • A:添加或移除功能以提高模型效率。
  • B:评估其生成式AI模型以过滤有偏见的数据。
  • C:创建具有文本、图像、音频和视频生成能力的多模态应用。

超过5万家大大小小的公司都在积极使用Hugging Face。例如:

  • 生成式AI解决方案提供商Writer在Hugging Face上托管其PALM大语言模型。
  • Intel已正式加入Hugging Face的硬件合作伙伴计划,并与之合作构建先进的机器学习硬件和端到端机器学习工作流。
  • 大学和非营利组织也是Hugging Face社区的一部分。

在其他服务中,Hugging Face还提供专家加速计划来指导非开发人员使用机器学习模型。HuggingChat是首个开源的ChatGPT替代品。

安全与合作伙伴关系

为了保护用户,Hugging Face遵循服务组织控制类型2(SOC 2)法规。这意味着确保用户数据的安全性、可用性、处理过程、完整性、机密性和隐私性。

Hugging Face将协作努力更进一步,与Watson X.ai(IBM为AI构建者打造的下一代企业工作室)建立了独特的合作伙伴关系。

Watson X.ai在其工作室中提供精选的Hugging Face模型,以帮助其构建者社区训练、测试和部署各种类型的机器学习和生成式AI应用。这样,该工作室就利用了Hugging Face提供的数据多样性、社区力量和开源库。

另一方面,Hugging Face创建了IBM大语言模型的开源版本,并将其提供在自己的平台上。双方都相信开源技术,并押注社区在AI领域创造价值。

由于专有AI模型可能很快过时,Hugging Face可能在AI领域的“五大”(即Google、OpenAI、Meta、IBM和Microsoft)中占据优势。这是因为它支持并得到了持续创新的开源AI社区的支持。

总结

本节课中,我们一起学习了关于Hugging Face平台的知识。这个AI平台展示了开源AI社区的协作力量。它为企业在降低成本、缩短时间框架、减少碳足迹的情况下构建定制的专有模型创造了空间。组织、大学和非营利机构则利用平台的工具和服务从自然语言处理中受益。简而言之,您不必是一家大公司也能从生成式AI中获益。

生成式AI基础:5.2:专家观点:通过Hugging Face促进创新 🚀

在本节课中,我们将聆听专家们分享Hugging Face如何加速生成式AI和大语言模型的开发、部署与应用。我们将了解其社区驱动模式、核心资源以及为个人和组织带来的具体价值。


Hugging Face在生成式AI和大语言模型的开发、部署与应用中扮演了至关重要的角色。其核心在于采用了社区驱动的方法。

他们提供了一个框架,让每个人都能访问预训练大语言模型的仓库。用户无需投入大量时间和计算资源,就能使用这些模型,并针对自己的数据集进行微调,以适配特定的应用场景。

以下是Hugging Face提供的关键资源:

  • 教育与学习材料:为社区提供了大量可供利用和使用的学习资源。
  • 多样化部署选项:为这些大语言模型提供了多种部署方案,不仅支持开发,也支持部署,通过与知名云平台和API的集成来实现。

上一节我们了解了Hugging Face的基础资源,本节中我们来看看其平台如何具体加速创新。

Hugging Face通过提供一个可共享、可部署的先进AI模型的可访问平台,显著加速了生成式AI的发展。其开源库 transformers 简化了复杂模型的使用,让开发者能够轻松地将先进的AI能力集成到自己的应用中。

Hugging Face还提供了诸如 Model Hub(模型中心) 这样的工具。在这里,我们可以使用预训练模型和数据集,这极大地促进了协作与创新。

使用Hugging Face的最大优势在于其社区属性。Hugging Face为包括面部识别、物体检测在内的多种任务创建了众多后端模型。这些预训练模型的可用性直接影响了后端模型的效用。生成式AI模型将依赖于这些代码片段和预训练模型的信息,因为像GPT这样的模型自身并不完全具备执行所有任务的能力。


了解了平台的优势后,我们自然会问:个人和组织如何通过加入这个社区获益?

个人和组织通过加入Hugging Face社区,能够获取丰富的资源和专业知识。社区的协作环境促进了知识共享,使用户能够相互学习,并紧跟AI领域的最新进展。

此外,该平台用户友好的界面和全面的文档,使得无论是学习者还是专家都能更轻松地实验和部署新模型,最终加速项目进程并减少开发时间。

IBM也与Hugging Face建立了合作伙伴关系。我们相信社区支持和协作的力量,Hugging Face作为为社区提供这一平台的领导者之一,让每个人都能使用和利用这项技术,这非常了不起。

Hugging Face拥有一个非常活跃的社区支持。无论遇到什么问题,社区中的成员都可能提供多种解决方案。当然,知识共享总是能让学习变得更高效、更有成果。是的,生成式AI在数据科学应用领域正获得极大的关注和益处。


本节课中,我们一起学习了Hugging Face如何通过其社区驱动模式、transformers 库、Model Hub 等核心工具,以及强大的协作生态,降低了生成式AI的应用门槛,加速了创新进程。无论是个人开发者还是大型企业,都能从中获取资源、学习知识并推动项目发展。

043:课程介绍与影响概述 🎯

在本节课中,我们将要学习生成式AI带来的广泛影响、相关考量以及伦理问题。基础模型正在不可逆转地改变我们构建和分享信息的方式,这正影响着我们的经济和社会发展。

生成式AI的核心影响与关键问题 🤔

上一节我们介绍了课程的整体目标,本节中我们来看看生成式AI带来的具体影响和随之而来的核心问题。

基础模型对社会和经济的影响是深远的。与此同时,我们必须正视一系列关键问题:

以下是几个必须考虑的核心问题:

  • 这些模型是否在未经许可的情况下使用了受版权保护的数据进行训练?
  • 如果发生侵权行为,谁应该负责?
  • 为了保护用户数据并安全地享受生成式AI的能力,采取了哪些安全措施?

为了解决这些问题,实施增强透明度、安全性等方面的控制措施至关重要。

负责任地使用生成式AI 🤝

理解了潜在问题后,我们来看看不同角色应如何负责任地使用这项技术。

组织必须负责任且诚实地使用生成式AI模型。用户在使用生成式AI工具和应用程序时,也必须做出安全的选择。

课程适合人群与学习目标 🎓

本课程面向所有初学者,无论您是专业人士、爱好者、从业者还是学生。如果您对快速发展的生成式AI领域有真正的兴趣,那么这门课程就适合您。这是一门面向所有人的课程,无论您的背景或经验如何。

在本课程结束时,您将能够:

  • 描述生成式AI的局限性及相关关切。
  • 识别与生成式AI相关的伦理问题、关切和滥用行为。
  • 举例说明负责任使用生成式AI的考量因素。
  • 讨论生成式AI对经济和社会的影响。

课程结构与内容模块 📚

本课程是一个由三个模块组成的精炼课程。预计您需要花费一到两小时来完成每个模块。

模块1中,您将探索与生成式AI相关的各种局限性和关切,例如训练数据偏见、缺乏准确性、可解释性。您将识别伦理考量,如数据隐私版权侵权幻觉,并了解与深度伪造相关的风险。

模块2中,您将了解组织如何通过实施透明度、问责制、隐私和安全护栏等措施来负责任地使用生成式AI。您还将全面审视生成式AI对我们经济增长和社会福祉的影响。

模块3将邀请您参与一个最终项目,并提供一个计分测验来检验您对课程概念的理解。您还可以访问课程术语表,并获得关于后续学习步骤的指导。

学习方法与资源 💡

本课程融合了概念视频和辅助阅读材料。观看所有视频以充分掌握学习材料的潜力。您将通过动手实验来理解生成式AI模型的局限性,并在模块3中参与最终项目。

每节课末尾都有练习测验,帮助您巩固学习。课程结束时,您还需要完成一个计分测验。课程还提供讨论区,供您与课程工作人员联系并与同伴交流。

最有趣的是,通过专家观点视频,您将听到经验丰富的从业者谈论关于生成式AI伦理考量和局限性的现实情况。

正如阿尔伯特·爱因斯坦所说:“一旦我们接受了自己的极限,我们就能超越它们。”让我们开始吧。


本节课中我们一起学习了生成式AI基础课程的开篇介绍,涵盖了生成式AI的广泛影响、引发的关键伦理与安全问题、课程的目标受众与学习目标,以及整个课程的结构、内容和学习方法。我们认识到,在拥抱这项强大技术的同时,必须对其局限性保持清醒,并以负责任的态度加以运用。

044:生成式AI的局限性 🧠

在本节课中,我们将要学习生成式人工智能的主要局限性。了解这些限制对于评估其适用性、规避潜在风险以及负责任地使用该技术至关重要。

观看本节内容后,你将能够描述生成式AI在训练数据方面的局限性,并识别其其他重要的限制。

概述:生成式AI的广泛应用与固有局限

生成式AI能够生成新颖、呈现良好且令人信服的内容,这使其在商业、社会领域以及各行各业中得到广泛应用。然而,在将其视为完全可用的商业工具之前,必须正视生成式AI显著的局限性。这些局限性可能成为企业开发AI的潜在障碍,也是组织和个人使用生成式AI时的约束条件。

接下来,让我们探讨生成式AI的几个主要局限性。

核心局限一:对训练数据的依赖 📊

生成式AI最根本的局限性与其训练数据密切相关。生成式AI模型本身并非信息的存储库,它们只是努力根据所训练的数据来生成和复制知识。训练数据的局限性直接影响模型输出的质量。

以下是训练数据相关的几个具体问题:

  • 数据范围有限导致输出受限:如果图像生成模型的训练数据集范围有限,生成的图像也会在范围上受限。例如,当你要求模型生成一张猫的图片时,它可能只会生成一只外观普通的猫,而无法体现特定品种或个体猫的独特特征。
    • 公式/代码描述生成的图像质量 ≈ 训练数据集的多样性与质量
  • 数据截止日期导致信息过时:许多生成式AI模型基于具有截止日期的数据进行训练,这会导致其提供过时或错误的信息。模型因此无法回答关于当前信息和事件的问题。例如,GPT-3.5的训练数据截止到2022年1月。当要求它生成基于2022年1月之后发生的事实或事件的信息时,模型要么不提供回应,要么生成不准确或虚构的回应。在这种情况下,AI模型应明确说明其回答所依据的数据截止日期。
  • 缺乏实时更新与验证能力:此外,许多生成式AI模型并未连接到互联网,无法更新或验证它们生成的信息。
  • 高质量数据获取困难:由于训练数据是生成式AI模型知识的主要来源,因此对高质量训练数据有很高要求。训练数据需要信息丰富、及时更新、准确且无偏见。然而,训练所需的大规模数据集并非总能轻易获得,或者成本非常高昂。例如,对于罕见疾病等特定领域,由于病例稀缺、患者隐私考虑以及需要专业医学知识等原因,获取足够数据可能既困难又昂贵。

上一节我们介绍了训练数据带来的根本性限制,本节中我们来看看生成式AI在理解和创造力方面的边界。

核心局限二:语境理解与创造力的边界 🎨

生成式AI擅长分析数据以识别模式和趋势,并利用它们生成新内容。然而,当面对超出其训练参数范围的新数据、信息或解决方案时,它在理解语境方面存在局限。

例如,考虑一个经过训练用于辅助法律文件审查的生成式AI模型。它接受了大量法律文件的训练,擅长识别常见的法律条款并提供相关建议。但是,如果你提交一个新颖、复杂的法律案件,该模型可能难以提供有深度的分析,因为它缺乏处理此类独特且前所未有的法律场景的语境和训练。

生成式AI无法完全取代人类的创造力或批判性思维。它的创造力仅限于其训练数据的边界之内,不具备发明一个全新想法的能力,无法“跳出框框”思考。

一个需要考虑的例子是:它可以就一个想法或辩论生成信息,但无法评估哪一方更有深度或更可信。它也无法识别幽默或讽刺等抽象概念。所有这些都需要人类的参与。

从用户的角度来看,生成式AI还有一个显著的局限性。

核心局限三:缺乏可解释性与透明度 ❓

生成式AI模型通常被认为是复杂且不透明的。用户可能难以理解模型是如何生成内容、做出预测或得出特定决策的。这种缺乏透明度和可预测性的情况,引发了人们对AI生成输出的问责制和可靠性的担忧。

总结

本节课中,我们一起学习了可能制约生成式AI广泛采用的几个主要局限性:

  1. 训练数据依赖:生成式AI的根本局限性与训练数据相关。所需的大规模数据集可能不易获得、可能过时或不准确。训练数据的局限性直接影响模型的输出。
  2. 理解与创造力受限:生成式AI的理解和创造力仅限于其训练数据,无法完全取代人类的创造力或批判性思维。
  3. 缺乏可解释性:生成式AI缺乏可解释性和透明度。这种不透明和不可预测性引发了对其问责制和可靠性的担忧。

认识到这些局限性,有助于我们在利用生成式AI强大能力的同时,保持审慎和批判性的态度。

045:生成式AI的问题与关切 🧐

在本节课中,我们将探讨生成式人工智能在广泛应用过程中所引发的一系列常见问题与伦理关切。理解这些问题对于负责任地开发和使用AI技术至关重要。

概述

生成式AI凭借其自然语言理解、内容创作、图像合成和问题解决等突破性能力,正被各行各业大规模采用。高德纳公司预测,到2025年,生成式AI将占所有产出数据的10%。然而,这种能力的快速发展和随之而来的广泛采用,也催生了一些关键的问题和伦理关切。

主要关切点

以下是围绕生成式AI最普遍的几类关切。

1. 不准确性与偏见

上一节我们提到了生成式AI的广泛应用,本节中我们首先来看看其输出内容的可靠性问题。生成式AI模型可能产生事实不准确或带有偏见的内容。

不准确性示例:假设一个生成式模型在截至2021年的大型文章数据集上训练。当被要求生成一篇关于2023年太阳系内发现新行星的文章时,该模型可能会根据其对天文学和科学发现的理解,生成一个基于虚构场景且事实不准确的“文章”。这里的核心局限在于,生成式AI缺乏验证其生成信息准确性或真实性的能力。如果训练数据本身包含错误,模型的输出就会反映这些错误。此外,大多数生成式AI模型是在海量数据上预训练的,但无法动态跟进最新事实或新信息

偏见问题:除了不准确性,训练数据也可能存在偏见。当训练数据采样不佳、未能准确反映真实世界时,就可能产生偏见。生成式AI模型中常见的偏见模式包括负面或过时的刻板印象与歧视。例如,一个图像生成AI工具在被要求生成“CEO”的图像时,可能总是生成中年白人男性的图像。已观察到的偏见还包括与性别、种族、宗教或其他人口统计特征相关的刻板印象、政治偏见、文化和语言偏见,以及历史信仰或实践。

为了减少这些偏见,确保训练数据的多样性和代表性至关重要。开发者和用户必须通过谨慎的数据选择、微调以及评估和改进流程来解决这个问题。

2. 数据隐私与安全

接下来,让我们聚焦于与生成式AI相关的数据隐私与安全方面。

你输入到开源AI模型中的任何数据或查询,都可能被用作训练数据。这些数据可能包含敏感信息,例如个人身份信息或组织的机密信息。因此,生成式AI模型可能会在其输出中意外地或有意地泄露用户的个人数据或组织的机密数据,并将其公之于众。

3. 版权侵权与模糊性

数据隐私和安全问题可以延伸到版权和法律风险领域。

版权侵权:生成式AI模型可能会在其输出中泄露创作者或组织的原始数据和内容,这些内容可能被其他用户和组织使用或利用。据此,一个模型可能侵犯用户或其他公司的版权和知识产权。此外,生成式AI模型生成的内容可能包含受版权保护的要素,如徽标、商标或受版权保护的图像。未经许可将此类内容用于商业目的可能导致法律诉讼。

版权模糊性:另一个相关关切是版权归属的模糊性,即AI生成内容的所有权问题。这决定了谁拥有通过AI模型生成的内容和创意作品的著作权。有几个主要问题需要考虑:

  • 所有权归属:例如,考虑一幅基于或类似于达芬奇名画《蒙娜丽莎》的AI生成图像。那么,谁拥有这种生成创意作品的所有权?是原始图像的艺术家、拥有并训练了生成该图像的AI模型的组织,还是提示模型生成该图像的用户?
  • 伦理公平性:生成式AI创作与他人作品高度相似的艺术或内容,是否公平且符合伦理?
  • 版权保护资格:AI创作的内容是否有资格获得版权保护?一种观点认为没有,因为它不是人类创造力的产物。然而,也有人认为有,因为它是算法、编程与人类输入共同作用的结果。

目前,确定AI生成内容的所有权和许可仍然是一个悬而未决的话题,仅有少数法律强制规定的法规。

责任与行动建议

鉴于上述问题,AI开发者应率先制定自己的伦理生成式AI政策,以保护自身和客户。例如,他们必须确保训练数据具有代表性和无偏见,并且在生成式AI模型的训练、开发和部署过程中,尊重用户个人信息的机密性。

作为用户,要确保自己合乎伦理地使用生成式AI具有挑战性,但使用生成式AI工具时可以考虑以下几点:

  • 不要输入机密、敏感或构成知识产权侵权的信息。
  • 分析输出内容是否存在事实错误、偏见或不恰当的陈述。

总结

本节课中,我们一起学习了生成式AI的一些常见伦理关切和问题。这些关切包括不准确性与偏见、数据隐私与安全、版权侵权与版权模糊性。导致这些问题的一些原因包括:训练数据的局限性或不准确性、使用敏感/机密/个人身份信息训练模型,以及缺乏关于AI生成内容开发或使用的法律强制规定。

理解这些问题有助于我们更清醒、更负责任地面对和运用强大的生成式AI技术。

生成式AI基础:04:文本与图像生成大语言模型的幻觉现象 🧠

在本节课中,我们将要学习大语言模型在生成文本和图像时出现的“幻觉”现象。我们将解释什么是幻觉、它为何会发生、可能带来的负面影响,以及如何通过多种技术来降低幻觉风险。


什么是幻觉?

幻觉是指生成式AI模型产生缺乏事实依据的内容。有时,大语言模型会生成事实不准确或缺乏连贯性的文本。例如,一个语言模型可能生成包含捏造信息的新闻文章,或创作出用词毫无意义的诗歌。在图像生成中,模型可能创造出包含不存在物体或场景的图片,例如,一只长着翅膀的猫,或漂浮在空中的山脉。

上一节我们介绍了幻觉的基本概念,本节中我们来看看导致幻觉的主要原因。


幻觉产生的原因

大语言模型在包含错误和不一致信息的海量文本和图像数据集上进行训练。由于大语言模型的训练目标是最大化生成内容的似然概率,它们更倾向于生成与训练数据相似的内容,即使这些数据本身并不准确或不真实。此外,大语言模型是参数复杂的系统,很难保证它们总能生成准确、真实的内容。

这些参数的微小变化,也可能因为过拟合或对内容正确性的不确定性而导致幻觉。让我们详细了解一下:

  • 过拟合:当一个模型过于精通从训练数据中学习,却难以将知识应用于新数据时,就会发生过拟合。这可能导致模型生成训练数据集中不存在的新内容。
  • 优化目标:生成式AI模型的训练目标通常是优化其生成的内容。这可能导致模型产生在统计上看似合理、但事实上并不正确的内容。

理解了幻觉的成因后,接下来我们探讨它可能带来的问题。


幻觉的负面影响

幻觉在文本和图像生成中可能产生严重的负面影响。

以下是其主要危害:

  • 传播错误信息:幻觉可用于制造有害和冒犯性内容。
  • 损害信任:幻觉使得人们难以信任生成式AI模型的输出,从而限制了其在现实应用中的有效性。
  • 危害个人与社会:幻觉可能导致假新闻文章或图像的创建,这些内容可用于欺凌、骚扰他人或传播宣传,从而损害个人形象或引发社会混乱。

既然幻觉有诸多危害,那么有哪些方法可以应对呢?


降低幻觉风险的技术

目前没有单一方案能完全解决文本和图像生成中的幻觉问题。然而,通过结合不同方法,可以显著降低幻觉风险,并提高生成式AI模型的可靠性。

以下是几种主要技术:

  • 使用精选数据集训练:例如,艾伦人工智能研究所开发的常识开放可信答案数据集,用于训练模型进行常识推理,防止生成事实不准确的陈述。
  • 开发新的训练方法:例如,谷歌AI的研究人员开创了一种名为对比学习的新训练方法,可用于指导大语言模型生成更准确、连贯的输出。
  • 采用后处理技术:例如,Facebook AI研究团队引入了一种名为Fact-Check Net的后处理方法,用于检测生成文本中的不准确之处。
  • 精心设计提示词:提示词工程是构建有效提示词的过程,这些提示词作为生成式AI模型的输入。精确构建提示词可以降低模型产生幻觉输出的可能性。
  • 调控输出多样性温度采样是一种用于调控生成式AI模型输出多样性的方法。公式表示为 P(w|context) ∝ exp(logit(w)/T),其中 T 是温度参数。
    • 当温度 T 调高时,模型更可能产生多样化的输出,但这也增加了生成幻觉信息的风险。
    • 反之,降低温度 T 会减少幻觉的可能性,但会限制输出的多样性。
  • 组合多个模型的输出:集成生成是一种技术,它将多个生成式AI模型的输出组合起来产生最终结果。这有助于降低幻觉风险,因为最终输出包含所有模型幻觉的可能性较低。

总结

本节课中,我们一起学习了大语言模型在文本和图像生成中的幻觉现象。幻觉发生在生成式AI模型产生缺乏依据的内容时,可能导致生成事实错误或不连贯的文本和图像。这些幻觉具有重大影响,包括传播错误信息以及对个人和社会造成潜在伤害。为了减轻这些负面影响,业界采用了多种技术,包括使用精选数据集训练、开发新的训练方法、应用后处理技术、进行提示词工程以及调控输出多样性。这些技术的目标是提高生成式AI模型的可靠性,降低幻觉风险,从而增强其在现实世界应用中的实用价值。

047:代码生成大语言模型的幻觉现象 🧠

在本节课中,我们将要学习代码生成大语言模型(LLM)中的一个关键风险——幻觉现象。我们将了解其定义、产生原因、对开发者和用户的潜在影响,以及如何采取措施来预防其发生。

概述

代码生成大语言模型因其在速度、自动化、调试等方面的优势,越来越受到开发者的欢迎。然而,我们也必须关注与之相关的潜在挑战和风险。本节视频将重点探讨一个关键风险:代码生成大语言模型的幻觉现象。

什么是代码生成幻觉?

在代码生成LLM中,幻觉指的是模型生成的代码存在错误、无意义或与给定提示不相关的现象。

上一节我们介绍了幻觉的定义,本节中我们来看看它为何会发生。

幻觉产生的原因

以下是导致代码生成幻觉的三个主要原因:

1. 自然语言的模糊性
当用于创建代码的提示语有时含糊不清时,LLM可能会被模糊的语言所迷惑,从而产生错误的代码。

例如,通过ChatGPT(一个基于GPT的工具)生成简单的Python代码。当你输入文本提示“生成一个Python函数来检查数字是否为偶数”时,ChatGPT会生成相应的Python代码。在Python编辑器中测试这段代码,你会发现对于整数输入,代码执行正确。但如果你输入数字12.2,理想情况下LLM应该生成一个异常,然而它却将12.2归类为奇数。这是因为LLM幻觉地认为输入只会是整数。

# 幻觉示例:函数错误地认为输入总是整数
def is_even(number):
    return number % 2 == 0

print(is_even(12.2))  # 输出:False (错误地将12.2判断为奇数)

要生成正确的代码,必须提供清晰的提示,指定编程语言并提供其他相关的要求和约束。

2. 长程依赖问题
LLM可以处理短期上下文,但在处理长程依赖时可能遇到困难。因此,在长时间的代码生成活动中,模型有可能丢失重要信息,从而导致幻觉。

例如,任务是“编写一个Python程序来计算列表中数字的总和”。对于简短的列表,生成的代码是正确的。然而,如果用一个非常长的数字列表调用该函数,LLM可能无法跟踪总和,导致函数返回错误的结果,从而引发代码幻觉。

3. 编程语言的复杂性
编程语言具有复杂的语法和语义,LLM可能会误读某些语言结构,从而产生幻觉代码。

例如,假设任务是生成一个可以打开文件并读取内容的函数。生成的代码可能如下所示:

# 幻觉示例:错误地以写入模式打开文件
def read_file(filename):
    with open(filename, 'w') as file:  # 错误:应为 'r' 读取模式
        content = file.read()
    return content

这个函数乍看之下正确,但无法正常工作。因为LLM没有正确理解文件处理。在这个例子中,模型错误地生成了以写入模式‘w’打开文件的代码,而不是读取模式‘r’,这导致返回一个空字符串,因为文件是为写入而打开的,然后立即读取,导致没有内容被读取。

这是一个假设性示例,展示了代码幻觉如何生成产生错误输出的代码。LLM生成的代码可能看起来能运行,但存在诸如不现实的转换方法、缺乏错误处理和上下文理解有限等问题。

了解了幻觉产生的原因后,接下来我们看看它对开发者有何影响。

幻觉对开发者的影响

当代码生成LLM开始产生幻觉时,会带来多方面的影响:

1. 生成错误且不安全的代码
幻觉可能导致生成不正确和不安全的代码。这会带来风险,因为它可能在软件中引入错误或漏洞。

例如,任务是“编写一个安全的Python程序来打开文件并写入”。幻觉产生的不正确且不安全的输出可能如下:生成的代码暗示打开和写入文件是一个安全的操作,这本身就是一种幻觉。这段代码可能导致不正确和不安全的文件操作,因为它没有遵循处理错误的最佳实践,可能导致数据丢失或安全漏洞。

2. 引发法律与伦理问题
如果幻觉代码导致负面结果,可能会引发关于开发者和AI模型创建者责任的法律和伦理问题。

设想一个场景:AI模型为医疗设备幻觉生成了代码。结果是设备误解了患者数据,导致治疗错误。可能的法律和伦理问题是:谁对由幻觉代码引起的医疗错误负责?是部署AI模型的开发者,还是AI模型的创建者本身?

3. 延续训练数据中的偏见
受带有偏见的训练数据影响的幻觉,另一个可能后果是生成的代码可能延续现有的偏见,导致软件开发中的歧视性做法。

想象一下:一个AI模型为简历筛选工具幻觉生成了代码。结果是该工具不成比例地拒绝了女性候选人的简历。后果是生成的代码延续了训练数据中的性别偏见,通过不公平地使女性求职者处于不利地位,导致了软件开发中的歧视性做法。

既然我们了解了幻觉的影响,那么如何应对这些风险呢?

如何应对与预防幻觉风险

我们可以通过多种措施来应对这些风险:

1. 提供清晰的文档
开发者可以向用户提供关于其模型局限性的清晰文档,包括幻觉风险,使用户能够做出明智的决策。

2. 优化提示技巧
应努力使用提示技巧,帮助LLM生成与给定任务相关的代码。

3. 减少偏见与遵循伦理
最小化训练数据中的偏见,并确保生成的代码符合伦理原则至关重要。

4. 建立强大的错误处理机制
LLM应具备强大的错误处理机制,以检测和标记输出中潜在的幻觉。

5. 加强开发者间的协作
最后,LLM开发者和软件开发者之间的紧密合作有助于在现实应用中识别和纠正幻觉。

总结

本节课中我们一起学习了代码生成LLM有时会产生幻觉,即生成与预期输出不符的事实错误响应。我们了解到,这些幻觉的原因可能是自然语言的模糊性、长程依赖问题和复杂的语义。最后,我们学习了如何通过提供文档、使用无偏见的训练数据、建立强大的错误处理系统以及加强LLM与软件开发者之间的合作来最小化这些幻觉的发生。

048:AI肖像与深度伪造 🎨

在本节课中,我们将学习生成式AI在艺术领域的一个具体应用:AI肖像。我们将了解AI肖像的创建技术,并探讨其衍生出的“深度伪造”技术及其潜在的滥用风险。

概述

生成式AI已在包括艺术在内的多个领域取得了显著进展。其中一个令人兴奋的进展是,生成式AI模型能够利用深度学习算法生成逼真的个人肖像。这些模型可以通过多种方式创建、增强或操控肖像,例如生成不存在的人的完整肖像、在照片中人为地老化或年轻化一个人的面容,以及应用著名画家的艺术风格来创造独特的效果。

AI肖像的生成原理

AI肖像由机器学习算法生成,这些算法使用经过艺术化策划的多样化图像数据集。算法通过分析这些图像来学习并复制人类的艺术技巧,识别面部特征、颜色、纹理和笔触等关键元素。掌握了这些知识后,生成式AI模型便能创造出独特且逼真的肖像,允许用户定制生成图像的情绪、风格和构图,以匹配他们的偏好。

以下是创建逼真AI肖像的几种关键技术。

生成对抗网络

生成对抗网络 由两个组件构成:一个生成器负责创建虚假图像,一个判别器则试图区分真实图像和人工生成的图像。在整个训练过程中,判别器会提升其检测伪造照片的能力,而生成器则会精进其制作逼真肖像的技巧。因此,生成器和判别器共同作用,产生的AI肖像看起来与传统手绘或拍摄的肖像难以区分。

核心公式/概念

  • 生成器 (Generator): 学习数据分布,生成新数据。
  • 判别器 (Discriminator): 判断输入数据是来自真实数据集还是生成器。

风格迁移

风格迁移 是另一种常用于制作AI肖像的技术。该方法涉及将一幅图像的艺术风格转移到另一幅图像上,从而创造出独特且视觉上引人入胜的肖像。艺术家可以利用这项技术尝试从印象派到立体主义等多种风格,并将其应用于肖像创作,实现古典艺术与现代技术的融合。

数据驱动策略

数据驱动策略对于创建AI肖像也很有帮助。通过分析大量的人脸数据集,生成模型能够学习到广泛的面部特征、表情和风格。这些数据集在指导模型创作肖像方面起着至关重要的作用,使其能够捕捉人类外貌和情感的多样性,从而超越传统艺术方法的限制。

AI肖像的潜力与伦理挑战

AI肖像提供了令人兴奋的可能性,例如通过纪念个人及其故事来保护我们的文化遗产,重新连接我们的历史,以向人类遗产的众多方面致敬。

然而,它也引发了伦理问题,包括滥用和欺骗。

深度伪造及其滥用风险

生成式AI可能被滥用来创建“深度伪造”,这可能带来严重后果。深度伪造是指使用生成式AI模型 manipulated 的视频、图像或音频记录,使其看起来像是真实的。深度伪造可以非常具有说服力,并可能被用于各种不良目的。

以下是深度伪造可能被滥用的几种方式:

  1. 制造虚假新闻和宣传,传播虚假信息。
  2. 骚扰或勒索他人。
  3. 实施欺诈。 深度伪造可用于创建伪造的身份文件或照片,用于欺诈目的,例如开设银行账户、获取贷款或进入安全区域。这可能导致金融欺诈和其他安全漏洞。
  4. 网络犯罪。 网络犯罪分子可以使用深度伪造视频冒充可信的个人(如组织CEO),并创建令人信服的信息来诱骗员工泄露敏感信息、转移资金或下载恶意文件。

AI肖像的其他挑战

除了深度伪造,AI辅助肖像还存在其他挑战:

  • 缺乏创作控制:由于模型产生的结果基于数据集,因此很难创造出明显偏离机器学习算法所建立模式的作品。因此,在某些情况下,输出结果可能与艺术家的创作愿景不符。
  • 捕捉灵魂本质的困难:虽然生成式AI模型可以产生视觉上令人惊叹的图像,但捕捉拍摄对象的灵魂本质仍然是一项持续的努力。
  • 偏见问题:由于模型是通过数据集训练的,确保AI生成的肖像能够代表多样化的个体,并避免在性别、种族和其他因素上延续偏见,是一个至关重要的改进领域。

总结

本节课中,我们一起学习了AI肖像的创建与应用。我们了解到,AI肖像是使用生成式AI模型创建的,这些模型在大量精心策划的图像数据集上进行了训练。这些模型可以从零开始生成逼真的个人肖像,也可以通过增强或操控现有照片来实现。

AI肖像具有保护文化遗产和创造新艺术可能性的潜力。然而,其衍生的深度伪造技术也引发了伦理担忧,例如潜在的滥用和欺骗风险。因此,制定伦理准则和开发检测深度伪造的新技术至关重要。

049:通过RAG提升大语言模型准确性 🎯

在本节课中,我们将学习一种名为“检索增强生成”的框架,它能帮助大语言模型提供更准确、更及时的回答。

大语言模型无处不在。它们在某些方面表现惊人,但在其他方面也会出现有趣的错误。我是Marina Donelevsky,IBM研究院的高级研究科学家。我想介绍一个框架,它能让大语言模型变得更准确、更与时俱进,这个框架就是检索增强生成,简称RAG。

理解“生成”部分 🤖

首先,让我们谈谈“生成”部分。这里的“生成”指的是大语言模型根据用户的查询生成文本。用户的查询通常被称为“提示词”。

这些模型有时会表现出一些不理想的行为。我想用一个故事来说明这一点。我的孩子们最近问我:“太阳系中哪颗行星的卫星最多?”我的回答是:“哦,你们问这个问题真是太好了,我像你们这么大的时候可喜欢太空了。当然,那是大约30年前了,但我知道答案。我读过一篇文章,文章说是木星,有88颗卫星。这就是答案。”

实际上,我的回答有几个问题。首先,我没有提供任何来源来支持我的说法。尽管我自信地说我读过文章、知道答案,但我没有引用来源,只是凭记忆给出了答案。其次,我其实很久没有关注这方面的信息了,所以我的答案已经过时了。

这里我们遇到了两个问题:一是没有来源,二是信息过时。事实上,这两个问题在与大语言模型交互时也经常被视为棘手的问题。

大语言模型的挑战 ⚠️

那么,如果我当时停顿一下,先去NASA这样的权威来源查找答案,情况会怎样呢?那样我就能说:“答案是土星,有146颗卫星。实际上,这个数字一直在变化,因为科学家们不断发现新的卫星。”这样,我就把我的答案建立在更可信的基础上,没有“幻觉”或编造答案。顺便说一句,我也没有泄露关于我痴迷太空是多久以前这样的个人信息。

引入“检索增强”部分 🔍

那么,这和大语言模型有什么关系呢?一个大语言模型会如何回答这个问题?假设有一个用户问了关于卫星数量的问题。一个大语言模型可能会自信地说:“根据我训练时学到的参数知识,答案是木星。”这个答案是错误的,但模型自己并不知道,它对自己的回答非常自信。

现在,当我们加入“检索增强”部分时,这意味着什么?这意味着,模型不再仅仅依赖其自身知道的知识,而是增加了一个内容存储库。这个存储库可以是开放的,比如互联网;也可以是封闭的,比如某个文档集、政策集等。关键在于,现在语言模型会先去与内容存储库“对话”,请求检索与用户查询相关的信息。然后,基于这个检索增强的答案,我们知道答案不再是木星,而是土星。

RAG框架的工作流程 ⚙️

这具体是如何运作的呢?
首先,用户向大语言模型提出他们的问题。
在原始的纯生成模型中,生成模型会说:“好的,我知道答案,这是我的回答。”
但在RAG框架中,生成模型实际上收到了一条指令:“不,先别急。先去检索相关内容。”模型将检索到的内容与用户的问题结合起来,然后才生成答案。因此,现在的提示词包含三个部分:

  1. 指令:要求关注检索到的内容。
  2. 用户的问题。
  3. 结合以上两者,给出回应。

实际上,现在你还可以为你给出的答案提供证据。

RAG如何解决挑战 ✅

现在,希望你能看到RAG如何帮助解决我之前提到的两个大语言模型挑战。
首先是信息过时问题。现在,当有新信息出现时,你不需要重新训练整个模型。你只需要用新信息、更新信息来增强你的数据存储库。这样,下次用户再来问同样的问题时,我们就能准备好,直接检索最新的信息。
第二个是来源问题。现在,大语言模型被指示在给出回应前,要关注原始数据源。实际上,它现在能够提供证据。这使得它不太可能产生“幻觉”或泄露数据,因为它不太可能仅仅依赖训练中学到的信息。它还允许我们让模型具备一种非常积极的行为:知道何时说“我不知道”。如果用户的问题无法基于你的数据存储库可靠地回答,模型应该说“我不知道”,而不是编造一个看似可信但可能误导用户的答案。

潜在的负面影响与未来方向 🔮

不过,这也可能带来负面影响。如果检索器的性能不够好,无法为大语言模型提供最优质、最相关的背景信息,那么本可回答的用户查询可能就得不到答案。这正是为什么包括我们IBM在内的许多人,正在从两个方面努力解决这个问题:一方面改进检索器,为语言模型提供最高质量的背景数据;另一方面改进生成部分,使得语言模型在生成最终答案时,能为用户提供最丰富、最好的回应。

总结 📝

本节课中,我们一起学习了检索增强生成框架。我们了解到,纯生成的大语言模型可能存在信息过时和缺乏来源的问题。RAG框架通过引入一个外部内容存储库和检索步骤,让模型在回答前先查找相关信息,从而显著提升了回答的准确性和时效性,并能够提供证据支持。同时,我们也认识到,检索器的质量对于RAG的效果至关重要。通过结合更优的检索和生成技术,我们可以构建出更可靠、更强大的AI助手。

感谢你学习更多关于RAG的知识。

050:生成式AI的法律问题与影响 🧑⚖️

在本节课中,我们将要学习生成式AI技术所引发的一系列法律问题与潜在影响。我们将探讨相关的法律挑战、各国现有的监管措施,以及如何在创新与规范之间取得平衡。

观看本视频后,你将能够识别与生成式AI相关的法律问题,列举有助于打击AI欺诈的法律,并讨论AI监管可能的发展方向。

生成式AI带来的法律挑战

上一节我们介绍了生成式AI的能力,本节中我们来看看其引发的严峻法律问题。即使在其最佳状态下,生成式AI的能力也引发了一些严重的法律疑问。

例如,基础模型在训练时可能使用了违反数据隐私和版权法的内容。算法偏见可能违反平权行动立法。此外,由AI生成的文本、视频、音乐和图像的版权归属问题也悬而未决。

更令人不安的是,深度伪造技术的出现向我们表明,AI可用于操纵一个人的声音和外观,以生成虚假信息并实施身份欺诈。研究表明,AI驱动的欺诈已成为所有身份欺诈的首要原因。

生成式AI还存在被用于开发网络武器的额外风险。根据《福布斯》报道,网络安全工具检测到的勒索软件中,ChatGPT可以生成不同的算法以避免检测。

因此,必须对基础模型所能完成的许多任务进行法律监管,以防范身份欺诈、虚假信息、版权侵权、数据隐私侵犯、网络战争和歧视性行为。

全球监管现状与法律应对

这引出了一个关键问题:世界各国政府正在采取哪些措施来监管基础模型和生成式AI的使用?

以下是全球范围内一些重要的法律与监管举措:

  • 欧盟:世界上第一部AI立法是欧盟的《人工智能法案》,但尚未正式颁布为法律。然而,欧盟的《通用数据保护条例》(GDPR)赋予个人对其数据的更多控制权,可用于挑战任何未经授权的私人数据使用。
  • 加拿大:《人工智能与数据法案》有助于规范使用AI的公司。此外,加拿大《高级生成式AI系统负责任开发和管理自愿行为准则》明确了公司可以采取的措施。
  • 美国:在AI生成内容与现有作品相似时,美国判例法规定,如果AI程序同时满足以下两个条件,版权所有者可能能够证明其输出侵犯了版权:
    1. 接触过他们的作品。
    2. 创作了实质性相似的输出。
      然而,当一位美国公民试图为一件由AI程序自主创作的视觉艺术品申请版权时,美国版权局拒绝了他的申请,称“人类作者身份”是有效版权主张的重要组成部分。
  • 深度伪造的困境:深度伪造行为不道德,但并非总是违法。虽然可以利用网络跟踪法的条款,但追溯深度伪造的源头可能很困难。此外,受害者必须证明深度伪造的创作者意图造成伤害。因此,美国国防部正与其下属的国防高级研究计划局(DARPA)合作开发能够检测深度伪造视频的技术。
  • 英格兰和威尔士:没有直接管辖AI的立法。然而,《在线危害法案》寻求将分享深度伪造色情内容定为刑事犯罪。鼓励公民利用现有的诽谤、数据保护、隐私和骚扰相关法律来应对AI引发的犯罪。
  • 印度:电子和信息技术部负责监管AI。虽然没有专门针对深度伪造的立法,但恶意深度伪造的受害者可以利用现有法律条款提出投诉。根据《信息技术法案》第66E条,未经同意在媒体上捕获、发布或传输他人图像的行为将受到惩罚。《数字个人数据保护法》也保护可识别个人身份的敏感个人数据免遭未经授权的传播。

监管的挑战与未来展望

如果你想知道为什么政府没有采取更多措施来监管AI,那么有两个可能的答案。

首先,生成式AI领域发展极其迅速,难以快速、确定地量化和界定该技术如何被用于犯罪,以及确定谁应对犯罪行为负责。

其次,社会必须在生成式AI创新与生成式AI监管之间找到平衡。过多的监管会增加商业成本,并阻碍公民享受诸如职业技能提升、服务效率提高、产品定制化和创作便利等益处。

专家们预见,生成式AI或许能解决它自己制造的问题。以下是两个可以考虑的例子:

  1. 美国国防部高级研究计划局(DARPA)用深度伪造内容训练机器,使其能够检测并区分真实和伪造的内容。
  2. 在金融、银行和医疗保健行业广泛使用的区块链技术,可以与AI结合,以识别真实内容与伪造内容。

AI公司、社交媒体公司和科技巨头等组织应与政府机构和公民团体密切对话,为其国家制定深思熟虑且具有前瞻性的AI立法。

总结

本节课中我们一起学习了生成式AI的法律问题与影响。我们探讨了基础模型可能被用于实施身份欺诈、传播虚假信息、侵犯版权、违反数据隐私、发动网络战争以及加剧歧视性做法。由于这是一个快速发展的领域,目前直接管辖生成式AI使用的法律很少。政府和行业必须在生成式AI的创新与监管之间取得平衡。

051:生成式AI的问题与伦理关切

在本节课中,我们将聆听AI专家们关于生成式AI所引发的问题与伦理关切的见解。我们将探讨偏见、隐私、错误信息等核心挑战,并了解如何负责任地使用这项技术。

概述

生成式AI是一项强大的技术,但伴随其巨大潜力而来的是诸多伦理问题和潜在风险。专家们强调,我们必须密切关注这项技术的发展与应用。

核心伦理关切与问题

以下是专家们指出的与生成式AI相关的主要问题和伦理关切。

1. 偏见与公平性

上一节我们概述了生成式AI的伦理挑战,本节中我们首先来看看偏见与公平性问题。如果模型在带有偏见或片面的数据上训练,其生成的回应也可能会带有偏见。

核心概念偏见输出 = 模型(偏见训练数据)

专家分享了一个具体案例:当询问关于一位医生的问题时,ChatGPT的回应默认假设医生是男性且富有。这揭示了模型可能内嵌的社会偏见。用户可以通过精心设计提示词来尝试减少这种偏见。

2. 事实准确性与“幻觉”

生成式AI,尤其是大语言模型,生成的答案通常非常肯定、清晰且文笔流畅,这容易让人误以为它们总是正确的。然而,模型有时会完全虚构答案,甚至编造不存在的引用来源。

核心概念AI幻觉:模型生成看似合理但事实上错误或虚构的内容。

因此,在处理基于事实信息的任务时,例如验证药物副作用,使用者必须对AI提供的信息进行核实和验证。

3. 隐私与安全

将信息提供给生成式AI模型可能存在数据泄露的风险。如果向模型输入敏感信息,这些数据可能会被模型记忆并在后续回应中泄露,引发隐私和安全问题。

4. 错误信息与滥用

生成式AI是一把双刃剑。它让每个人都能轻松创建图像、视频、文本等内容,能力空前。然而,恶意行为者同样可以利用它来制造错误信息,伤害个人、公司或政府。我们必须保持警惕,因为现在伪造一张图片可能只需要几秒钟和一个合适的提示词,而不再需要专业的Photoshop技能。

5. 抄袭与原创性

使用AI辅助写作时,存在抄袭的潜在风险。专家建议可以采取两种做法:一是使用抄袭检测工具进行检查;二是在提示词中要求模型使用不同长度的句子,使文本听起来更自然、更像人类所写。

负责任地使用生成式AI

面对上述问题,我们应如何负责任地使用生成式AI呢?专家们给出了以下指导原则。

伦理使用指南

以下是关于如何符合伦理地使用生成式AI的一些建议。

  • 保持开放与诚实:如果使用大语言模型辅助写作,当被问及时,应该公开、诚实地说明。AI是帮助克服写作障碍的工具,而非替代原创思想。
  • 验证关键信息:对于事实性内容,务必进行交叉验证,尤其是用于重要决策时。
  • 审慎设计提示词:通过改进提示词,可以引导模型减少偏见、增加多样性。
  • 关注创造而非替代:关于工作被取代的担忧固然存在,但更应关注如何利用这些模型创造新的、更具创造性的工作岗位,以及如何让它们更有效地辅助人类工作。

总结

本节课中,我们一起学习了专家们对生成式AI伦理问题的深刻见解。我们探讨了偏见与公平性事实准确性隐私安全错误信息滥用以及抄袭风险等核心挑战。关键在于,我们必须以负责任的态度使用这项技术,保持警惕,对其输出进行验证,并推动建立相应的标准与监督机制,以确保生成式AI的安全与发展造福社会。

052:生成式AI的局限性与挑战 🧠

在本节课中,我们将聆听人工智能专家对生成式AI的局限性与挑战的见解。我们将探讨数据质量、计算成本、伦理问题以及模型幻觉等核心议题,并了解应对这些挑战的策略。

概述

生成式AI面临若干局限性与挑战,主要包括数据质量、计算成本和伦理关切。

数据质量与模型幻觉

从数据质量的角度看,生成式模型需要大量数据。如果输入的数据质量差,输出结果也会很差。目前,生成式AI最大的问题之一是“AI幻觉”。生成式AI的核心任务是针对提出的问题生成输出。然而,在某些情况下,由于它是一种合成材料创建软件,当要求它引用事实、数据或创建关于实际解决方案或事件的上下文时,它被发现容易产生虚假的、并未真正发生的输出,这种现象被称为“AI幻觉”。许多模型的响应和条款通常都附有免责声明,指出模型仍可能产生幻觉。

因此,在没有从其他来源获得确认的情况下,不要完全信任其输出。尽管情况正在改善,但仍有改进空间。

伦理与法律考量

在使用生成式AI技术时,伦理和法律考量是我们必须真正关心的问题。使用这些模型的输出会带来一些伦理和法律方面的担忧,涉及隐私、所有权和生成内容的滥用等。解决这些问题需要我们制定一些伦理准则,以实现对这些模型的责任部署。例如,IBM提供了一个名为Watsonx.govern的平台,旨在帮助解决部分伦理问题,为这些模型制定规则、法规,并进行合规与风险管理,相关工作仍在进行中。

计算成本与优化

计算成本可能很高,尤其是运行较新的模型时。每个“令牌”(基本上指输入和输出的词汇)的成本会越来越高,因此需要谨慎监控。随着使用量的增加,价格有望下降,就像较新的模型已经相对便宜一样。但对于大量重复性任务,仍需留意成本。

应对高计算成本的方法包括模型剪枝、量化和知识蒸馏。训练、部署和维护这些大型语言模型需要大量资源。建立优化流程的平台、利用GPU等硬件加速器进行训练,以及使用服务器计算和边缘设备等高效运行时环境进行部署,都至关重要。

偏见与模型可解释性

模型是基于互联网上的数据进行训练的,根据其解读所引入信息的方式,可能存在基于人口统计学的偏见。因此,在查看响应时需要小心。如果你觉得响应有偏向性(例如,有点性别歧视),可以要求它进行修正,模型会重新处理信息。此外,一些模型的工作原理像“黑箱”,当你得到一个响应时,并不总是清楚其背后的原因。因此,务必进行迭代并检查响应质量。

总结

本节课中,我们一起学习了生成式AI面临的主要挑战:数据质量导致的“AI幻觉”、高昂的计算成本、重要的伦理法律问题,以及模型可能存在的偏见和“黑箱”特性。我们了解到,应对这些挑战需要多方面的努力,包括使用高质量数据、优化计算资源、建立伦理准则,并对输出保持审慎的验证态度。

053:生成式AI监管挑战 🧑⚖️

在本节课中,我们将聆听AI专业人士探讨如何监管生成式AI带来的挑战。我们将了解监管的必要性、核心原则以及具体的解决方案,以平衡技术创新与社会责任。

概述

生成式AI的快速发展带来了机遇,也带来了偏见、错误信息、隐私侵犯等风险。有效的监管可以为AI的伦理使用、问责制和透明度设定明确的指导方针与标准,从而帮助减轻这些风险。

监管的核心原则与挑战

上一节我们概述了监管的目标,本节中我们来看看监管需要遵循的核心原则以及面临的平衡挑战。

监管需要在创新与问责之间取得微妙的平衡,既要确保创造力,又要维护标准。立法者必须为不断发展的AI领域制定适应性强的法规。伦理准则和透明度至关重要,明确的标准和透明的决策过程有助于建立信任,并防范滥用。

以下是监管需要关注的几个关键领域:

  • 伦理实践:立法者必须优先制定框架,以强制执行AI伦理实践。
  • 隐私保护:这一点至关重要。对数据使用和用户同意的严格规定,有助于建立强大的隐私保护措施,保障个人权利。
  • 合规审计:定期审计对于确保合规性必不可少。

具体监管措施与解决方案

了解了核心原则后,我们来看看专家们提出的具体监管措施和解决方案。

首先,需要公司政策,并由政府强制执行。同时,监管应更侧重于创造就业,而非仅仅自动化岗位。这意味着在培训和技能提升过程中,应更多地包含创造性工作和创造性技能,而不仅仅是培养测试工程师等可能被自动化的岗位。

具体而言,AI监管可以通过建立伦理指南、标准和法律框架,在应对生成式AI挑战方面发挥关键作用,尤其是在内容生成、深度伪造和个性化推荐等敏感领域。

数据隐私和安全也非常重要。通过实施更强有力的数据隐私和安全法规,可以避免个人数据集的滥用。

以下是几项具体的步骤和解决方案:

  • 数据匿名化:对数据进行处理以保护个人身份。
  • 内容审核机制:建立内容验证、检测和下架机制,并对恶意创建有害内容的行为进行处罚。
  • 数据保护与保障:实施严格的数据保护措施。

实施路径:测试平台与公众参与

除了具体的法规,实施路径同样重要。本节我们将探讨如何安全地部署AI并凝聚社会共识。

其中一个解决方案是,在将生成式AI模型投入市场前,建立一个沙盒测试平台。必须在受控条件和环境中对其进行测试,以最小化其给最终用户和社会带来的潜在风险。这也使监管机构能够在技术实际应用前,观察和评估其影响。

公众参与和教育同样至关重要。我们必须让最终用户、学术界、不同行业的利益相关者参与进来,听取他们的意见,并就AI监管建立共识。

总结

本节课中,我们一起学习了专家们对生成式AI监管的见解。有效的监管需要平衡创新与责任,涵盖伦理准则、隐私保护、合规审计等方面。具体的措施包括数据匿名化、内容审核、建立测试沙盒以及促进公众参与。通过制定明确、灵活且执行有力的框架,我们可以引导生成式AI技术朝着负责任、可信赖且造福社会的方向发展。

054:负责任生成式AI的考量因素 🧭

在本节课中,我们将学习如何负责任地使用生成式AI。我们将探讨四个关键的考量因素,以确保这项强大的技术能够安全、公平地造福社会。

随着生成式AI技术被数十亿人用于改善生活,AI系统能力日益增强。它们能为社会带来巨大利益,但也带来了伦理和安全挑战。确保生成式AI负责任地运行,对于发挥其潜力、同时最小化风险并确保全人类受益至关重要。

我们如何确保生成式AI被负责任地使用?通过实施四个至关重要的考量因素:透明度问责制隐私安全护栏

接下来,让我们逐一深入了解。

透明度 🔍

上一节我们介绍了负责任AI的总体框架,本节中我们首先来看看透明度。生成式AI的透明度,指的是AI模型如何工作、做出决策和生成内容的开放性和清晰度。它允许用户理解和信任这项技术。

用户通常对AI和大型语言模型缺乏深入了解。因此,仅通过关于生成式AI模型可能存在不准确性的免责声明,是无法实现透明度的。为确保透明度和伦理决策,用户必须能够获得关于生成式AI局限性、能力和风险的非技术性解释。

以下是透明度的一个应用示例:

  • 场景:一个流媒体服务使用AI驱动的推荐系统。
  • 透明实践:该系统允许用户查看推荐标准。用户可以访问一份透明度报告,该报告解释了推荐是如何生成的,包括用户历史、内容相关性和多样性等因素。
  • 效果:这种透明度使用户能够更好地理解和控制他们的内容推荐。

问责制 ⚖️

了解了透明度的重要性后,我们来看看问责制。生成式AI中的问责制,意味着要求个人、组织和AI模型对其AI驱动的行为和决策所产生的伦理及法律后果负责。

随着生成式AI越来越擅长模仿人类创造力,我们必须仔细考虑这其中人的因素。因为与人类不同,AI模型不具备自主性或意图,它无法在任何有意义的层面上被追究责任。每个人都会以某种方式受到生成式AI的影响,从外包劳动力到裁员、职业角色变化,甚至潜在的法律问题。由于我们无法预知大规模采用生成式AI可能带来的后果,我们需要将分析、审查、情境意识和人性置于所有AI努力的核心。这意味着将生成式AI产品及其结果与其创造者——企业——联系起来。

以下是一个说明问责制在负责任生成式AI中作用的例子:

  • 场景:一家新闻机构使用内容生成AI工具来撰写文章。
  • 问题:如果该生成式AI工具生成了一篇事实错误或带有偏见的文章,并且文章被印刷出版,谁应该为这个错误负责?
  • 问责原则:在这个例子中,新闻机构使用AI工具并不能免除其责任。该机构仍需对其发布的文章质量和完整性负责。

隐私 🔒

在讨论了确保AI行为可追溯的问责制之后,保护用户数据的重要性便凸显出来。生成式AI中的隐私涉及保护个人数据,并确保AI生成的内容不会泄露敏感或机密信息。

如果在训练过程中没有使用隐私保护算法,生成式AI模型就容易面临隐私风险。生成式AI可能会无意中生成侵犯个人隐私的内容,因为它从通常包含敏感数据的大型数据库中学习,且未经明确同意。大型语言模型尤其面临风险,因为它们可能记忆并关联敏感数据,导致隐私泄露。生成式AI应用的普及引发了隐私担忧,因为有时其回复会无意中包含敏感数据。此外,将未经审查的生成式AI应用集成到业务系统中可能导致合规违规。

以下是一个关于隐私风险的示例:

  • 场景:一个AI驱动的聊天机器人用于客户支持。
  • 风险:在回复咨询时,它偶尔会生成无意中泄露客户个人信息的回复,例如联系方式或购买历史。
  • 隐私考量:隐私泄露是一个需要关注的问题,聊天机器人的回复应当保护客户数据。

安全护栏 🛡️

最后,在保护隐私的基础上,我们需要建立更广泛的防护措施。生成式AI中的安全护栏,是指为确保生成式AI模型的安全和负责任使用而制定的措施、政策和控制手段。这些护栏旨在降低风险,防止潜在的危害或滥用,帮助维护伦理和法律标准,并防范意外后果。

以下是安全护栏在生成式AI中的一些关键方面:

  • 内容过滤:实施过滤器以防止生成有害或冒犯性的输出。
  • 安全控制:保护生成式AI模型免遭滥用和潜在的网络安全威胁。
  • 伦理使用:确保AI生成的内容不会造成伤害、歧视或偏见。
  • 法律合规:遵守相关法律法规,包括数据保护和知识产权法。
  • 监控与报告:持续监督AI模型行为,并提供问题报告和解决机制。
  • 用户教育:确保用户理解AI模型的能力、局限性以及他们自身的责任。
  • 使用访问控制:管理对AI模型的访问权限,特别是在可能生成敏感或有争议内容的场景中,以控制使用和潜在风险。

总结 📝

本节课中,我们一起学习了负责任使用生成式AI的关键考量。随着生成式AI在改善我们生活中的作用日益增强,我们必须考虑如何负责任地使用它。为此,有四个关键的考量因素:

  1. 透明度:指AI模型如何工作、做出决策和生成内容的开放性和清晰度。
  2. 问责制:意味着要求个人、组织和AI模型对其AI驱动的行为和决策所产生的伦理及法律后果负责。
  3. 隐私:涉及保护个人数据,并确保AI生成的内容不会泄露敏感或机密信息。
  4. 安全护栏:指为确保生成式AI模型的安全和负责任使用而制定的措施、政策和控制手段。

通过理解和应用这些考量因素,我们可以更好地引导生成式AI技术的发展,使其在创新的同时,也能保障安全、公平和尊重。

055:跨领域实施负责任生成式AI 🧭

在本节课中,我们将学习如何在不同的专业领域中负责任地实施生成式AI。我们将探讨各领域常见的伦理问题,并解释缓解这些问题的关键考量。

生成式AI为IT、市场营销、客户服务、学习与发展等不同领域的专业人士创造了新的机遇。采用生成式AI的组织能够提升生产力、创造力和任务自动化水平。

然而,人们也对其存在的偏见、不准确性、数据隐私、安全和版权侵权等问题表示担忧。任何利用生成式AI的组织或专业人士都必须考虑其伦理影响,并负责应对使用过程中伴随的疑虑。

接下来,让我们探讨几个广泛使用生成式AI的领域中的伦理影响。

内容创作领域的伦理考量 📝

生成式AI一个潜在且广泛的应用是内容创作。市场营销、人力资源、学习与发展、文档编写和娱乐等不同领域和行业的专业人士都使用生成式AI进行内容创作。

围绕使用生成式AI进行内容创作的主要伦理关切包括内容准确性、真实性、版权侵权和数据安全。

内容准确性
生成式AI可能产生不准确、不一致或“幻觉”的内容。为了缓解对内容准确性的担忧,专业人士必须验证和确认他们使用生成式AI系统生成的内容,并纠正任何错误或不一致之处。许多生成式工具(包括ChatGPT)都鼓励用户审查生成的信息。

内容真实性
生成式AI生成的内容可能是抄袭的,且没有明确的引用。此外,AI工具可能引用虚假或不存在的来源。存在专业人士使用具有欺骗性的AI生成内容的风险,这可能损害其工作可信度或组织声誉。例如,律师可能无意中根据通过生成式AI工具进行的研究引用了虚假案例。为了缓解对内容真实性的担忧,可以考虑在实施前加入人工审查步骤,以评估和验证AI生成的内容。也可以考虑使用其他AI或第三方工具或系统来验证生成式AI所产生内容的真实性。

版权侵权
AI开发组织可能使用其他组织的受版权保护的材料来训练AI模型。例如,Getty Images就起诉Stability AI使用其图片库来训练其AI图像生成模型。如果AI模型是在受版权保护的材料上训练的,那么生成的内容就有可能复制受版权保护的作品。因此,使用生成式AI的专业人士应确保生成的文本、图像、视频或任何其他资产的原创性。如果生成式AI工具基于特定来源生成内容,请考虑根据原始创作者的条款和条件提供适当的归属。专业人士还必须确保输入到AI工具的数据(即输入内容)不是受版权保护的材料,未经许可使用受版权材料作为输入可能导致法律问题。

数据安全与所有权
明确输入内容和生成内容的所有权和权利至关重要。一些AI工具和服务将内容的所有权和法律责任分配给用户,正如OpenAI的使用条款所示。然而,其他工具可能主张所有权或对内容使用施加特定条款。由于AI工具倾向于存储或使用您作为提示输入的数据,因此必须注意与其使用相关的数据隐私问题。组织或专业人士应避免向生成式AI工具提供任何敏感或机密信息作为输入,尽可能使用匿名化数据以降低个人身份被识别的风险。另一个重要的考虑因素是理解AI平台关于数据保留、使用和共享的政策。了解生成式AI平台如何收集和利用您的数据,询问平台的数据安全措施,确保数据收集是透明的且符合您的同意。

客户服务领域的伦理考量 🤖

另一个可以利用生成式AI的流行领域是客户服务。让我们试着理解确保客户服务中负责任AI的伦理考量。

以下是实施负责任AI的关键考虑因素:

  • 透明度:当客户与生成式AI聊天机器人而非人类互动时,需明确告知客户。透明度有助于建立信任并管理客户期望。
  • 持续监控:持续监控生成式AI系统的性能及其对客户互动的影响。
  • 数据保护:保护客户数据并确保遵守相关的隐私法规至关重要。
  • 客户控制权:赋予客户控制权至关重要,允许他们轻松切换到人工协助、寻求澄清或升级问题。

软件开发领域的伦理考量 💻

现在,让我们探讨开发人员或软件工程师在工作中使用生成式AI时必须评估的一些考虑因素和影响。

代码透明度与可解释性
首先,确保生成式AI生成的代码是透明且可理解的。相应地,在代码中包含内联注释,并加入人工审查和理解生成代码的步骤。

代码安全性与安全性
关于生成代码的安全性和保障性,实施严格的测试和验证程序非常重要。验证生成的代码不会引入可能危害用户或系统的漏洞、错误或安全风险。

组织层面的最佳实践 🏢

虽然生成式AI在不同领域和行业展现出强大的应用能力,但它也带来了许多伦理挑战。因此,组织应采取相关的最佳实践和考量,以合乎伦理的方式利用生成式AI的力量。

以下是组织可以采取的措施:

  • 员工培训:对员工进行关于生成式AI伦理影响、潜在风险和局限性的培训至关重要。
  • 使用定制模型:组织可以考虑使用自己单独训练的AI模型,以避免偏见和幻觉,并确保组织和消费者数据的保护。
  • 遵守法律法规:遵守有关数据保护、隐私和AI使用的相关法律至关重要。
  • 制定使用指南:应教育员工有关使用AI工具和AI生成内容的指南。

总结 📋

本节课中,我们一起学习了关于在不同领域使用生成式AI的常见伦理关切。

围绕使用生成式AI进行内容创作的主要伦理关切包括内容真实性、版权侵权和数据安全。组织和专业人士应考虑相关的缓解措施来解决这些问题。

为了在客户服务中实施负责任AI,组织应考虑关于透明度、监控和赋予客户控制权等方面的考量。

为了在软件开发中实施负责任AI,应考虑关于生成代码的透明度与可解释性、人工审查以及安全性与保障性等方面的考量。

生成式AI基础:5:主要参与者的AI伦理视角 👁️🗨️

在本节课中,我们将学习IBM、Google、OpenAI和微软等主要科技公司为负责任地开发AI所建立的公开伦理标准与原则。我们还将评估和比较这些公司为积极实践其AI原则所采取的具体策略和工具。

随着生成式AI模型日益融入商业与社会的各个方面,伦理考量变得至关重要。公开的伦理标准提供了一个透明的框架,用以指导这些模型的开发、部署和使用,确保实践是负责任且公平的。接下来,我们看看IBM、Google、OpenAI和微软是如何制定一系列原则来促进生成式AI的负责任与伦理发展的。


IBM的AI伦理原则与实践

IBM为AI技术的负责任使用制定了以下指导方针:

  • 可解释性:AI系统必须能够清晰解释其算法推荐背后的影响因素,这些因素需与不同目标的不同利益相关者相关。
  • 公平性:这意味着AI系统应以公平的方式对待每个人或每个群体。当以正确方式校准时,AI可以帮助人类做出更公平的选择,对抗人类偏见并促进包容性。
  • 鲁棒性:必须积极保护AI驱动的系统免受对抗性攻击,以最小化安全风险并增强对系统结果的信心。
  • 透明度:为增强信任,用户必须能够了解服务如何运作、其功能,并理解其优势与局限性。
  • 隐私:AI系统必须优先考虑并保护消费者的隐私和数据权利,并向用户明确保证其数据将如何被使用和保护。

为了实践这些原则,IBM为客户提供了负责任、透明和符合伦理的AI工作流产品与服务。

上一节我们了解了IBM的伦理原则,本节中我们来看看其具体的实践工具。

以下是IBM为实现其AI伦理原则而开发的关键工具:

  • IBM Watson Governance:这是一个具有成本效益的平台,旨在增强组织在AI活动中的风险缓解能力、法规遵从性和伦理管理能力,即使对于使用第三方工具开发的模型也适用。
  • IBM Watson Studio:该平台支持使用笔记本和无代码工具开发先进的机器学习模型,促进了AI在业务运营中的融合。

Google的AI伦理原则与实践

Google的指导原则涵盖以下方面:

  • 社会效益:AI必须为社会福祉做出贡献,并避免制造或强化不公平的偏见。
  • 安全设计:AI系统应优先考虑安全与保障,避免造成伤害。
  • 对人负责:AI系统应对人负责,其设计应允许透明度和监督。
  • 隐私中心设计:AI系统必须保护用户隐私,避免模型进行有害或不公平的数据实践。
  • 符合原则的使用:AI技术应仅用于符合这些原则的用途。

现在,让我们探索Google如何积极追求其AI原则中概述的目标。

Google开发了多种工具,以帮助开发者和用户识别并解决生成式AI模型中的问题。

以下是Google为实现其AI伦理目标而采取的具体策略和工具:

  • Fairness Turnaround:旨在帮助开发者识别并消除这些模型中的偏见。
  • Explainable AI:旨在阐明生成式AI模型如何进行预测。
  • Differential Privacy:是一种能够在收集和分析数据时不损害个体用户隐私的方法。
  • Safety Net:旨在识别并防止生成式AI模型的恶意使用。


OpenAI的安全指导方针

OpenAI的安全指导方针构成了一套原则与实践框架,旨在确保生成式AI技术的安全与有益使用。这些指导方针基于公司的信念,即生成式AI具有造福社会的巨大潜力,但必须以负责任、安全且符合人类价值观的方式进行开发和使用。

这些指导方针涵盖了广泛的主题。

以下是OpenAI安全指导方针的核心组成部分:

  • 对齐研究:OpenAI致力于使生成式AI与人类价值观对齐。公司大力投资于研究,以开发安全、可靠且有益的生成式AI系统。
  • 防止滥用:OpenAI积极致力于防止生成式AI技术的滥用,通过开发能够检测和防止恶意AI系统创建的工具来实现。公司开发了一个名为“GPT分类器”的工具,可用于检测由AI系统生成的文本。
  • 透明度:OpenAI致力于研发的透明度。他们公开发布研究论文和代码,允许他人审查并在此基础上进行工作。这确保了研究的伦理性和透明性。
  • 协作:OpenAI强调通过协作来实现AI的安全与有益发展。公司积极与其他研究人员、政策制定者和组织进行合作。OpenAI是“AI合作伙伴关系”的成员,这是一个共同致力于促进AI安全与有益发展的公司和组织团体。

微软的AI伦理原则与实践

微软多年来一直处于AI发展的前沿,并致力于以符合伦理和负责任的方式使用AI。我们来看看微软是如何积极追求其指导原则中概述的目标的。

微软的指导原则强调AI应以公平、可靠、安全、包容、透明和负责任的方式设计与使用。

以下是微软为实现这些原则而开发的具体工具和方法:

  • 公平性:微软开发了一个名为“公平性检查清单”的工具,可以帮助开发者识别其AI模型中潜在的偏见来源。
  • 可靠性与安全性:“安全分析”是一个工具,可以帮助开发者识别并缓解其AI模型中潜在的安全风险。
  • 隐私与安全:一种称为“差分隐私”的技术可用于在不损害用户隐私的情况下收集和分析数据。
  • 包容性:开发了“包容性设计工具包”,以帮助开发者设计对残障人士也可访问的AI系统。
  • 透明度:微软公开发布其AI伦理原则和AI偏见缓解工具包。
  • 问责制:开发了“可解释AI”工具,以帮助用户理解AI模型如何进行预测。

总结

本节课中,我们一起学习了IBM、Google、OpenAI和微软等主要行业参与者为负责任AI发展所建立的伦理标准与原则。我们探讨了包括可解释性、公平性、鲁棒性、透明度和隐私在内的关键原则,并讨论了每家公司为在生成式AI模型的开发与使用中积极实施这些原则所采取的策略和工具。本课强调了随着生成式AI日益融入商业与社会的各个方面,伦理考量的重要性正在不断增加。IBM、Google、OpenAI和微软都制定了具体的指导方针和工具,展示了他们对负责任和符合伦理的AI实践的承诺。

057:IBM视角 🛡️

在本节课中,我们将探讨生成式人工智能中的“可信AI”这一核心概念。我们将了解为什么信任是AI应用的基础,分析生成式AI带来的新风险,并学习如何通过治理、透明度和公平性等原则来构建可信赖的AI系统。


课程概述

大家好,欢迎来到AI学院。我是Kate Soule,在MIT-IBM沃森AI实验室担任业务战略高级经理。这位是我的同事,杰出研究科学家Kush Varshney。Kush是一位专注于可信AI的研究员。

我们一致认为,对于AI而言,信任是最重要的事情。如果无法信任这些拥有数十亿参数的庞大模型,企业就无法真正获得AI带来的益处。Kush在这一领域成就卓著,发表了数百篇论文,其算法在全球实验室中应用,并且是备受追捧的演讲者。

为了了解Kush在可信AI方面的工作,我尝试询问了一些消费级聊天机器人。得到的回复有些是正确的,有些则完全是虚构的。例如,它正确提到了Kush出版过一本关于可信机器学习的书,但却错误地声称Kush是“Mach learning for Good Social Foundation”的联合创始人(实际是IBM Science for Social Good的创始人),甚至错误地陈述了Kush的教育背景。

这种现象被称为“幻觉”,即AI系统会编造信息或建立不正确的关联。当前,企业都面临着快速落地生成式AI的压力,但当他们听说AI会产生幻觉、欺凌、情感操控等有毒行为,或存在版权侵权、泄露个人隐私信息等风险时,会感到担忧、紧张甚至恐惧。

我们必须认识到,AI不是一场竞赛,而是一段旅程。任何希望进入企业应用的AI,都必须贯穿信任和透明的原则。我们需要放慢脚步,建立治理结构,设置保障措施和防护栏,确保做正确的事。


生成式AI与传统机器学习的风险对比

上一节我们介绍了AI幻觉等风险,本节我们来具体看看生成式AI与传统机器学习在风险上的异同。

生成式AI和预测性机器学习如同一枚硬币的两面,许多技术非常相似,但也存在差异。幻觉、隐私信息泄露、欺凌等都是前所未有的新风险。当然,许多传统风险依然存在。

主要的差异在于解决方案。我们无法完全套用以前的技术来处理这些新问题,一个核心原因在于如今处理的数据集规模极其庞大。

当数据量如此巨大时,我们虽然可以实施数据治理技术,确保不抓取某些网站或进行某些过滤,但其规模已超出任何个人甚至团队逐条审阅所有内容的能力范围。这正是挑战所在。


可信AI的多维度定义

当我们谈论信任时,客户通常会立刻想到准确性,即模型在特定用例中的质量和可靠性。但这仅仅是起点。

信任的定义更为广泛:

  • 性能与准确性:这是基础,没有良好的性能,其他都无从谈起。
  • 可靠性与鲁棒性:系统是否稳定可靠。
  • 公平性:系统是否对不同群体一视同仁。
  • 可解释性:人类能否理解模型的运作方式。
  • 过程透明度:我们能否理解系统从构建到部署的整个流程。
  • 价值对齐:能否确保AI系统为我们的利益服务,而非其他目的。

对AI(包括生成式AI)一个合理的批评是,它有时像一个“黑箱”。接下来,我们将深入探讨透明度这一维度。


透明度:打开AI黑箱

透明度要求我们能够洞察AI系统的内部运作。一个恰当的比喻是开放式厨房餐厅:你可以看到所有食材、厨师的烹饪过程,这让你对食品质量充满信心。AI系统也是如此。

透明度意味着我们需要了解:

  • 数据来源
  • 执行了哪些处理步骤
  • 进行了何种测试
  • 完成了哪些审计

所有这些信息共同构成了我们对系统运作的理解。它帮助我们建立信心,确保其中发生的是“正确的事”。


公平性与偏见放大

Kush对公平性这一话题充满热情。在传统机器学习中,我们关注招聘、贷款等算法的公平性。而在生成式AI世界,我们最关心的是刻板印象和其他毒性内容

当系统以有害方式运行时,社会中最脆弱的成员受害最深。生成式AI和机器学习在这一点上本质相同:如果它们基于有偏见的数据进行训练,就会产生有偏见的输出

生成式AI的训练数据是人类创造的数据,而人类存在意识和无意识的偏见,其创造的数据会反映这些偏见。算法则会放大这些社会性和认知性偏见。


构建可信AI的实践路径:治理

面对所有这些风险和考量,企业如何才能以安全、负责任且合乎伦理的方式采用生成式AI?答案的核心是治理

AI治理必须贯穿始终:

  1. 明确意图:定义系统的预期用途。
  2. 数据溯源:明确数据来源。
  3. 处理与检查:在数据处理过程中嵌入各种制衡与检查机制。
  4. 测试与部署:进行充分测试。
  5. 持续监控:部署后持续监控系统性能,并在其超出防护栏时及时干预。

当风险很高时,我们不仅需要信任,更需要能够验证和确认这种信任。信任本身不是目的。


课程总结

本节课我们一起学习了可信AI的核心要义。我们认识到信任是AI应用的基石,探讨了生成式AI带来的新风险(如幻觉、隐私泄露),并深入了解了构建可信AI的多个维度,包括性能、公平性、透明度以及至关重要的全流程治理。

关键点在于,采用生成式AI不能只求速度,而应将其视为一段需要谨慎规划、贯穿信任原则的旅程。通过实施强有力的治理框架,企业可以更安全、更负责任地利用生成式AI的潜力。

感谢观看本期AI学院。请继续关注后续课程,我们将深入探讨更多AI商业应用中的重要话题。

生成式AI基础:5.2:专家观点:理解主要参与者的AI伦理关注点 🧠

在本节课中,我们将聆听行业专家对主要参与者为何重视AI伦理的见解,并梳理其背后的关键原因。


概述

主要参与者关注伦理AI,是出于一系列关键原因。这些原因涵盖了公共信任、合规性、公平性等多个方面,共同构成了负责任地开发与部署AI技术的基石。

主要关注点解析

上一节我们了解了AI伦理的重要性,本节中我们来看看行业专家指出的具体关注点。以下是专家们强调的几个核心原因:

  1. 建立与维护公众信任

    • 通过提供透明度来实现,让用户了解AI决策的来源。
    • 公式:公众信任 = 透明度 + 可解释性
  2. 遵守法规要求

    • 随着政府和监管机构推出更严格的法律与指南,公司必须优先将这些要求整合到自身的实践和治理模型中。
  3. 解决偏见与公平性问题

    • 伦理AI有助于解决与偏见和公平性相关的问题,确保AI系统不会延续或加剧现有的不平等。
  4. 管理声誉与品牌形象

    • 优先考虑伦理AI的公司能更好地管理声誉,避免因滥用或不道德行为引发的丑闻,从而提升品牌形象。
  5. 确保长期可持续性

    • 伦理AI实践通过考量更广泛的社会影响,有助于AI技术的长期可持续发展,从而创造出更稳健、持久的AI解决方案。
  6. 促进负责任的创新

    • 关注伦理AI鼓励负责任的创新,使公司能够在探索新技术前沿的同时,确保其进步有益于社会且不造成伤害。

深入探讨:多维度的驱动力

除了上述直接原因,专家们还从更宏观的视角阐述了伦理AI的驱动力。以下是几个关键维度:

  • 社会影响与责任:主要参与者理解技术对社会的影响力,并感到有道德义务确保其积极造福所有人。
  • 风险管理:伦理AI有助于降低与意外后果、偏见、歧视、隐私泄露及其他可能损害公司或其最终用户的伦理问题相关的风险。
  • 人才吸引与保留:顶尖人才通常更愿意为优先考虑伦理价值和社会影响的组织工作,这有助于提升员工满意度并培养积极的组织文化。
  • 客户满意度与忠诚度:伦理AI实践通过确保产品和服务以负责任、可信赖的方式开发和交付,有助于提高客户满意度和忠诚度。
  • 公众认知:伦理AI能够塑造公众认知,向客户、投资者、监管机构和更广泛的社区展示组织的伦理领导力和社会责任感。

核心警示与责任

专家特别指出,不负责任和不道德地使用人工智能,其危害不亚于武器。在数据隐私、信息滥用、制造虚假图像和合成数据等方面,社会可能因滥用强大工具而承受巨大风险。因此,保护技术的创造者和使用者,明确系统应具备的能力,并谨慎地以正确方式使用技术,是所有使用和构建AI技术的人应关注的首要焦点。

总结

本节课中,我们一起学习了行业主要参与者高度重视AI伦理的多重原因。总结来说,这主要由以下因素驱动:促进透明度和问责制以建立信任遵守法规以避免法律纠纷减轻偏见和意外后果以促进公平;以及提升公司声誉。通过优先考虑伦理AI,我们才能确保这项强大技术朝着积极、可持续且对社会负责的方向发展。

059:负责任使用生成式AI的关键考量 🔑

在本节课中,我们将学习AI专家们关于如何负责任地使用生成式AI的核心见解。我们将探讨确保AI系统合乎道德、公平、安全且尊重隐私的关键措施。

实施防护栏与伦理准则

上一节我们介绍了生成式AI的基本概念,本节中我们来看看如何确保其输出是负责任且合乎道德的。专家指出,当前最重要的一项措施是实施“防护栏”。

防护栏 的核心思想是:绝不让生成式AI在未经审查的情况下对外响应或发送信息。具体流程是,在AI生成内容后,通过一套检查机制来评估其质量。

以下是防护栏需要检查的关键方面:

  • 检查内容是否符合公司准则。
  • 识别内容中是否包含脏话或仇恨言论。
  • 判断内容是否合法、合乎道德。

如果防护栏检测到问题内容,系统应直接终止并取消该次输出交易。

除了技术上的防护栏,在开发、部署和使用生成式AI技术时,遵循伦理准则与原则同样至关重要。

以下是负责任使用生成式AI的核心伦理原则:

  • 公平性:确保AI系统不加剧或放大社会偏见。
  • 透明度:公开模型的开发全生命周期,并清晰解释其行为、局限性和潜在偏见。
  • 问责制:明确责任归属,确保决策可追溯。
  • 隐私保护:尊重并保护个人数据与隐私。
  • 人权尊重:确保技术应用不侵犯基本人权。

确保透明度与公平性

在理解了伦理原则后,我们需要重点关注如何实现透明度和公平性。模型提供者有责任清晰、详尽地说明在创建模型时所做的考量。

例如,开发者应将公平性、问责制和透明度融入AI系统的整个生命周期。这有助于我们理解AI的决策过程,从而建立对技术的信任。因为我们知道输出是如何生成的,我们才能做出调整以减少偏见。

以下是模型提供者必须明确披露的信息:

  • 如果模型容易产生“幻觉”(即编造事实),必须报告此缺陷。
  • 如果模型主要基于特定人群或观点进行训练,必须说明训练数据的局限性。
  • 需要告知用户模型是否会保留输入信息,以及输出内容是否可能引发抄袭检查。

保护数据隐私与安全

上一节我们讨论了模型的透明度,本节中我们来看看数据隐私与安全这一同等重要的议题。专家强调,必须在整个AI生命周期中保障数据隐私与安全,防止任何个人信息的滥用。

我们可以部署多种技术来保护敏感信息。

以下是保护数据隐私与安全的常用技术:

  • 数据匿名化:移除或加密数据中的个人标识信息。
  • 加密技术:对存储和传输中的数据进行加密。
  • 访问控制:严格限制对数据和系统的访问权限。
  • 安全审计:定期进行安全检查,发现并修复漏洞。

我们的目标是保护训练数据所涉及个体的隐私。因此,需要实施强大的数据匿名化技术以及安全的数据存储与实践,以防止未经授权的访问和滥用。

遵守法规与保持人类监督

在关注技术安全的同时,我们也必须遵守外部法规并保持人类的最终控制权。遵守政府相关法律法规是基本要求。

此外,在关键领域保持人类对AI生成内容的监督至关重要,以确保其准确性和适当性。

以下是尤其需要人类监督的敏感领域:

  • 医疗健康:诊断建议、治疗方案等。
  • 金融服务:投资建议、信用评估等。
  • 法律服务:合同生成、法律意见等。

除了监督,我们还应鼓励负责任的创新,持续评估AI技术的社会影响。这意味着需要与各利益相关方进行互动。

以下是需要纳入考量的关键利益相关方:

  • 伦理学家
  • 政策制定者
  • 公众

通过与各方互动,我们可以共同解决问题,并纳入多元化的视角。例如,当前非常相关的版权问题就需要被重视:用户直接使用ChatGPT等模型生成的内容可能引发版权纠纷,因此必须明确告知用户相关的风险和责任。

本节课中我们一起学习了负责任使用生成式AI的多项关键考量。我们从实施技术“防护栏”和遵循伦理准则开始,探讨了确保透明度、公平性的方法,深入了解了保护数据隐私与安全的技术手段,最后强调了遵守法规、保持人类监督以及进行负责任创新的重要性。这些措施共同构成了开发生成式AI系统时不可或缺的责任框架。

生成式AI基础:5.1:生成式AI的经济影响 💰

在本节课中,我们将探讨生成式AI对全球经济、企业和就业市场带来的深远影响。我们将分析其带来的增长潜力、具体效益、潜在挑战,以及它如何重塑工作岗位。


企业正欣喜于生成式AI应用带来的诸多益处。根据麦肯锡的一份报告,在生成式AI的辅助下,有四个职能部门有望实现最大程度的增长:客户运营、市场营销与销售、软件工程以及研究与开发

一个具体的例子是,一家拥有5000名客服代表的公司使用生成式AI处理客户投诉,他们每小时能够多解决14%的请求,并将问题处理时间减少了9%。你可能已经与这类生成式AI客服聊天机器人互动过,有时很难分辨对话方是机器还是人类。但事实是,如今的聊天机器人能够提供快速的解决方案。

生成式AI工具能够像人类一样回应的能力,是这场经济革命的核心。以下是两个例证:在一个标志性时刻,GPT-4在参加统一律师资格考试时取得了第90百分位的成绩,超过了之前所有大型语言模型的得分。谷歌的AI翻译了孟加拉语,而它从未学习过这门语言,这是根据谷歌技术与社会高级副总裁的说法。

毫无疑问,生成式AI的经济影响正在全球范围内显现。高盛的研究预测,在10年内,生成式AI可能使全球GDP增长7%(近7万亿美元),并使生产率提高1.5个百分点。

那么,这样的经济增长对所有人都有益吗?历史表明,每当世界发现一项强大的技术时,无论是驱动工业革命的蒸汽机、驱动社交媒体革命的互联网,还是驱动生成式AI革命的基础模型,我们都会看到效率与绩效的提升、新工作岗位的出现与职业发展、更好的分销与收入,以及企业和消费者能更便捷地接触彼此所带来的普遍兴奋感。

就业市场的转变

上一节我们看到了生成式AI带来的宏观经济增长,本节中我们来看看它对就业市场的具体影响。就业市场正在经历戏剧性的转变;“提示工程师”的兴起就是这样一个令人惊讶的例子。这是一个高技能岗位,要求从业者(无需特定学位)策略性地审核、测试和训练大型语言模型,以改进其响应。总体而言,从事AI工作的人才需求旺盛。

然而,这里存在现有的性别偏见。根据世界经济论坛的数据,在全球AI专业人员中,女性仅占22%

对于非AI劳动力,高盛预计约有3亿个全职工作岗位将部分被生成式AI自动化。根据一家人力资源分析公司的数据,这些工作通常由女性担任,包括但不限于办公室秘书或行政人员、人力资源经理、教师、作家和客户服务代表。

历史上,失去的工作岗位总会被新的工作岗位所取代。你知道吗?如今60%的工人所从事的职业在1940年时并不存在。因此,那些被取代的人有可能进行创新并创造新的机会。但今天的求职者需要意识到,你在职场中的未来角色也可能由AI决定,因为算法开始筛选简历。

如今,大多数公司使用AI驱动的招聘软件来审查简历和申请。当你投递简历时,请确保包含算法正在寻找的关键词。那些为获得学位而参加考试的人也必须应对AI筛选器。不幸的是,一些筛选器正变得颇具争议,因为算法通常是在有限、有偏见且未经核实的数据上训练的。

例如,已知用于大学在线考试的AI软件会标记戴头巾的学生,或在筛选考生时难以识别非白人学生的肤色。它甚至可能阻止有视力障碍的学生使用屏幕阅读器。

过快采用AI的挑战

除了就业影响,过快、过急地部署AI还会带来治理和伦理上的挑战。此外,这些算法被训练来攻击学生的击键动作和/或访问他们的笔记本电脑摄像头以判断是否作弊。例如,加州州立大学的学生已提交请愿书,反对使用Proctorio(一种通过分析音视频记录和屏幕监控来识别潜在作弊行为的软件)。这部分是由于缺乏足够的治理,因为AI解决方案正在仓促实施,因此实施和监管都不够完善。

怀着对经济增长的强烈渴望,许多行业正在利用生成式AI来扩大其影响范围和收入。全球劳动力正在巧妙地通过认证,以使自己在AI优先的经济中保持相关性。

过快、过多地使用AI可能带来的后果,是否包括沿着性别线扩大收入差距?这是一个值得思考的问题。


总结

本节课中,我们一起探讨了生成式AI对全球经济的影响。客户运营、市场营销与销售、软件工程以及研究与开发将感受到最直接的影响。经济将从效率与绩效提升、新工作岗位(如提示工程师的兴起)和职业发展中受益。同时,我们也可能看到基于性别的收入不平等以及客户服务代表等岗位的被替代。在拥抱技术红利的同时,关注其带来的社会挑战并寻求负责任的治理至关重要。

061:生成式AI的社会影响 🌍

在本节课中,我们将探讨生成式人工智能(AI)对社会产生的广泛影响。我们将了解其带来的积极效益,识别伴随其广泛应用而出现的新挑战,并探索如何平衡其收益与风险。

概述

生成式AI的社会影响,指的是它对社会及其福祉产生或可能产生的作用,这超越了生产力、经济增长和投资回报率等传统指标。社会影响考量的是诸如倡导、包容性、医疗保健和环境等指标,所有这些都共同构建一个结构良好、公平的社会。

倡导与协作 🤝

上一节我们介绍了社会影响的概念,本节中我们来看看生成式AI如何助力社会倡导。

生成式AI工具可以帮助政府、政府间机构、非政府组织和公民社会更快地访问和分析数据、预测情景以制定预防措施,并准备富有创意和说服力的倡导材料。通过使用生成式AI,我们将看到国际协作的增加,从而推动更多的辩论与讨论。

数字包容性与公平性 ⚖️

然而,并非所有人都能平等地访问和使用生成式AI。根据联合国数据,截至2021年,估计全球仍有37%的人口(约29亿人)无法接入互联网。这个概念被称为数字排斥,其中96%的数字排斥人口生活在发展中国家。

这意味着,在采用生成式AI方面滞后的群体,将在经济上进一步被边缘化。倡导者和立法者需要尽快将他们纳入进来,以防止生成式AI进一步拉大绩效和资质上的差距。

促进社会包容性 🌈

几个世纪以来,社会一直在为促进社会包容性而努力,旨在创造一个所有人都感到被代表、且不会因其性别、种族、残疾或性取向而受歧视的世界。由于生成式AI工具是多模态的,它们允许人们以定制化和偏好的格式进行学习和交流。

以下是生成式AI促进包容性的一些能力示例:

  • 轻松翻译成多种语言
  • 快速的文本到语音转换
  • 用于增强匿名性的AI语音
  • AI肖像的创建

越来越多的人正沿着这些思路思考。例如,麻省理工学院向27位入围者提供了资助,以探索生成式AI对民主、教育、可持续性、通信等领域的影响。

医疗保健领域的机遇与挑战 🏥

生成式AI对医疗保健领域产生了非常积极的影响。我们看到它加速了医学研究和药物发现,通过改进临床决策支持实现了早期检测和诊断,增强了应对医护人员短缺的能力,并提供了个性化的健康信息和服务。

然而,一个担忧也随之出现:训练生成式AI系统的数据存在固有的种族和性别偏见,这会影响临床决策。例如,2019年,美国公民自由联盟指出,AI算法误读了患者数据,导致错误地假设非裔美国患者与具有相同症状的白人患者相比需要更少的护理。为了纠正这个错误,算法被重构为专注于患者的症状,而非患者治疗的历史记录。

这里出现的问题是:我们如何持续增加训练数据的多样性和准确性?

另一个与医疗保健相关的担忧是过度消费在线内容可能带来的情感孤立。2023年5月,美国卫生与公众服务部正式指出,缺乏社会联系可能会增加对病毒和呼吸道疾病的易感性。根据美国卫生局局长的说法,孤独已成为一种流行病,是一个紧迫的公共卫生问题。

由此产生了两个有趣的问题:随着生成式AI使人们更加依赖数字世界和自给自足,它会导致孤独感增加吗?还是像ChatGPT这样的生成式AI工具能帮助人们应对孤独?

环境影响与可持续性 🌱

生成式AI对环境有何影响?像GPT-4、ChatGPT、DALL-E 2、Midjourney、Stable Diffusion、LaMDA和BERT这样的基础模型需要大量的硬件和云空间,并使用稀有矿物。由于它们处理海量数据,硬件需要频繁更换,从而更频繁地产生电子垃圾。鉴于其巨大的碳足迹,生成式AI目前并非环境的朋友。

根据《哈佛商业评论》,组织可以采取措施使这些系统更环保,例如:

  • 对现有模型进行微调以适应下游任务,而不是从头开始构建模型。
  • 评估云提供商或数据中心的能源来源
  • 仅在需要时使用生成式AI

总结

在本节课中,我们一起探讨了生成式AI对社会的影响,特别是它对倡导、包容性、医疗保健和环境的贡献。

效益包括增强的倡导与包容性、更好的医疗系统与服务,以及可能帮助应对孤独的聊天机器人。

挑战则包括数字排斥、有偏见的算法、数字依赖引发的孤独感以及可观的碳足迹。

我们必须采取措施,负责任地使用生成式AI工具,以最大化其效益并减轻相关风险。

生成式AI基础:5.3:生成式AI重塑劳动力格局 👨‍💼🤖

在本节课中,我们将探讨生成式AI如何影响全球劳动力格局,识别组织在适应这项技术时面临的核心挑战,并列出组织为确保劳动力成功转型可以采取的步骤。

在全球层面,生成式AI正在帮助自动化许多业务职能,例如市场营销与销售、客户服务、法律、采购、运营以及研究与开发。高德纳预测,到2025年,AI软件市场将达到近1348亿美元。这意味着越来越多的组织将日益依赖大型语言模型来处理基础性和重复性的任务。

然而,他们是否拥有合适的人员来运用这项技术呢?生成式AI革命的核心是知识工作者。正如AI变革了工厂工人的角色一样,生成式AI正在变革知识工作者的角色。因此,劳动力方面的考量对于生成式AI的成功采用至关重要。如果组织希望从其AI投资中获得最大价值,就必须重视这一点。

根据国际劳工组织的观点,生成式AI更可能增强而非摧毁工作岗位,它将自动化某些任务,而非整个职位。这是因为生成式AI在伦理和情感智能方面有限,因此无法像人类一样做出复杂的、依赖情境的决策。当生成式AI自动化常规和分析性任务时,仍然需要人类的专业知识来做出细致入微的复杂决策。这种仅自动化特定功能的情况被称为部分自动化

上一节我们了解了部分自动化的概念,本节中我们通过几个例子来具体探索其影响。

以下是两个部分自动化的实例:

  • 米什:他是一家跨国公司的会计师。生成式AI将帮助他自动化数据处理、簿记和对账等流程。他可以查询算法来生成财务报告,并使用AI驱动的异常检测软件来发现系统中的欺诈行为。然而,仍然需要他的输入来解释报告、分析复杂的财务数据、与客户互动并提供个性化建议。例如,AI系统标记为欺诈的每一个行为是否都构成违规?他需要运用自己的伦理判断来决定。
  • 布娜:她是一家小型公关公司的经理。公司采用的生成式AI工具执行预测分析以规划资源分配,同时也分析数据以生成风险管理见解。在这种支持下,她能够做出基于证据的决策、凭直觉解决复杂问题、规划未来、与利益相关者谈判并建立客户关系。

由于生成式AI不会自动化整个职位,因此工作不必消失,人员也不必被取代。因此,组织需要认识到一个简单的事实:在生成式AI背景下,劳动力准备就绪的最大挑战并非员工替代,而是员工技能提升。世界经济论坛指出,44%的工人需要在未来五年内提升技能或再培训。通过这种方式,生成式AI与人类专业知识可以协作,发挥彼此的优势。

虽然短期内招聘新人才来执行AI特定任务是必要的,但组织可以启动劳动力转型计划,提升现有员工的技能,以实现长期匹配。这将确保业务中断最小化,同时领导者能准备好一支适应生成式AI的劳动力队伍。接下来,我们探讨实现这一目标可能涉及的步骤。

以下是组织可以遵循的四个关键步骤:

  1. 重新设计工作流程:组织必须重新设计业务流程,并使员工的角色与组织更新后的优先事项和技术应用相匹配。
  2. 评估技能:管理者必须根据三个因素评估员工的技能水平:新工作流程下的资源需求、自动化不可避免但以人为本的角色仍然重要、现有员工必须补充生成式AI的输出,而非与之竞争
  3. 招聘AI角色人才:管理者应从外部招聘人才,仅用于填补关键的人才缺口。其他所有人都应考虑进行内部培训和技能提升。
  4. 优先安排培训:组织必须识别内部受影响最大的角色,并优先安排对其进行指导和技能提升。

为了更具体地理解这些步骤,我们来看一些应用场景。

以下是技能提升与培训的实例:

  • 易受影响的角色:例如,主要由女性担任的文职角色将因生成式AI而实现最大程度的自动化。必须培训这些易受影响的员工去执行更高级别的任务,而让生成式AI工具处理重复性和基础性任务。
  • 组织领导力:另一个例子是组织领导力。随着生成式AI的广泛使用,领导者对经济、社会和员工的预期角色是什么?例如,一家财务咨询公司正在使用基于其专有数据训练的生成式AI模型。该模型生成市场趋势和竞争分析,帮助进行情景规划和风险评估,并促进部门间的协作。库马尔是这家公司的首席技术官。为确保公司的基础模型被合乎道德地使用,他接受了关于AI伦理原则的指导,例如问责制、透明度、隐私和安全性。通过对这些方面的培训,库马尔确保了由公司专有模型指导的决策能对公司和社会产生积极影响。

通过技能提升,组织可以利用其已有的丰富人才库。这是生成式AI对劳动力的真正影响。工作流失、技术暴露风险增加、缺乏人情味、偏见数据扩散,所有这些迹象都表明组织没有投资于劳动力转型。

本节课中我们一起学习了生成式AI对全球劳动力的影响。生成式AI将部分自动化工作岗位,而不会取代人员。为生成式AI准备劳动力的最大挑战是员工技能提升。组织必须进行劳动力转型,以最小化业务中断、最大化可用人才库,并确保在AI技术投资上获得高回报。他们可以遵循四个步骤来确保这一转型:重新设计工作流程、评估技能、招聘AI角色人才以及优先安排培训。

063:生成式AI对社会的影响

在本节课中,我们将聆听AI专业人士的见解,探讨生成式AI对社会产生的积极影响。

概述

生成式AI对社会的一个显著积极影响,在于其民主化创意过程提升生产力的能力。通过实现自动化内容创作,生成式AI使个人和企业能够以最少的资源生产高质量的文本、图像、音乐和视频。

赋能内容创作与生产力

上一节我们提到了生成式AI的总体影响,本节中我们来看看它在具体场景中的应用。

通过自动化内容创作,生成式AI极大地降低了创意工作的门槛。例如,现在你可以仅提供一个脚本,后端就能生成视频供你编辑。许多人在此之前不具备这种能力。

以下是生成式AI在内容创作中的几个应用实例:

  • 图像与图标设计:为网页应用构建美观的图像或吸引用户点击的图标时,AI可以提供帮助,无需单独雇佣设计师。
  • 艺术与音乐生成:艺术家可以利用AI工具生成独特的艺术品,音乐家可以用它来激发灵感。
  • 辅助写作:作家可以用它来克服写作瓶颈,整理思路,甚至与AI进行协作创作。

降低技术门槛与促进学习

除了创意领域,生成式AI还在技术学习和语言应用方面发挥着重要作用。

对于不擅长编码的人,生成式AI可以生成一个基础代码端口,这个基础可以被进一步优化和细化,以创建更好、更具体的应用程序。

同样,对于非英语母语者或不擅长特定语言表达的人,生成式AI可以帮助撰写文本、辅助学习。它就像一个可以随时提问并获得答案的伙伴。即使使用最简单的英语词汇和直白的语言,模型也足以理解你的需求并生成回应。

激发创造力与实现个性化

生成式AI的一个积极影响是创意赋能。它实际上有助于激发创造力,使每个个体都能创建和操控图像、音频、音乐、视频等数字内容。这将激发创造力,并开启用户此前未曾探索过的新视野或新想法。

它同时也降低了入门门槛。任何经验水平、任何年龄、无需特定背景的人都可以使用这项技术并发挥创意。

此外,它还能帮助我们解决一些特定用例,例如实现个性化与定制化的内容创作,根据个人偏好、兴趣和上下文来定制输出内容。

革新教育与普及知识

回顾过去,若想获得最好的教育,通常意味着需要支付高昂的费用聘请私人教师,或进入顶尖大学。

如今,借助生成式AI,你几乎可以拥有一位私人教师。这位“AI教师”不仅能教授普通私人教师所授的内容,还能教授更多其他知识。这将成为绝对的变革者,因为高质量、个性化的教育将以前所未有的方式提供给地球上的每一个人。

总结

本节课中,我们一起学习了生成式AI对社会多方面的积极影响。它通过民主化创意工具降低技术与创作门槛激发个人创造力以及革新教育模式,正在成为提升社会生产力和促进知识普及的强大推动力。从辅助专业人士到赋能普通个人,生成式AI展现出改变各行各业的巨大潜力。

064:将生成式AI融入组织文化 🏢

在本节课中,我们将学习专家们关于组织如何帮助员工在心理和专业上做好准备,以便与生成式AI系统协同工作的核心观点。


概述

任何计划引入生成式AI的组织都必须考虑一个关键方面,那就是不要急于采用这项技术。这是一项巨大的进步,是对你以往工作方式的重大改变。如果只是简单地抛开一切去使用这项技术,那将可能成为一场灾难。因此,每个企业都应考虑的最重要建议是,你需要以稳健和系统化的方式,将这些技术融入日常组织活动中。

上一节我们讨论了技术本身,本节中我们来看看如何从“人”的角度做好准备。

系统化融入方法

首要任务是提高员工对生成式AI的认识并进行教育,鼓励持续学习以适应不断发展的技术环境。以下是组织可以采取的系统化步骤:

以下是确保员工在专业和心理上准备好与生成式AI协同工作的关键方法:

  1. 提供培训与教育:领导层应通过投资于员工的培训和发展,来展示他们对生成式AI准备工作的承诺。应为员工提供AI工具和技术的实践经验,以熟悉并建立使用和与之协作的信心。这种教育和培训应该是持续性的。
  2. 实施技能发展计划:为员工配备与生成式AI有效协作所需的技术技能。
  3. 培养协作文化:通过跨职能团队促进协作文化,让来自不同团队的人员可以进行跨职能项目并相互分享知识。
  4. 建立沟通渠道:为员工建立表达关切和分享与生成式AI协作见解的沟通渠道。

鼓励创造性应用与人文价值

其次,需要更多地鼓励创造性地使用这些技术,而不是盲目应用。需要有检查机制来验证生成的内容是否被盲目使用。需要更多地鼓励创造性地使用这些技术,并激励人们利用它们更好地完成工作,而不是简单地用自动化工具取代现有标准。

因此,我想向有意引入生成式AI的组织建议的最重要一点是,你需要非常系统化地灌输这种技术。重要的是要解决伦理和社会影响,并强调人机协作。应强调员工在结合AI能力时,运用判断力、创造力和同理心的重要性,这能使他们自动化某些流程并帮助完成工作。

关注员工福祉与变革管理

同时,应支持心理健康。组织应提供咨询服务、员工援助计划和心理健康资源,以促进员工的福祉和适应力。

利用生成式AI可以实现业务流程改进,而最了解流程的业务人员可能是进行改进的最佳人选。此外,要理解变革管理。变革过程总会伴随恐惧和担忧,然后人们会开始接受,并逐渐变得更好。因此,要考虑组织内部的变革管理流程,并延续大多数组织已有的协作文化,作为一个团队共同努力,找出如何使工作流程更高效的方法。

然后,为组织中的员工提供支持和资源。如果他们感受到你在为他们投资,他们会对变革感到兴奋。


总结

本节课中我们一起学习了为生成式AI时代准备员工的关键策略。总而言之,让员工为生成式AI做好准备涉及教育、技能发展、协作和开放沟通。让我们做好准备,共同拥抱与生成式AI协同工作的未来。

生成式AI基础:01:课程介绍 🚀

在本课程中,我们将探讨生成式AI如何推动商业进步与职业发展。您将了解其对各行业的影响、企业如何整合这项技术,以及它为专业人士带来的新机遇。

生成式AI的出现促使许多人思考自身职业的未来。同时,领导者们也渴望将生成式AI整合到其运营中,以确保企业在这个由创新主导的时代取得成功。工作、职位和市场动态的变革,启发我们提出了一些深刻的问题。

以下是本课程将解答的核心问题:

  • 专业人士如何利用生成式AI在不断快速演变的工作环境中保持竞争力?
  • 职场人士面临哪些新的机遇?
  • 生成式AI对商业有何益处?
  • 哪些行业能从生成式AI中受益?
  • 公司如何有效且安全地整合这项技术?

本课程面向所有初学者,无论您是专业人士、爱好者、从业者还是学生。只要您对快速发展的生成式AI领域抱有真正的兴趣,这门课程就适合您。当然,它面向所有人,无论您的背景或经验如何。

完成本课程后,您将能够:

  • 解释生成式AI当前及新兴趋势对不同行业商业格局的影响。
  • 识别将生成式AI整合到业务中所必需的关键要求。
  • 识别生成式AI领域涌现的职业机会。
  • 分析生成式AI如何提升不同领域现有职业的发展。

本课程结构紧凑,包含三个模块,预计每个模块需要花费1到2小时完成。

上一节我们概述了课程目标,接下来我们具体看看各模块的内容安排。

以下是三个模块的详细学习路径:

  • 模块1:您将学习生成式AI的当前及新兴趋势如何影响商业格局以及各领域专业人士的职业机会。您将探索生成式AI如何影响现有业务的扩展,并为新业务生成创意和机会。您还将深入了解企业为迎接生成式AI所需做的必要准备。
  • 模块2:您将探索生成式AI工作空间中潜在的职业机会,例如AI工程师自然语言处理工程师提示词工程师数据科学家计算机视觉工程师AI研究科学家AI伦理学家。您还将学习生成式AI如何为内容创作者、IT专业人士以及高管或经理提升职业前景。
  • 模块3:此模块需要您参与一个最终项目,并完成一个计分测验以检验您对课程概念的理解。您还可以访问课程术语表,并获得关于后续学习步骤的指导。

本课程融合了概念讲解视频和辅助阅读材料。观看所有视频以充分掌握学习材料的潜力。您将通过动手实验来理解生成式AI模型的局限性,并在模块3参与最终项目。每节课末尾的练习测验将帮助您巩固所学知识。课程结束时,您还需完成一个计分测验。课程还提供讨论区,供您与课程工作人员联系并与同伴交流互动。

最有趣的是,通过专家观点视频,您将听到经验丰富的从业者谈论生成式AI如何促进职业发展。生成式AI就像一个富有创造力的伙伴,它能放大我们的想象力,并在不同领域开启新的可能性

本节课中,我们一起学习了本课程的核心目标、结构安排以及您将获得的具体能力。现在,让我们正式开始这段探索生成式AI如何塑造商业与职业未来的旅程。

066:生成式AI趋势与影响 🚀

在本节课中,我们将学习生成式AI的当前与新兴趋势,并分析其对不同专业人士的职业以及整体商业格局所产生的深远影响。

生成式AI正在经历快速发展,其潜力正在改变我们生活的各个方面,包括个人职业发展和商业环境。近年来,这项技术已广泛融入几乎每个行业。麦肯锡2023年全球报告指出,33%的头部公司已采用生成式AI,另有25%的公司正在整合过程中。随着生成式AI模型的能力和可访问性不断增强,其应用预计将迎来更快速的增长。

上一节我们了解了生成式AI的广泛应用背景,本节中我们来看看其具体的发展趋势。

以下是当前及新兴的生成式AI模型趋势:

  • 模型普及与接口简化:诸如GPT和DALL-E等模型改变了企业生成内容和与技术互动的方式。其直观的界面和API促进了快速原型设计,释放了探索生成式AI全部潜力的广泛可能性。
  • 模型规模与能力增强:OpenAI、Google、Microsoft、IBM等主要参与者正在开发更大、更强大的模型,在多个领域取得了令人瞩目的成果。
  • 多模态能力发展:像Google Gemini这样具备多模态能力的模型,能够无缝理解和处理多种内容格式,包括文本、代码、图像、音频和视频。这种能力为生成式AI在虚拟和增强现实领域的潜在应用开辟了新的可能性。
  • 定制化与微调:许多基于云的平台和开源框架(如IBM Watson X、Hugging Face和PyTorch)使组织能够使用其专有数据来训练和微调模型,从而产生更相关、更准确且更符合组织特定目标的输出。
  • 边缘计算与效率提升:一个新兴趋势是在边缘设备上部署紧凑且高效的生成式AI模型版本,减少对集中式云资源的依赖,并增强实时应用的性能。
  • 可解释性与透明度:随着新的生成式AI模型不断被开发,其复杂性也在增加。因此,提高这些模型的可解释性和可理解性变得非常重要,因为理解模型如何做出决策对于建立信任和问责制至关重要。

了解了这些趋势后,我们来看看生成式AI带来的具体影响。

由当前和新兴趋势驱动的生成式AI影响力正在不断扩大,波及商业和个人职业。它正在促进创新、提高效率,并在各个专业领域开辟新的机遇。

以下是生成式AI对商业和不同专业人士职业的一些影响:

  • 对商业的影响
    • 提升劳动生产率:通过简化工作流程和自动化重复性任务。
    • 加速研发:通过生成式设计。
    • 定制用户体验:以提升参与度和忠诚度。
    • 开创创新商业模式
  • 个性化体验:像AutoGPT和自定义GPT这样的个性化模型能够适应个人偏好和上下文,生成符合特定需求和兴趣的内容。OpenAI允许创建自定义版本的ChatGPT,结合多种技能。生成式模型在各种应用中提供高度个性化的用户体验,从推荐系统到虚拟助理功能。
  • 个性化学习:个性化学习平台利用生成式AI根据个人学习风格定制教育内容。
  • 创意与设计:AI驱动的生成设计工具有助于创造创新产品、艺术作品,甚至整个虚拟世界。
  • 加速科学发现:生成式AI通过生成新假设、分析海量数据集并根据分析建议实验设置来加速科学突破,这有助于更高效地进行实验。
  • 自动化行政任务:生成式AI助手可以自动化重复性任务、管理日程和处理行政工作,从而释放人类时间用于更具战略性的活动。
  • 数据洞察与报告:GPT模型正被用于自动化复杂数据集的分析,为企业生成富有洞察力的报告和建议。
  • 技术民主化:使用生成式AI的平台变得更加用户友好和易于访问,允许非技术人员利用该技术解决问题。开源计划也促进了AI技术的普及,推动了跨社区的协作与创新。
  • 人机协作:未来,人类和AI可能会紧密合作,利用彼此的优势实现最佳结果。AI将提供洞察和建议,而人类将利用这些基于数据的洞察和建议做出以结果为导向的决策。

生成式AI不仅重塑了各领域的商业,其本身也正在成为一个重要的商业领域。

生成式AI业务涵盖模型训练基础设施、大语言模型推理设备、专业软件、个性化助手以及加速编码的副驾驶工具。彭博智库预测,到2032年,生成式AI市场规模将达到1.3万亿美元,预计未来十年的年复合增长率为42%。

推动生成式AI发展的关键参与者包括Google、IBM、Microsoft、OpenAI、Hugging Face和Nvidia等行业巨头。随着生成式AI的采用率提高,新的就业机会将在提示工程、数据分析和AI伦理开发等领域涌现。市场对具备AI技能的专业人士需求巨大,因为公司正在积极寻找人才来实施和增强新的生成式AI解决方案。AI驱动决策的兴起也催生了新的角色,如AI伦理学家和AI训练师,从而影响了就业市场的动态。

本节课中,我们一起学习了生成式AI是一项快速发展的技术,其能力取得了显著进步。我们探讨了塑造其未来发展的当前及新兴趋势。我们了解了企业如何从生成式AI模型中受益,以及生成式AI本身如何成为一个关键的商业机遇。最后,我们发现了随着这项技术采用率提高而有望涌现的新就业机会。

067:生成式AI在商业领域的崛起 🚀

在本节课中,我们将探讨生成式AI如何迅速从一种新奇技术转变为商业领域的核心驱动力,并理解其对社会与创新的广泛影响。


阿瑟·C·克拉克曾有名言:任何足够先进的技术都与魔法无异。初次接触生成式AI时,它或许确实能唤起一种魔法的感觉。在我们的历史上,这是首次出现能够理解我们的语言、明白我们的请求并创造出全新内容的技术。

AI可以写诗、绘制超凡脱俗的图像、编写代码,甚至能用原创的笑话或音乐作品给我们带来惊喜与愉悦。它的创造行为常常能激发人们的惊叹。AI的影响不仅限于数字世界,也延伸至物理世界。若能恰当应用,可以想象AI将为发现与创新的速度带来何种变革。

上一节我们感受到了生成式AI的“魔力”,本节中我们来看看它如何解决现实世界的重大挑战。AI能为新材料发现、医学、能源、气候以及我们人类面临的诸多紧迫问题做出贡献。最终,我们的成功取决于我们如何对待AI。

回想你第一次听说“生成式AI”这个词,它大约在2022年11月或12月成为公众讨论的一部分。此后,我们见证了新模型的涌现、模型的演进以及开源模型的爆炸式增长。在不到一年的时间里,生成式AI已从一个迷人的新奇事物转变为新的商业必需品。

以下是其发展势头的具体表现:

  • 每天都有新的用例或应用被报道。
  • 增长如此迅速,以至于我们无法精确预测10年甚至10个月后的景象。

但我确信,你将希望积极参与塑造这一发展历程。AI的未来并非依赖一两个能为所有人做所有事的“全能”模型。它是多模态的,并且需要被民主化

这意味着我们需要借助开放科学与开源AI的能量和透明度,让所有人都能对“AI是什么、能做什么、如何使用以及如何影响社会”拥有发言权。你将有机会决定AI能做什么以及如何与你的业务整合。

综上所述,本节课我们一起学习了生成式AI从概念到商业核心的崛起之路,及其在推动创新和解决全球挑战中的潜力。现在,是时候开始规划如何有效、安全、负责任地将AI投入工作了。

068:通过生成式AI提升企业竞争力 🚀

在本节课中,我们将学习如何利用生成式AI来提升企业竞争力。我们将探讨“提升”的真正含义,了解负责任地采用生成式AI的关键步骤,并解释生成式AI模型如何增强各项业务功能。

什么是“通过生成式AI提升企业”?

“提升”意味着将AI系统负责任地融入业务流程,以对盈利能力、工作文化乃至整个社会产生积极影响。

“提升”不同于简单的“应用”。它超越了仅仅使用生成式AI,要求企业领导者付出坚定的努力,确保考虑到AI采用的所有方面。这些方面包括但不限于:

  1. 可行性分析
  2. 优先级排序
  3. 人才获取
  4. 风险管理
  5. 组织协同

可行性分析有助于识别最能从生成式AI中受益的业务功能。

哪些企业可以受益? 📈

任何企业,从跨国组织、中型企业到本地创业者,都可以利用生成式AI来提高其知名度和收入。

虽然银行、高科技和生命科学等行业可能看到最大的收入增长,但娱乐、体育、教育、制造和健康等其他行业也将受到影响。这是因为生成式AI有潜力彻底改变所有行业的业务功能。

生成式AI如何增强业务功能? ⚙️

生成式AI模型和工具已为多项业务功能带来了效率和创造力的提升。

以下是几个关键业务功能及其应用示例:

  • 客户服务:对话式生成式AI工具(聊天机器人)能根据每次客户互动调整语气和方式,从而减少问题解决时间并提高客户满意度。
  • 市场营销与销售:大语言模型分析客户行为和偏好,使营销人员能够定制广告、提供个性化推荐并增加客户互动。
  • 人力资源与运营:基础模型自动化常规任务并改进数据分析,减少人为错误并最大化生产力。
  • 产品设计与开发:扩散模型提供尖端技术,用于创造突破性的、独特的、个性化的视觉效果,提升客户参与度和品牌认知度。

然而,对于文本分类、风险评估、内容检索和客户细分等基本任务,你真的需要生成式AI吗?实际上,判别式AI模型更适合这些任务,因为它们通常能产生更准确的结果。

因此,任何企业都必须进行可行性分析与影响评估,以确定在何处应用生成式AI可以驱动价值和利润。

如何负责任地采用生成式AI? 🛡️

上一节我们介绍了生成式AI的应用潜力,本节中我们来看看企业需要遵循哪些关键步骤来负责任地采用它。

第一步:进行可行性分析

可行性分析需要:

  1. 定义问题以及生成式AI能提供的解决方案。
  2. 研究将生成式AI集成到工作流程中的影响。
  3. 评估劳动力需求。
  4. 选择生成式AI模型、用于预训练模型的数据集,并微调算法以交付所需的输出。

第二步:确定优先级

完成可行性分析后,领导者必须优先考虑那些能利用AI带来最大价值的业务功能。这与可负担性直接相关,因为生成式AI模型的训练和维护成本高昂。

这里还涉及方向选择:你是想专注于降低成本还是开辟新的收入来源

  • 为了降低成本,生成式AI可以通过自动化提高生产力,减少计划和执行中的错误,并缩短产品上市时间。
  • 为了开辟新收入来源,企业可以利用生成式AI预测场景、可视化结果并改进数据分析。

这些能力允许进行更多的实验和创新,并强化团队协作文化,因为员工可以将时间投入到更高价值和更具协作性的活动上。最终结果是销售额增长和客户保留率提高。

第三步:获取合适的人才组合

企业需要合适的人才组合。他们可以:

  • 外包AI特定任务,如构建、训练、部署和微调AI模型。一个由AI赋能者组成的生态系统提供了这方面的专业知识,包括像Hugging Face这样的开源平台和像IBM Watson X这样的专有工具。
  • 招聘新的AI内部专职人员,如AI开发人员、提示工程师和数据科学家,以监控和维护AI系统。
  • 提升现有员工的技能,以补充生成式AI的输出并与之协同工作。

第四步:管理风险与确保合规

当一切准备就绪时,需要考虑伦理和合规问题。如果企业不解决诸如版权侵权、数据隐私侵犯、低质量训练数据、算法偏见、幻觉以及安全、透明度和问责措施不足等挑战,采用生成式AI可能会损害品牌。

为了确保AI系统合乎伦理、值得信赖和负责任,企业必须减少偏见、跟踪模型漂移导致的性能变化,并向利益相关者和客户解释AI驱动的决策。

第五步:实现组织与工作流的协同

与生成式AI模型协同工作,要求团队成员调整新的工作流程、学习新的词汇并转变思维方式。例如:

  • 固定的流程让位于灵活的问题处理方法。
  • 像“神经网络”、“风格迁移”、“深度伪造”、“幻觉”和“过拟合”这样的词汇成为日常用语。
  • 人类的角色会根据AI能力的演变而不断调整。

总结 📝

本节课中,我们一起学习了如何通过生成式AI提升企业竞争力。

我们了解到,企业应负责任地将AI系统与业务流程融合,以对盈利能力、工作文化和社会产生积极影响。他们必须仔细考虑AI采用的所有方面,如可行性、优先级排序、人才获取、风险管理和组织协同。

谨慎地采用生成式AI可以提升企业的声誉和收入。赢得客户的数字信任、对员工和利益相关者保持透明以及防范伦理风险,有助于实现预期的成果。只要以合乎伦理的方式集成,生成式AI模型就能提升业务功能。

生成式AI基础:05:生成式AI供应商生态系统 🏢

在本节课中,我们将要学习生成式AI的供应商生态系统。我们将了解不同类型的服务提供商,探讨初创企业的兴起,并认识企业可用的各类生成式AI服务。


根据预测,到2025年,生成式AI将占据600亿美元全球AI市场的30%份额,并且很可能在2032年增长至1.3万亿美元。这意味着大多数企业将利用生成式AI来提高生产力和利润。报告显示,已有60%的组织在市场营销领域使用或探索生成式AI。

那么,企业是倾向于内部构建生成式AI,还是从市场购买呢?大多数组织选择购买而非自建。这样做的好处是:A. 可以安全地试验生成式AI;B. 节省训练和部署基础模型的时间与金钱;C. 利用市场上的尖端专业知识。

当企业在此领域寻求支持时,会遇到三类AI服务提供商:跨国公司生成式AI初创公司咨询公司。这些服务提供商为企业创造了机会,使其能够以多种方式利用生成式AI,例如:将效率融入工作流程、为客户提供更具创意和个性化的产品与服务、扩大运营规模并增加收入。


跨国公司的主导地位

AI市场的大部分份额由跨国公司占据,例如OpenAI、NVIDIA、Google、Microsoft、Meta、IBM和Amazon Web Services等。凭借在AI创新上的先发优势,这些公司正大力投资于基础模型、大语言模型、扩散模型及其他生成式AI工具。

在AI服务提供商中,OpenAI和Google是行业的先行者。它们的聊天机器人ChatGPT和Gemini已在全球消费者和企业中建立了相当大的信任。OpenAI的GPT系列大语言模型和Google的BERT模型为他人构建定制化的生成式AI解决方案奠定了基础。


生成式AI初创公司的兴起

与这些跨国公司竞争的是数百家生成式AI初创公司。它们的兴起得益于开源AI技术的普及、易于访问的应用程序编程接口(API)、云基础设施的进步以及用户和风险投资家的鼓励。

尽管2023年全球融资放缓,生成式AI初创公司仍筹集了100亿美元。这使得它们能够提供负担得起的、针对特定领域或业务功能定制的生成式AI工具,以满足市场需求。

以下是值得关注的一些初创公司:

  • Cohere:为企业构建多语言大语言模型。
  • Hugging Face:面向开发者的协作式AI社区。
  • Tabnine:为软件开发人员提供的代码编写AI助手。
  • Soundraw:免版税的AI音乐生成器。
  • Assembly AI:提供AI即服务。

咨询巨头的战略角色

生成式AI服务提供商的生态系统还包括咨询巨头,例如IBM Consulting、波士顿咨询集团、麦肯锡、埃森哲和邓白氏。这些公司就企业如何通过生成式AI获得战略优势提供建议。它们帮助企业识别能产生最大影响的业务职能,并通过建立道德准则或制定数据管理指南等方式来帮助管理风险。

例如,邓白氏利用IBM的Watsonx来帮助客户创建专有的生成式AI解决方案。


服务提供商的核心能力

企业可以期待这些服务提供商在以下方面提供支持:

  • 提升基础模型的多模态能力。
  • 整理数据集以消除算法偏见和幻觉。
  • 对LLMs进行微调和优化以提高准确性。
  • 为特定领域和业务功能定制模型。
  • 将生成式AI与现有软件和平台集成。
  • 提供LLM即服务,以帮助个性化解决方案、设计和部署模型、培训员工并提供技术支持。

凭借这些专业知识,企业能够为其消费者和利益相关者提供更好的价值主张。各行各业的初创公司能够通过以下方式克服传统的市场进入壁垒:使用对话式AI进行客户服务、快速创建内容用于营销和推广、进行产品和服务的情景预测,以及利用生成式设计来创新产品和包装。


服务提供商之间的协作

服务提供商之间也会进行协作,相互学习并促进生成式AI解决方案的采用。

以下是几个协作案例:

  • 两家跨国公司IBM和Amazon Web Services建立了一个创新实验室,供客户对生成式AI应用进行原型设计和测试。
  • IBM的Watsonx AI和初创公司Hugging Face共享其开源AI工具,以帮助开发者构建、测试和部署机器学习解决方案。
  • 麦肯锡将其专有的AI和数据模型与Salesforce的客户关系管理技术相结合,帮助企业改善客户购买体验和销售生产力。

业界普遍相信,AI将成为推动经济发展的最强大力量。


总结

本节课中,我们一起学习了生成式AI服务提供商的生态系统,其中包括跨国公司、生成式AI初创公司和咨询巨头。这些服务提供商帮助企业将效率融入工作流程、提供更具创意的产品与服务、扩大运营规模并增加收入。它们还通过协作,为消费者和企业提供更完善的生成式AI解决方案。

070:生成式AI对各行业的影响 🏭

在本节课中,我们将要学习生成式人工智能(Generative AI)如何作为一种变革性力量,深刻影响并重塑多个行业的运作方式。我们将探讨其在不同行业中的具体应用和价值。


概述

生成式AI是技术和商业领域的一股开创性力量,正在引领各行各业的深刻变革。麦肯锡2023年的一份报告指出,生成式AI预计每年将为全球经济贡献2.6万亿至4.4万亿美元,这展示了其为行业带来的巨大价值。

生成式AI在各行业的增长轨迹不仅体现在数字上,更代表了行业运作方式的根本性转变。它不仅仅是自动化任务,更是从概念设计到流程优化的全工作流精炼。生成式AI正在培育一种持续创新的文化,使行业能够更快地适应不断变化的需求和市场趋势。

生成式AI的变革潜力

生成式AI的变革潜力体现在多个方面。

以下是其核心能力:

  • 超个性化:想象一下,为客户提供个性化的体验、营销活动和产品推荐,所有这些都根据个人需求量身定制。
  • 数据洞察与决策:生成式AI模型可以实时分析海量数据,以预测结果、优化运营并在不同行业做出明智决策。其核心是模型 = 分析(数据)的过程。
  • 人机协作:生成式AI模型正在促进人类与AI之间的协作,以提升人类的创造力、生产力和效率。

生成式AI对几乎每个行业都有变革性影响。接下来,我们来看看它对几个主要行业领域的具体影响。

对高科技行业的影响

生成式AI对高科技行业的影响是深远且多方面的。

以下是具体应用案例:

  • 半导体设计:生成式AI正助力英伟达和高通等半导体公司进行电路优化,从而实现更快、更高效的芯片设计。
  • 网络安全:生成式AI让网络安全更智能。它可以创建攻击模拟来训练安全分析师和测试系统有效性,识别威胁并建立预测模型。例如,Palo Alto Networks公司利用生成式AI主动检测异常并预防潜在漏洞。
  • 软件开发:在软件开发中,生成式AI自动化重复性编码任务,并辅助测试和调试。像GitHub Copilot这样的生成式AI产品可以帮助开发者更快、更智能、更高效地编写代码。
  • 机器人技术与自动化:在机器人技术和自动化领域,生成式AI对于设计和控制能够持续学习和改进的自主机器人至关重要。特斯拉和波士顿动力等公司利用AI来增强机器人的灵活性和问题解决能力。

对制造业的影响

生成式AI有望彻底改变制造业格局。根据一份市场研究报告,制造业中生成式AI的市场规模在2022年为2.234亿美元,预计到2032年将超过63.988亿美元。

以下是其在制造业的关键作用:

  • 设计与创新:生成式AI通过自动化复杂任务以及快速创建和评估设计替代方案,加速了制造设计并促进了创新。例如,空客公司利用生成设计将飞机隔断墙的重量减轻了45%。
  • 流程优化:生成式AI可以模拟生产场景、简化各项任务并最大限度地减少停机时间。例如,西门子利用基础模型来优化生产流程并提高产品质量。
  • 供应链与库存管理:此外,生成式AI模型可以预测需求并优化库存水平。同时,生成式AI可以通过考虑成本、交付时间和可靠性等因素,创建最优的供应链模型。

对金融业的影响

在金融行业,生成式AI展现出自动化常规任务、改善风险缓解和简化金融运营的潜力。根据高盛的研究,生成式AI在金融领域的应用预计将使全球国内生产总值(GDP)增长7%,并将生产率提高1.2%。

在银行业,生成式AI有潜力增强人工智能已带来的效率。麦肯锡指出,如果生成式AI在银行业的应用案例得到全面实施,每年可能带来相当于2000亿至3400亿美元的额外价值。

以下是其变革方式:

  • 个性化客户体验:生成式AI通过预测客户的财务需求和行为来提供量身定制的建议,从而提升个性化客户体验。例如,摩根士丹利利用OpenAI驱动的聊天机器人来协助其财务顾问团队,通过分析内部研究和数据为客户提供即时、个性化的见解。
  • 风险评估与欺诈检测:此外,生成式AI能够通过广泛的数据集实现更准确的信用风险评估。同时,对交易和数据的实时分析有助于识别可疑活动,从而减少欺诈。

对零售与消费品行业的影响

根据麦肯锡的报告,零售和消费品行业通过利用生成式AI,每年有潜力创造4000亿至6600亿美元的价值。

对于消费品公司,生成式AI能够实现:

  • 个性化旅程与营销:个性化的客户旅程和营销活动。
  • 内容与运营:简化的营销和品牌内容、增强的聊天机器人以及动态定价。它可以聚合市场数据来测试概念、想法和模型。

消费品公司正越来越多地将生成式AI集成到其运营中。例如,雀巢正在使用生成式AI来验证新产品创意并创建市场研究报告。拥有Kate Spade等品牌的母公司Tapestry利用生成式AI实现在线个性化自动化。

对医疗保健行业的影响

在医疗保健行业,生成式AI正在重新定义药物发现、个性化医疗并加速医学研究。制药公司通常将约20%的收入用于研发,而开发一种新药平均需要10到15年。利用基础模型和生成式AI可以加速这一过程并产生巨大价值。

根据麦肯锡的数据,生成式AI可将药物开发成本降低高达40%,并缩短新药上市的时间。

跨行业影响总结

在不同行业中,生成式AI的潜力和影响因职能而异。例如,在高科技行业,最大影响将体现在软件工程领域;而在银行业,它将显著影响客户运营。在医疗领域,其影响将在产品和研发方面表现显著。营销和销售职能在各个行业中都受到高度影响。

大约75%的生成式AI应用案例所产生的预估价值集中在四个关键领域:客户运营、营销与销售、软件工程以及研究与开发

除了本视频涵盖的行业外,生成式AI还在影响其他领域,包括媒体与娱乐、教育、建筑、能源和农业。生成式AI不仅仅是一种趋势,它是推动下一波跨行业创新、效率和个性化体验的驱动力。


总结

本节课中,我们一起学习了生成式AI的影响,它正导致行业运作方式发生根本性转变。生成式AI正在影响各行各业,以重新定义工作流程、培育创新文化、实现超个性化、促成明智决策并提升创造力、生产力和效率。

生成式AI正在对包括高科技、制造业、金融、零售和医疗保健在内的不同行业产生深远且多方面的影响。

071:利用生成式AI实现业务就绪 🚀

在本节课程中,我们将学习专家们关于企业如何为采用生成式AI做好准备的讨论。我们将了解实现“业务就绪”所需的步骤、关键考量因素以及最佳实践。


概述

企业要准备好应用生成式AI,需要进行大量规划,并有条不紊地将这些技术融入日常活动中。这是一个循序渐进的过程。

实现业务就绪的步骤

上一节我们了解了业务就绪的重要性,本节中我们来看看实现它的具体步骤。以下是组织应遵循的关键步骤:

  1. 评估组织准备度:组织需要识别自身在技术、数据和人才方面的差距、挑战以及生成式AI带来的机遇。
  2. 制定清晰的战略与路线图:明确发展路径,确保团队对目标有统一的认识。
  3. 投资人才与技能:决定是培训现有的数据科学家和工程师,还是从外部引入领域专家和知识资源来赋能团队或外包部分任务。
  4. 构建数据基础设施:这是旅程中至关重要的一步。必须确保能够访问高质量的数据(这些数据将成为生成式AI模型的输入),并配备数据管理工具和运行这些模型所需的计算资源。

具体的实施路径

了解了宏观步骤后,我们来看看更具体的实施建议。企业可以从以下方面开始,逐步将生成式AI融入日常运营:

  • 从生成演示文稿或进行基础数据分析开始。
  • 在创建数据架构时引入生成式AI。
  • 利用生成式AI语言模型进行反馈分析、撰写反馈、编写电子邮件或处理特定任务和申请。

确保成功的核心要素

在开始实施后,确保成功还需要关注几个核心要素。以下是关键的成功因素:

  • 团队教育:通过研讨会等形式,教育团队了解生成式AI的基础知识及其在行业中的潜力。
  • 识别高价值应用场景:确定AI能在哪些领域(如市场营销、产品开发或客户服务)创造最大价值。
  • 跨部门协作:强调市场、设计和IT等部门之间的协作。
  • 建立坚实的数据战略:确保拥有高质量、安全的数据和清晰的治理政策。
  • 坚守伦理准则:制定明确的指导方针并定期审查,以确保负责任的AI使用。

通过持续学习、协作和关注伦理,企业可以释放生成式AI的变革力量,推动业务迈向未来。

趋势与建议

最后,让我们关注当前的趋势并给出总结性建议。最新研究表明,70%的人开始自学AI,而这一比例在过去低于30%,预计年底将接近100%。

因此,参加一些商业认证课程来学习AI及其在工作中的应用,并将其整合到自身角色中,对未来发展至关重要。这也是一个促进组织内部跨职能协作与知识共享的绝佳机会。

此外,组织还需与开源社区及不同部门建立伙伴关系和协作,设立检查点以确保关键绩效指标到位,并衡量生成式AI计划如何助力业务,以及如何持续改进。


总结

本节课中,我们一起学习了企业为采用生成式AI实现“业务就绪”的完整路径。我们从评估准备度、制定战略、投资人才、构建基础设施等步骤开始,探讨了从小处着手、逐步融入的实施方法,并强调了团队教育、跨部门协作、数据战略和伦理考量等成功要素。掌握这些要点,将帮助组织更稳健、更有效地踏上生成式AI的转型之旅。

072:运用生成式AI推动业务创新 🚀

在本节课中,我们将聆听AI专家关于如何运用生成式AI推动业务创新的见解。专家们将分享多个行业的具体应用案例,并为企业如何开始实施生成式AI提供实用建议。


概述:从审视业务流程开始

专家指出,企业开始实施和应用生成式AI的最佳方式之一是审视自身的业务流程。思考业务中哪些环节可以通过生成式AI变得更好、更快、更经济。任何需要人力参与的环节,生成式AI通常都能以更优的方式完成。

生成式AI特别擅长创建大量演示文稿,进行系统性数据分析。组织可以利用它在数据科学和数据工程应用中创建更好、更具预测性的模式。这是因为所有技术和信息的民主化,即使你不了解具体模型,生成式AI也能提供现成的模型,供你针对特定任务进行复用和应用。


生成式AI的行业应用案例

以下是生成式AI在不同领域和行业的一些应用,包括但不限于以下方面:

内容生成与个性化
例如,营销机构可以利用这项技术策划个性化的营销活动,生成作为广告发送给最终用户的电子邮件内容,并根据客户信息对这些信息进行个性化定制。

创意设计与视觉媒体
例如,时尚零售商可以利用AI生成的图像和创意方式,为其设计创建图像和视频。

产品创新与原型设计
例如,汽车公司可以利用生成式AI创建一些3D模型并模拟其设计,以提升性能、优化设计,确保以最高效的方式加速汽车开发。


创新的商业应用场景

生成式AI能够支持广泛的创新商业构想。

自动化内容创作
可以生成网站文案、发布更多文章、制作高质量的营销内容、博客文章、社交媒体内容及更新。

个性化客户体验
客户提供信息后,你可以利用AI修改、编辑这些信息,赋予其积极的视角,帮助客户改进。

自动化绩效反馈
在语言模型和此类技术的使用方面,一个很好的应用是为执行特定任务的个人创建更好的反馈。生成式AI可以仅通过提供任何个人绩效的关键点来生成反馈。企业中许多人必须处理的这些琐碎活动,可以很容易地通过这些技术实现自动化,从而节省时间。

设计与原型迭代
生成式AI可以通过创建产品图像或设计的多个迭代版本,来加速设计过程。关键在于能够快速迭代。我们都讨论过将产品交到客户手中的最快方式。你希望迭代、修改、让他人查看并再次修改。利用生成式AI技术,你可以更快速地完成这一过程。

自然语言处理
客户服务平台可以利用生成式AI与最终用户进行交互式聊天。

人工创造力与创新
例如,建筑事务所可以利用AI生成的建筑设计,超越创造力的边界,帮助他们找到新的创新方式。

预测分析
通过应用生成式AI,例如,金融服务公司可以利用它来预测投资结果,优化投资组合和策略,从而增强公司的决策和风险管理能力。

跨领域创新与协作
例如,举办虚拟时装秀,就是时尚与科技之间的一次协作。


实践案例:提升客服效率

专家分享了一个实践案例。在Skills Network平台上,有数百万学习者,偶尔会出现问题,学习者会创建客服工单。即使问题不常发生,海量的学习者也会产生大量工单,处理起来相当困难。

他们实施了一个AI解决方案,利用生成式AI来解析以任何语言提交的工单文本。AI知道如何将问题与其他类似问题归类,甚至会重写问题描述,使其非常清晰。这样,当团队需要去解决问题时,就能准确知道问题所在,而无需阅读学习者提交的大段文字。这为他们节省了无数时间,并且实施起来极其容易。


实施建议与总结

寻找那些可以改进的领域,尤其是那些由人力完成的、可能单调重复的工作,这些是替代为生成式AI的绝佳候选。

组织可以通过多种方式受益并实现自动化。同时,创造性方面需要得到更多鼓励。例如,如果你想生成一份特定的PPT,你可以生成风格指南,但注意不要分享公司的私有或机密信息。你可以利用生成式AI,根据AI模型提出的方面和模式来修改PPT。

另一个经常被提及的建议是:审视你的工作流程和业务,决定工作流程中哪些步骤需要人力,哪些步骤可以由AI完成,哪些步骤可以委托给虚拟助手。

此外,还有数据增强与合成。假设你正在进行一项研究,从客户那里获得了一些信息,但这些信息不足以让你做出任何定量决策。你实际上可以使用生成式AI,根据从客户那里观察到的情况来生成更多的响应数据。


本节课中,我们一起学习了AI专家关于运用生成式AI推动业务创新的核心观点。关键点在于:从优化现有业务流程入手,识别可由AI提升效率的环节;生成式AI在内容创作、设计、客服、数据分析等多个领域都有广泛应用;实施时,应注重人机协作,将重复性工作自动化,同时利用AI增强而非完全取代人类的创造力。通过具体的行业案例和实践分享,我们可以看到,合理应用生成式AI能够显著提升效率、激发创新并优化决策。

073:生成式AI领域的职业机遇 🚀

在本节课中,我们将探讨生成式AI领域的职业机遇。你将了解与生成式AI系统协作所涉及的任务、所需的核心技能,以及该领域内关键的专业角色。

组织使用生成式AI来减少人力投入和错误。然而,他们仍然需要雇佣和培训合适的人员来运用这项技术。这导致了AI专业人员的“重生”。与生成式AI系统协作所需的技能组合,已超越了单纯的AI经验。如今的AI专业人员来自不同学科,并根据其承担的具体任务扮演着多种角色。

核心任务概览

为了理解这些角色,我们首先需要了解在生成式AI领域工作的核心任务。

以下是构建和维护生成式AI系统所涉及的主要任务:

  • 数据管理与训练:你需要策划海量数据集来训练深度学习算法。
  • 模型测试与优化:你需要测试和优化生成式AI模型,甚至可能需要定制模型或将其与其他技术集成。这意味着需要通过整个生命周期过程对模型进行进一步的微调。
  • 治理与伦理:你需要良好的治理机制,以确保AI系统和组织员工遵循严格的道德准则。

所需的关键技能

执行上述任务需要技术专长、人际交往能力和坚韧不拔的态度相结合。只有这样,AI专业人员才能成功地与生成式AI协作。

以下是成功所需的关键技能组合:

  • 技术专长:机器学习、深度学习、自然语言处理、数学、统计学以及处理大型数据集方面的专业知识需求很高。建议掌握Java、Python、TensorFlow、PyTorch等编程语言的工作知识。
  • 软技能:具备分析和批判性思维、专注的问题解决能力以及创新和创造力会很有帮助。
  • 坚韧不拔的态度:为什么这是与生成式AI协作的关键方面?因为在此领域工作时,你必须持续跳出固有思维模式,解决复杂问题,反复调整算法,并展望这项技术的未来。生成式AI本身也在不断创新。因此,你必须做好充分的心理准备进入这个世界。

生成式AI领域的关键角色

现在,让我们来看看对生成式AI团队至关重要的具体角色。

以下是生成式AI领域中的一些核心专业角色:

  • 机器学习/AI工程师
  • 自然语言处理工程师
  • 提示工程师
  • 数据科学家
  • 计算机视觉工程师
  • AI研究科学家
  • AI伦理学家

接下来,让我们通过一些虚构的人物来具体了解这些角色的日常工作。

认识Eric,一位机器学习工程师。
他拥有多年线性代数、统计学和计算机编程经验。他设计和实现用于实际应用的生成式AI模型。这包括数据获取、选择合适的机器学习算法、开发模型、测试其准确性并部署它们。

认识Anita,一位自然语言处理工程师。
她拥有强大的语言学和编程技能。她的工作是训练和构建大型语言模型来处理人类语言,就像ChatGPT这样的LLM。她设计模型以响应查询,并执行语音识别、机器翻译、情感分析、文本摘要和其他NLP任务。

认识Jaffa教授,一位提示工程师。
她曾在当地大学教授心理学,后来参加了一个NLP夜校课程。她最近开始担任提示工程师,她的职责是编写清晰、相关且具体的提示,以测试生成式AI模型将如何响应。一旦她理解了算法的“思考”方式,她就可以帮助组织消除AI系统中的算法偏见并设置防护栏。

认识Manuel,一位数据科学家。
他在数据分析、统计建模和机器学习技术方面拥有丰富经验。Manuel负责为特定目的微调现有模型。这包括策划用于训练基础模型的海量数据集。他运用自己的技能,在训练AI算法之前从数据中提取有价值的见解、模式和知识。

认识Husseain,一位计算机视觉工程师。
他拥有计算机科学学位,精通C++,并具备应用数学知识。他的工作是训练机器处理视频和图像,使它们能够使用生成式AI识别物体和人脸。他能够执行图像合成和风格迁移等任务。他的核心职责涉及研究和实施先进的计算机视觉技术,这需要经常与他人协作。

认识Chen,一位AI研究科学家。
他运用自己在数学、统计学和编程方面的专业知识来开发新的AI算法、模型和技术。他的工作需要持续关注前沿研究,并将其应用于解决复杂问题。

认识Marianne,一位AI伦理学家。
她兼具技术和非技术知识。她熟悉基础模型及其能力,同时也精通伦理理论和社会科学,并利用这些来评估生成式AI对社会的影响。她制定详细的指导方针和政策,以克服数据偏见、缺乏透明度和版权侵权等问题。她的重点是确保组织负责任地使用生成式AI。

总结

本节课中,我们一起学习了生成式AI领域的职业可能性。你深入了解了可以扮演的专业角色,例如机器学习/AI工程师、自然语言处理工程师、提示工程师、数据科学家、计算机视觉工程师、AI研究科学家和AI伦理学家。每个角色都需要独特的技能组合,并在构建、优化和负责任地部署生成式AI系统中发挥着至关重要的作用。

生成式AI基础:第五课:利用生成式AI提升职业发展 🚀

在本节课中,我们将学习生成式AI如何为不同领域的专业人士赋能,了解其核心优势、具体应用、潜在风险,并掌握将其融入工作的具体步骤。

观看本视频后,你将能够:识别专业人士如何从使用生成式AI中受益;描述可被利用的具体生成式AI能力;列举与生成式AI相关的风险;并确定将生成式AI整合到工作中的步骤。

无论你身处哪个行业、哪个地区,扮演何种角色,生成式AI都能帮助你更快、更好地完成你所热爱的工作。你可以尝试免费的多领域大语言模型,或投资于特定领域的生成式AI工具。

生成式AI为专业人士带来三大核心益处:

  • 提升实验与创新能力:基础模型基于多学科数据训练,你可以通过提示词获取灵感或进行头脑风暴,用于创作视频、图像和演示文稿,甚至使用多种语言,从而提升工作的创造性与独特性。
  • 提升生产力与专业度:大语言模型可以自动化许多基础任务,为你节省时间,专注于更高价值的决策和问题解决工作,从而提升工作时间的商业价值。
  • 提升准确性与一致性:当我们工作陷入瓶颈或难以找到专家验证研究时,通过提出恰当的查询,大语言模型可以充当评审员、问题解决者和内容生成器,使你的工作更准确,更符合客户期望。

接下来,我们来看看不同领域的专业人士如何在日常工作中应用生成式AI。

以下是各行业专业人士使用的生成式AI工具示例:

  • 电影制作人:可使用Runway、Wonder Dynamics、Synthesia、Deep Brain AI和Metaphysic等工具,辅助剧本创作、内容本地化、预可视化、音效与视觉特效、剪辑与动态遮罩,从而提升叙事质量、优化制作流程并增强视觉创意。
  • 艺术家:可使用DALL·E 2、Midjourney、Canva AI和Jasper等工具,尝试不同的风景、抽象形状、色彩与纹理;自动化阴影处理、着色和新色彩/纹理生成等基础流程;并为作品添加替代文本和语音描述以提升可访问性。这使得艺术家能更专注于概念构思与创意完善,同时降低创作的时间与成本。
  • 律师:GPT-4在律师资格考试中取得了前90%的成绩,这表明大语言模型能像实习生和初级律师一样快速处理基础文书工作。律师可使用Casetext、Logikcull、Amto和Detangle AI等工具,通过生成式AI进行头脑风暴以获得不同视角;在语义层面自动比对合同与公司政策;并研究法律文档的模板与范例。这使得律师能更快地起草合同、通知和条款,从而腾出时间专注于战略谈判、客户获取与管理以及增值服务等高价值工作。
  • 市场营销人员:可使用ChatGPT、Jasper、Salesforce的Einstein GPT、GPT-4驱动的Rapidly和Flick等工具,赋能营销策略并自动化工作流程。借此,他们能更深入地洞察客户行为,并创建更有效的帖子和在线营销活动。
  • 建筑师与工程师:可使用Maket.ai、Finch和Tessellate Modulus等生成式AI工具,自动化整个建筑设计流程。它们还能基于承重能力、规范合规性或材料效率等特定参数生成数千种设计方案。这使得建筑师、施工工程师和室内设计师能够优化空间,创建可持续且高效的结构。
  • 新闻记者:媒体机构与大语言模型存在共生关系。许多AI公司利用媒体档案训练其模型,而记者则使用生成式AI来提高文章的准确性与时效性,并增加用户参与度。例如,Longshot AI、Google Journalist Studio的Pinpoint和Descript等工具专为现代新闻业设计。记者利用生成式AI扫描文本以识别假新闻、误导性内容或歧视;总结并识别有新闻价值的内容;撰写内容可预测的文章(如讣告、体育更新或天气预报);将文本转换为视频、信息图或插图;根据读者偏好生成个人新闻提醒;以及转录采访和文章以提升可访问性。
  • 金融分析师:像Planful Predict AI、DataRails、FP&A Genius和Anaplan Plan IQ这类大语言模型专门针对财务数据进行训练,在数据共享、情感分析、新闻分类和集成任务方面非常有效。这使得分析师能够通过利用生成式AI来增强协作与生产力,并做出更明智的决策。

通过整合生成式AI,你的工作日将融合AI的生产力与人类的判断力。然而,其中也存在风险。

以下是使用生成式AI时需要注意的主要风险:

  • 版权与知识产权:AI工具是否侵犯了专有数据的版权?机器生成的艺术品能否获得版权?你如何证明生成式AI应用未经同意复制了你的作品?
  • 输出不一致与“幻觉”:大语言模型虽然强大,但对同一提示可能产生不同回应,存在算法偏见,并且经常产生“幻觉”(即生成不准确或虚构的内容)。

因此,建议仅将生成式AI用于创建初稿,然后用自己的话重写内容。只使用那些对你而言完全合理的生成元素。

无论你从事何种职业,都可以从今天开始,通过以下五个步骤将生成式AI融入你的工作。

以下是开始使用生成式AI的五个步骤:

  1. 学习关键概念:阅读人工智能的核心概念。
  2. 获取认证:完成生成式AI相关课程并获得认证。
  3. 尝试免费工具:动手实验免费可用的工具。
  4. 启动个人项目:通过个人项目获得实践经验。
  5. 保持更新:持续关注最新研究,因为生成式AI在不断发展,你也应随之进步。

总结

在本节课中,我们一起探讨了生成式AI如何提升你的实验与创新能力、生产力与专业度以及准确性与一致性。然而,使用时需保持谨慎,因为大语言模型可能表现出算法偏见、侵犯版权或产生“幻觉”。请按照步骤,循序渐进地将生成式AI融入你的工作。

生成式AI基础:5.2:生成式AI在内容创作领域的应用 🎨

欢迎观看本视频。在本节课中,我们将探讨生成式AI在内容创作领域的几个主要应用场景,并讨论专业人士为充分发挥这项变革性技术的潜力所需掌握的关键技能。

内容创作已发展演变,并成为人力资源、市场营销、学习与发展、媒体制作、娱乐等多个领域的关键要素。生成式AI通过提供诸多益处,正在改变内容创作,例如:提高效率生成独特创新内容创建个性化内容以及提供数据驱动的洞察

以下是社交媒体管理平台Hootsuite进行的一项调查数据,突显了生成式AI在各领域内容创作者中日益增长的人气。

  • 根据调查,23%的美国作家使用生成式AI来保持良好的语法或生成情节构思和角色。
  • 此外,57.1%的营销人员使用生成式AI工具来创建博客、白皮书等长篇内容。
  • 同时,55.4%的营销人员用它来撰写社交媒体帖子和产品描述等短篇内容。
  • 另一份来自Seo AI的报告指出,17%的受访者确认在人力资源部门的招聘流程中使用生成式AI工具。

生成式AI在内容创作者中的普及度正随着不断涌现的激动人心的进展而演变。例如,像ChatGPT-4和Google Gemini这样的多模态模型能够无缝处理图像、代码和音频等不同格式。这为跨内容创作开辟了可能性,例如基于一幅画生成剧本,或生成配有相关图像或视觉场景的叙事。

生成式AI已变得更加适应性强,能够迎合特定的风格、语调和目标受众。这使创作者能够创建个性化和定制化的内容,例如个性化文章、学习教程和产品推荐。有趣的是,生成式AI正变得更擅长理解事物背后的“原因”,从而创造出更细致入微的作品,尤其是在教育材料领域。

作为内容创作者,考虑将生成式AI整合到日常工作中,以在竞争中保持领先。接下来,让我们探索生成式AI在不同领域内容创作中的一些应用。

人力资源领域

在人力资源领域,生成式AI可以自动创建职位描述和候选人问询。它可以个性化与候选人的沟通,分享有针对性的信息,定制面试问题,并根据候选人的偏好和经验提供相关信息。它可以生成入职文件和培训材料。AI驱动的聊天机器人可提供即时的人力资源相关支持,回答员工关于福利、薪资或政策的疑问。生成式AI可以从员工数据中提供可操作的洞察,使人力资源专业人员能够就人才管理、劳动力规划和员工敬业度策略做出决策。

以下是一些有助于执行上述任务的生成式AI模型和工具:OpenAI的GPT系列Google的Smart ComposeWriteSonic

市场营销领域

在市场营销领域,有多种生成式AI工具可供使用,例如JasperCopy.aiWriteSonic,用于自动化内容创作,从而节省时间和精力。这些工具可以创建社交媒体帖子和博客,为营销活动撰写电子邮件,并生成各种其他内容草稿,供人类营销人员完善和个性化。

生成式AI还可以通过提供有价值的洞察和改进建议来优化现有内容。借助生成式AI的多模态能力,营销人员可以生成令人惊叹的视觉效果,包括图形、AI艺术形式和视频,以增强他们的故事叙述、创建引人注目的社交媒体帖子或制作视觉上吸引人的演示文稿。

像GPT-4这样的生成式AI模型可以通过分析数据集并根据个人偏好和行为定制内容来创建超个性化内容。这可用于为目标公司设计个性化营销活动。

学习与发展领域

在学习与发展领域,生成式AI正使学习变得更加个性化。它通过分析学生的个人资料,了解他们的兴趣和已有知识来实现这一点。例如,如果一名学生通过音频课程比阅读更能理解事物,那么AI可能会推荐更多与其兴趣和先验知识相匹配的音频资源。

生成式AI还可以为在线平台创建评估和基于场景的模拟问题。这些资源有助于检查学习者对知识的理解程度以及他们具备的技能。它还可以通过创建有趣的讨论话题、引人入胜的案例研究和共同解决问题的活动来增强在线平台上的协作学习。这有助于人们记住所学内容,并鼓励他们进行批判性思考。

娱乐领域

在娱乐领域,生成式AI可用于为视频游戏、动画或虚拟世界创造有趣的角色。它可以分析来自电影、剧本和观众偏好的海量数据集,为叙事生成新想法,从而产生更具吸引力和针对性的内容。IBM Watson已被用于分析电影内容并制作电影预告片,包括最具吸引力和最激动人心的场景。另一方面,Netflix正在使用生成式AI来开发迎合个人偏好的个性化电影预告片。

生成式AI也通过简化内容创作、个性化和自动化社交媒体互动以及推动数据驱动的合作,对创作者或网红经济产生了巨大影响。它提高了在YouTube、TikTok和Instagram等平台上发布内容的质量和数量标准。生成式AI在内容创作中的辅助作用正在赋能市场上新兴的新一代内容创作者,同时帮助现有创作者扩大他们的发布规模。

接下来,让我们讨论专业人士为充分发挥这项技术的潜力应具备的重要技能。

  • 熟悉AI模型:熟悉不同的生成式AI模型、它们的能力、局限性和最佳实践,对于最有效地使用它们非常重要。
  • 提示工程:提示工程是设计引导AI模型生成所需内容的提示的实践。掌握提示工程是从AI工具获得最佳响应的关键。
  • 编辑与事实核查:确保AI生成内容的准确性通常需要仔细的编辑和事实核查。
  • 数据分析:理解如何分析AI工具生成的数据可以帮助你优化提示、跟踪内容表现并找出改进领域。
  • 模型选择与微调:知道如何选择合适的预训练模型并对生成的输出进行微调也很有价值。
  • 创造性协作:与生成式AI模型进行创造性协作是一个好方法。内容创作者应将AI建议整合到他们的工作中,并进行完善以符合他们的创意愿景。

在本视频中,我们学习了生成式AI正在改变人力资源、市场营销、学习与设计、娱乐等多个领域的内容创作格局。该模型还通过简化内容创作影响了创作者或网红经济。随着内容创作者拥抱这项技术,掌握必要的技能并利用正确的工具将是释放其全部潜力的关键。通过理解生成式AI的多样化应用,专业人士可以在内容创作中开启一段充满创意、效率和创新的旅程。准备好用生成式AI释放你的创造力吧。

076:生成式AI在IT专业领域的应用 🚀

在本节课中,我们将学习生成式人工智能(Generative AI)如何应用于信息技术(IT)领域的各个专业角色。我们将了解软件开发者、IT专业人员、数据科学家和DevOps工程师如何利用生成式AI工具来解决工作中的常见挑战,提升效率与创造力。


软件开发者如何应用生成式AI 💻

上一节我们介绍了课程概述,本节中我们来看看软件开发者如何借助生成式AI。软件开发者常面临编写重复代码、调试和文档撰写等耗时任务。

生成式AI工具,如 OpenAI CodexMicrosoft CopilotGitHub CopilotTabnineKite,能够:

  • 生成样板代码。
  • 为重复代码段建议补全。
  • 根据自然语言提示生成代码片段。

开发者可以利用这些工具分析代码变更、修复简单漏洞,并在代码审查过程中识别潜在问题。例如:

  • Visual Studio Live Share 可创建结对编程会话,工具作为编程伙伴实时帮助捕获错误。
  • Diffblue Cover 能生成测试用例,以实现更广泛、高效的测试。
  • Sphinx 可根据自然语言描述,为代码和系统生成文档。

通过使用生成式AI,软件开发者可以节省编码时间、加速软件开发、快速创建原型,并提高代码的可读性和可维护性。这使他们能将精力从修复重复性代码缺陷转向探索新想法,例如利用生成式AI编写概念验证项目的代码或尝试不同的问题解决方法。


IT专业人员如何应用生成式AI 🛠️

了解了软件开发者的应用场景后,我们转向IT专业人员。他们常面临人手不足、需处理大量例行系统管理任务的挑战。

生成式AI工具,如 RundeckAnsibleTerraform,能够:

  • 为系统管理、配置管理、用户配置、安全补丁等例行任务自动生成代码。
  • ElasticsearchLogstashKibana 可识别系统日志中的模式、异常和潜在问题。
  • Synthetic DataCloneOneMostly AISogetiHazy 能生成合成测试数据,用于系统预训练。

通过使用生成式AI,IT专业人员可以更早地检测安全威胁和性能差距、排查问题、避免手动创建数据、减少人为错误,并主动维护IT系统。此外,他们还可以利用生成式AI撰写知识库文章和聊天机器人对常见问题的回复,从而提高服务台的效率。


数据科学家如何应用生成式AI 📊

接下来,我们探讨数据科学家如何应用生成式AI。他们常遇到高质量数据稀缺、数据清洗和特征工程繁琐等问题。

生成式AI工具,如 Google AI PlatformVertex AIAmazon SageMakerMicrosoft Azure Machine Learning,能够:

  • 通过在合成数据集上训练和测试AI模型来克服数据稀缺问题。
  • 为数据清洗和预处理任务生成代码。
  • 根据数据建议并生成特征。
  • H2O Driverless AIDataRobot 可创建交互式可视化报告,以传达复杂的数据洞察。

通过使用生成式AI,数据科学家可以提高模型微调过程的效率和预训练数据的质量,从而帮助他们做出更明智的决策并节省时间。他们甚至可以利用生成式AI来构思新功能或从现有数据中捕捉洞察。


DevOps工程师如何应用生成式AI ⚙️

最后,我们来看看DevOps工程师的应用。他们负责管理持续集成和持续部署(CI/CD)流水线,确保应用交付的顺畅与可靠。

生成式AI工具,如 JenkinsGitLab CI/CDCircleCI,能够:

  • 自动化CI/CD流水线的各个阶段,例如自动生成测试用例并部署应用。
  • 发出警报并提供洞察,以改进监控和故障排除。
  • 建议优化基于云环境的基础设施的代码。
  • Terraform 可自动化生成基础设施即代码(IaC)脚本。

通过使用生成式AI,DevOps工程师可以促进基础设施管理、自动化测试和部署,并加速软件发布周期。这有助于他们确保自动化流程的可靠性和安全性。


使用生成式AI的挑战与应对 🧐

尽管生成式AI带来了诸多好处,但其模型也存在一系列风险,包括:

  • 高昂的图形处理器(GPU)成本
  • 算法偏见
  • 可能的滥用
  • 缺乏透明度
  • 数据安全措施不足
  • 版权侵权问题
  • 应用缺乏监管

IT专业人员通过积极实践生成式AI,可以主动应对这些已知和未知的限制,帮助改进基础模型的能力。这将进一步有助于提升他们自身的生产力和创造力。


总结 📝

本节课中,我们一起学习了软件开发者、IT专业人员、数据科学家和DevOps工程师如何应对时间有限、资源不足和流程中断等挑战。通过使用生成式AI工具,他们能够自动化重复性流程,从而提高生产力并改善决策。同时,他们也能通过应对基础模型的局限性,助力AI技术的不断演进。

077:生成式AI在领导力与管理领域的应用 🧭

在本节课中,我们将探讨生成式AI如何赋能领导者与管理者。我们将了解这两个角色的核心任务与挑战,并学习他们可以如何利用生成式AI的能力来优化决策、提升效率,从而为组织创造价值。

领导者的角色与挑战

上一节我们概述了课程目标,本节中我们来看看领导者的具体职责。领导者负责定义组织的愿景,而管理者则负责执行该愿景。这两个角色都需要持续且专注的决策。

领导者面临着一项关键责任:引导公司朝着正确的方向前进。这包括每天做出执行层面的决策,以优化组织的运营、财务和品牌形象。尽管领导者花费大量时间参加会议和阅读报告,他们仍然在收入增长、时间管理、营销策略和领导义务方面面临挑战。

生成式AI如何帮助领导者

面对这些挑战,生成式AI可以提供有力支持。生成式AI模型能够处理海量数据并模拟多种场景与结果。这使得决策者能够查看关于市场分析、风险评估和增长策略的复杂报告,并提前可视化其决策的影响。

通过使用生成式AI工具,领导者可以采用一种全新的问题解决和决策方法,这有助于提升人员效能和利润。当组织愿景明确时,管理者就能专注于交付成果。

管理者的角色与挑战

接下来,我们转向管理者的视角。管理者需要每天做出决策,以确保项目符合既定的预算、质量和截止日期。然而,项目管理本身伴随着诸多挑战,例如范围蔓延、技能缺失、团队目标不一致、利益相关者期望以及沟通不畅。

根据项目管理协会的数据,由于项目绩效不佳,高达11.4%的商业投资被浪费。管理者能否利用生成式AI来减少这种浪费呢?

生成式AI如何帮助管理者

答案是肯定的。生成式AI工具可以自动化重复性任务,例如规划、日程安排、沟通、资源分配以及跟踪与报告。例如,它们可以:

  • 创建文档和可视化数据报告。
  • 根据团队成员的技能分配所有项目任务。
  • 提供实时反馈、警报和建议。

有了这些输入,项目经理就能够做出数据驱动的决策,识别瓶颈并降低风险。具体而言,他们可以:

  • 投资于构思和创新。
  • 让利益相关者参与早期问题解决。
  • 监控和控制项目进度。

成功采用生成式AI的步骤

最后,我们探讨如何将生成式AI整合到工作流程中。虽然无需急于在短期内投资过多AI,但为了成功采用AI,有必要了解如何与生成式AI协作,并将其负责任地整合到工作场所和流程中。

以下是您可以考虑的四个步骤:

  • 协作:领导者应争取管理者、员工、利益相关者和顾问的支持,无需独自做出决定。
  • 优先排序:确定您希望首先解决的业务问题是什么。
  • 验证:验证AI模型生成的数据的准确性及其与公司价值观的一致性。
  • 决策:决定使用什么数据以及何时使用。生成式AI模型会分析、整理和可视化数据,但领导者和管理者必须运用他们的经验、社交智慧和创造力来决定如何使用这些数据。

总结

本节课中,我们一起学习了生成式AI如何帮助领导者模拟多种场景,从而提前预判结果并以不同方式处理问题。同时,它也通过任务自动化帮助管理者控制项目进度,使其在规划、调度、沟通、资源分配以及跟踪报告方面更高效。为了实现成功的AI应用,业务团队应遵循协作、优先排序、验证和决策的步骤,并充分发挥自身的经验、社交智慧和创造力。

078:创建自定义GPT 🛠️

在本节课中,我们将学习如何创建自定义GPT。我们将通过两个具体的演示,展示从零开始构建一个专用AI助手的过程,涵盖从简单对话到集成代码和图像生成的进阶功能。

概述

自定义GPT是OpenAI提供的一项功能,允许用户根据特定需求定制化自己的AI助手。本教程将分步演示创建两个不同用途的GPT:一个用于辅助面试,另一个用于生成艺术并转换为3D打印文件。我们将学习使用GPT构建器聊天机器人以及配置菜单中的高级设置。

演示一:创建面试助手

首先,我们来看如何快速创建一个用于辅助面试的GPT。

要开始创建,你需要访问 chat.openai.com/gpts。页面会显示GPT商店,其中列出了许多用户创建并分享的自定义GPT。要创建自己的GPT,只需点击右上角的“创建”按钮。

进入GPT编辑器页面后,你会看到左上角有两个按钮:“配置”和“创建”。点击“创建”会进入GPT构建器聊天机器人界面,这是创建自定义GPT最简单的方式。

构建器首先会询问:“你想制作什么?” 为了演示,我将创建一个面试助手,用于帮助我针对一份特定的职位描述进行面试。

我输入:“我想要一个面试助手,帮助我针对附上的职位描述进行工作面试。” 然后,我上传了一份职位描述的PDF文件。文件上传后,我发送消息。

GPT构建器开始分析我提供的内容,并开始定制和更新我正在构建的GPT。它回复说:“很好,我已将此GPT设置为软件开发实习生职位的面试助手。” 它已经理解了职位描述信息,并建议将GPT命名为“面试助手”,同时正在生成一个头像。

我确认名称和头像都合适。此时,我可以通过继续与聊天机器人对话来进一步定制GPT,但就目前而言,这已经足够。

在右侧,我可以立即开始使用和测试这个GPT。例如,我输入:“为此职位生成五个面试问题。” GPT会立即根据职位角色生成一系列面试问题。

这个GPT的强大之处在于,我还可以上传一份简历的PDF,以获得更具体的问题。创建这个GPT的过程非常简单快捷。在短短几分钟内,我就获得了一个不仅可以帮助我进行面试、且高度针对特定职位描述的GPT。我还可以通过右上角的“保存”按钮将其分享给同事或其他进行面试的人。

演示二:配置高级自定义GPT

接下来,我们深入探索“配置”菜单中的所有设置,通过一个新的演示来创建一个功能更复杂的GPT。

我返回并创建一个新的自定义GPT。这次,我直接从“配置”菜单开始。在这里,我可以自定义GPT的每一个方面。

对于这个演示,我将创建一个自定义GPT,它首先生成一种名为“单线艺术”的特殊艺术形式,然后从该艺术生成一个STL文件(一种可用于3D打印的文件)。

首先,我为它命名:STL生成器
描述为:“我创造艺术,并将其转化为可3D打印的STL文件。”

对于指令,我粘贴了一些预先写好的自定义指令。这些指令包含几个关键部分:

  • 你的主要重点是根据用户描述,使用独特且极简的单线绘图技术创作艺术。你的艺术作品必须是黑白的,并且不能有背景。
  • 我给出了更多关于如何创建这种单线艺术的规则。
  • 然后我说明:在你创建艺术之后,你可以将其转换为STL文件。要转换,请使用以下代码。我提供了一段Python代码,用于将艺术图像转换为STL文件。

你并不一定需要使用代码,但使用代码可以让你对功能的实现更有信心。我将代码粘贴到了指令框中。

接下来是“对话开场白”。这些是当其他人使用你的自定义GPT时的帮助提示。例如,我设置了一个开场白:“创建一头猪的艺术。” 这会添加一个按钮,用户只需点击即可将此内容作为第一条消息发送。

然后是“知识库”。我们在上一个例子中使用了它(上传了职位描述PDF),但这次暂时不使用。

接下来是“功能”:

  • 网络浏览:允许你的自定义GPT浏览网页以获取信息。
  • DALL·E图像生成:允许你的自定义GPT生成图像。
  • 代码解释器:允许自定义GPT实际运行Python代码。

对我们重要的两个功能是 DALL·E图像生成(用于生成单线艺术)和 代码解释器(用于实际运行代码将图像转换为STL文件)。

最后是“操作”。这可能是自定义GPT中最强大但也最复杂的功能。它允许你将自定义GPT连接到网络上的外部服务,以执行超越聊天的实际任务。这是一个更高级的主题,本次暂不涉及。

配置完成后,我们的STL生成器GPT就准备好了。我可以点击对话开场白“创建一头猪的艺术”来测试它。

GPT会开始生成我们的单线艺术。它生成了一幅遵循正确单线艺术风格的黑白图片。在图片下方,它显示“正在分析”,并开始运行代码(应该与我提供的代码等效)。这段代码将图片转换为3D打印文件。

完成后,它会显示:“猪的单线艺术已成功转换为STL文件。你可以使用下面的链接下载STL文件。” 点击按钮,我就获得了猪的单线绘图STL文件。最终,3D打印顺利完成,效果很好。

总结与要点

本节课中,我们一起学习了创建自定义GPT的两种方法:通过简单的对话构建器快速创建专用助手,以及通过配置菜单进行深度定制,集成图像生成和代码执行等高级功能。

最后有几点需要明确:

  1. 不需要自己编写代码来创建自定义GPT。如果你不输入任何代码,GPT会尽力为你填充内容。
  2. 然而,你在自定义GPT上投入的越多,得到的回报也越多。如果你想在GPT商店中获得欢迎,或者想创造真正出色的东西,可能需要投入比几分钟更多的时间。
  3. 这些GPT最令人惊叹的一点是它们的创建速度之快和难度之低。只需几分钟,无需任何代码,你就可以在网络上创建一个应用程序并与他人分享。这在以前是无法实现的,尤其是如此快速且无需编码。因此,请思考哪些用例对你有意义,可能性非常广泛,未来充满希望。

生成式AI基础:05:专家观点:通过生成式AI实现创新变现 💡

在本节课中,我们将聆听行业专家的见解,探讨如何利用生成式AI技术创造商业价值并实现盈利。专家们将从多个角度分析生成式AI的应用场景和变现途径。

提升效率与数据分析

生成式AI最大的应用之一是帮助企业提升效率和利用预测分析来创造利润。通过减少在特定任务上投入的人力时间,可以更好地利用人力资源。分析模式和现有数据是生成式AI的强项,它擅长识别和生成模式。

数据增强与合成

其次,生成式AI可以节省收集信息和数据的时间。如果你拥有足够规模的样本集,生成式AI能够生成性质相似的合成数据。数据增强和合成数据创建本身就是当今各行业从生成式AI中获得的一项强大能力。

变现途径概览

以下是AI专业人士和初创公司可以利用生成式AI创造利润和收入的一些方式。

提供AI服务与咨询

帮助客户开发和利用内容生成工具进行变现,这些工具可以协助创建文本、图像。

开发自动化平台

构建自动化平台,帮助终端用户进行创意内容创作。创意服务和产品也属于这一范畴,因为生成式AI能协助完成建筑设计、艺术作品、音乐作曲或图像生成等创意工作,从而创造收入。

实现差异化竞争

如今,任何人都能轻松使用ChatGPT、Midjourney等生成式AI工具。因此,如果你要创建一家初创公司或AI企业,最重要的一点是实现差异化。打造一些无法通过现有工具轻易完成的产品,这可能意味着融合多种模态,例如混合文本、图像、视频来创造独特、不同的内容,解决用户需要花费大量时间才能自行完成的问题。

提供培训与咨询

技术变化非常快。如果你能紧跟技术发展,就会有很多培训机会。许多组织都在寻求提升员工技能的方法。因此,任何形式的咨询和培训,如果你懂得如何构建模型、编写代码,都存在大量市场机会。

解决行业痛点

一个被忽视的市场是:你不需要仅仅构建一个AI产品,你需要做的是为某个行业解决一个问题。如果你曾在某个岗位工作,那里存在一个普遍痛点,想办法用AI,特别是生成式AI来解决它,这会容易得多。

市场分析与营销策略

当然,利润也可以通过分析市场场景来获得。例如,创建更精准的广告,根据人群基础或市场调查创建不同的策略,为你提供的产品或服务制定最佳的营销和使用策略。初创公司确实拥有生成式AI这个强大的工具,可以尝试个性化他们的目标策略。

其他变现模式

另一种方式是为社区提供培训和研讨会,提供材料和一些认证项目。

AI驱动的产品增强

通过将生成式AI集成到终端用户或客户已有的产品或平台中,以增强其服务或基础设施,是另一个可考虑的替代方案。

数据增强平台

提供基于订阅或按使用量付费的定价模型,让用户访问生成的合成数据,也是一个可能的方式。

创建AI产品

显而易见的方式是创建AI产品。有时,你构建的一些小工具,可能没想过可以将其转化为AI产品。这样做的好处是,你可以先构建独立的AI产品,然后审视一个能将这些产品整合起来的整体方案。大语言模型非常适合做这种编排工作,也有像LangGraph这样的工具,可以帮助你构建和识别图谱节点,然后由图谱和LLM来决定何时以及如何执行这些工具。这对你的组织有很多好处,可以将许多事物整合起来。所以,再次强调,找到一个你感兴趣的需求,在那个细分领域开发产品,然后将其销售出去。

总结

本节课中,我们一起学习了专家们关于生成式AI变现的多种观点。核心路径包括:通过提升效率和数据分析直接创造价值、利用数据增强能力、提供专业服务与解决方案、开发差异化产品、以及针对行业痛点提供AI驱动的增强服务。关键在于将生成式AI视为解决实际问题和创造独特价值的工具,而不仅仅是技术本身。

080:运用生成式AI提升商业领导力 🚀

在本节课中,我们将探讨商业领导者如何有效利用生成式AI来提升领导力、优化决策并加速业务发展。我们将了解生成式AI在战略规划、内容创作、流程优化等多个核心商业领域的应用方式。


上一节我们介绍了生成式AI的基本概念,本节中我们来看看它在商业领导力中的具体应用场景。

商业领导者可以将生成式AI融入日常工作,以加速和自动化部分任务。以下是几个关键的应用领域:

内容生成与营销
管理者可以利用生成式AI自动创建营销内容。这个过程可以帮助他们为社交媒体帖子、电子邮件通讯或营销活动生成更具创意的材料,优化信息传递,并创造更多能与最终用户和客户互动的内容。其核心是让AI根据指令自动生成文本,例如:

# 伪代码示例:AI生成营销文案
marketing_copy = generative_ai.generate_content(topic="新产品发布", tone="兴奋", platform="社交媒体")

产品设计与创新
领导者可以借助AI探索新想法、快速迭代设计,并基于AI生成的洞察优化产品功能。这能帮助团队更高效地进行头脑风暴,并比纯人工方式更快地获得更好的产出。

战略决策支持
对于高管而言,生成式AI可以辅助战略决策。通过一个逐步的过程,领导者可以借助AI访问他们以前无法接触的专家智慧。他们可以汇集金融、营销、销售等领域的顶尖思想,生成回应、信息和创意,并将其带入战略规划会议。随后,可以与AI协作,更快地构建和完善这些想法。其核心价值在于:
AI处理海量数据并提炼优先级的能力 >> 单人脑力

客户数据分析与个性化
AI可以帮助分析客户数据,得出可行的洞察,用于个性化推荐和营销策略,从而提升客户服务质量。

预测分析与决策支持
生成式AI可以基于历史数据和市场趋势生成预测、预报和情景分析,为商业领导者提供决策支持。这有助于领导者做出更明智的决策,降低风险并识别增长机会。

流程优化与自动化
在供应链管理、库存预测和资源分配等领域,AI可以帮助优化和自动化流程,提升运营效率。

风险管理与合规
领导者可以利用生成式AI来检测异常、识别潜在风险或合规问题,从而主动应对挑战,确保符合监管要求。


需要记住的关键点是,AI的目的不是取代人类,而是作为一种强大的工具来增强人类的能力。AI能够处理远超个人脑容量所能承载的海量数据,并将其综合、提炼、优先排序,这对组织来说是巨大的价值。

对于企业高管而言,将AI整合到工作流程中,可能是能为组织做的最有益的事情之一。因此,积极寻找适合高管工作的AI解决方案至关重要。


本节课中,我们一起学习了商业领导者运用生成式AI的多种方式,包括内容生成、产品创新、战略决策支持、客户洞察、预测分析、流程自动化以及风险管理。核心在于,AI是处理信息、激发创意和优化流程的强大伙伴,能帮助领导者更高效、更明智地推动业务发展。

081:借助生成式AI拓展职业视野 🚀

在本节课中,我们将聆听行业专家分享关于生成式AI领域新兴职业机会的见解。专家们将详细阐述当前及未来市场对各类技能人才的需求,帮助你了解如何借助生成式AI技术拓展自己的职业道路。


概述

随着生成式AI技术的持续发展和进步,市场对具备相关技能的专业人士需求日益增长。专家指出,从提示工程到伦理咨询,一系列新的角色和职责正在涌现,为不同背景的人才提供了广阔的机遇。

核心职业机会详解

上一节我们概述了生成式AI带来的职业浪潮,本节中我们来看看专家们具体提到的几类高需求岗位。

以下是专家们重点提及的几个关键职业方向:

  • 提示工程师:掌握提示工程技能、擅长使用生成式AI生成所需输出的人才非常稀缺,市场需求旺盛。这本身就是一个高回报的职业机会。
  • 数据分析与数据科学:在数据分析、数据科学或任何与数据相关的应用中,生成式AI都至关重要。对于初学者而言,它是一个很好的基础工具,可以用来收集背景信息、开发特定场景所需的输出。
  • AI研究科学家:需要更多AI研究科学家来推进该技术的理论基础和实际应用。
  • 机器学习工程师:需要机器学习工程师来帮助设计、实施和部署这些模型,以满足不同领域和行业客户的实际应用需求。
  • 数据科学家:需要更多能够分析海量数据以获取洞察的数据科学家,他们可以利用生成式AI进行数据增强、模式识别和异常检测。
  • 计算机视觉工程师:使用该技术分析视觉信息。
  • 自然语言处理工程师:使用该技术分析自然语言数据,应用于文本生成、情感分析和语言翻译等场景。

技术与实施相关角色

除了直接应用AI的岗位,支撑AI系统构建和落地的技术角色同样至关重要。

以下是围绕数据工程、软件开发和产品化流程的关键职位:

  • 数据工程师:涉及大量数据工程工作,例如清理和整理数据。如果你有ETL(提取、转换、加载)背景,即擅长将数据从一处迁移到另一处,这将非常有用。许多人正尝试将数据整合到大型数据湖中,以便基于单一的数据结构或存储来训练模型。
  • 开发运维工程师:如果你是一名习惯于部署流程、理解DevOps、知道如何将产品推向生产环境并了解相关测试的软件开发人员,那么你可以在这些方面表现出色,并帮助团队将产品投入生产。
  • AI伦理顾问:我们需要AI伦理顾问来帮助定义和制定伦理指南、评估风险,并确保在开发和部署阶段实现负责任的AI,以便我们在实际应用这些模型时能够信任它们。
  • 领域顾问与专家:还需要一些在该领域具有专长的咨询服务顾问和专家。

产品、管理与创意交叉领域

生成式AI的生态不仅需要技术人员,还需要产品管理者、平台构建者以及创意人才来推动技术的普及与创新。

随着技术普及,更多岗位应运而生:

  • 产品经理:产品管理的需求将会增加。一些公司(如IBM、Google、Facebook)为终端用户创建平台以访问这项技术,同时它们也开发和训练这些大语言模型,这创造了相关产品管理职位。
  • 创意技术专家:这也为创意技术专家开辟了新的工作机会,他们致力于寻找不同应用的交叉点,例如艺术、设计与技术的结合。

总结

本节课中,我们一起学习了生成式AI领域多样化的职业路径。从构建系统核心的机器学习工程师,到从数据中挖掘模式的数据科学家,再到推动技术前沿的AI研究科学家;从设计友好界面的UI设计师,到确保技术向善的AI伦理与政策专家;如果你热爱将想法变为现实,可以成为AI产品经理,指导世界级产品的创造。当前,围绕AI特别是生成式AI的职业机会正在爆发式增长,为拥有不同技能组合的人才提供了前所未有的机遇。

posted @ 2026-03-26 08:50  布客飞龙II  阅读(0)  评论(0)    收藏  举报