GregBrockman实时解锁ChatGPT新能力构建面向AI的工具真正实现人机共

译/f.chen@真格基金

- 总结 -

「我们必须脚踏实地,逐步前行,以走过的每一步为基础。 我认为现在最重要的是,所有人都要熟练掌握这项技术,找出如何向机器提供高质量的反馈,并决定我们想从中得到什么。」

在本周的 TED 2023 大会上,Greg Brockman 将他的笔记本电脑直接投影到了 TED Theater 的大屏幕上,实时演示了一系列令人惊叹的 ChatGPT Plugins:

- 首先,他 在 ChatGPT 中实时 完成了几项任务,包括设计食谱,生成食物图片,草拟相关推文并在 Instacart 中创建相应的购物清单,全程未离开聊天界面 —— 基于此,他提出了对新型用户界面呈现方式的设想;

- 随后,他演示了 ChatGPT 的两项新功能,包括对自身结果进行事实性核查(带有可点击的引用链接)和接收到相对模糊的指令后解释数据密集型电子表格的能力。

Greg 表示,ChatGPT 的搭建思路是 让机器学 习「与用户意图对齐」。 就像人类可以在不给出精确指令的前提下教孩子完成任务一样,AI 也可以通过用户反馈循环逐渐将已学会的知识应用于新情境 —— 他希望用户反馈循环能成为人类和 AI 之间深入、可信任的合作的基础,由此 AI 页可以不断完成更困难的任务 —— 但 机器只是执行者, 人类将始终是这些任务的管理者和监督者。

当然,Greg 也承认,面对 AGI 的潜力,许多人都感到紧张,但他仍坚持认为,这项技术将为每个人创造更美好的世界,但实现这一目标需要循序渐进,首先需要人们熟练掌握 AI 技术本身并向其提出高质量反馈,使机器真正产出人类所期待的结果,而最关键的,是在整个过程中 人们对 AI 监管边界的广泛参与和投入 。

- 原标题 - The inside story of ChatGPT's astonishing potential

GregBrockman实时解锁ChatGPT新能力构建面向AI的工具真正实现人机共-2

七年前,我们创立了 OpenAI,因为我们觉得人工智能(AI)领域发生了一些非常有趣的事,我们希望可以帮忙引导它朝着积极的方向发展。自那以后,整个 AI 领域的进步真的非常惊人。听到像 Raymond 这样的人正在使用我们开发的以及其他 AI 技术来做很多很棒的事,真的很令人满足。 我们收到了兴奋的、担忧的以及同时拥有到这两种情绪的人的来信 —— 老实说,这也是我们的感受。 最重要的是, 我们认为现在人类正在进入一个新的历史阶段,在这个时期中,世界上所有的人将共同定义一种对我们的社会非常重要的技术,我相信我们会为了更好地管理这个技术而努力 。

所以今天,我想向大家展示 这项技术的当前状态以及我们看重的一些基本设计原则 。

首先,我要展示的是, 一个面向 AI 而非人类的工具是什么样子。 我们有一个新 DALL-E 模型,可以生成图像,现在,我们让它成为 ChatGPT 的应用程序,让 ChatGPT 代表人类使用这个模型,例如,用户可以让它帮忙想想在 TED 演讲后可以吃一顿怎样的晚餐,并画出来。

GregBrockman实时解锁ChatGPT新能力构建面向AI的工具真正实现人机共-3

用户可以与 ChatGPT 进行所有与构思和创造相关的交流,它也能处理细节问题,接下来,我们不仅可以得到关于餐点的构思,还可以得到非常详细的图像展示,让我们看看会得到什么。

GregBrockman实时解锁ChatGPT新能力构建面向AI的工具真正实现人机共-4

GregBrockman实时解锁ChatGPT新能力构建面向AI的工具真正实现人机共-5

GregBrockman实时解锁ChatGPT新能力构建面向AI的工具真正实现人机共-6

在这种情况下,ChatGPT 不仅可以生成文本,还可以生成图像,这真正扩展了它代表用户执行想法或意图时的能力。另外,我要指出的是,这是一个实时演示,这一切都是由 AI 在我们说话时生成的,而且实际上,甚至我也不知道我们将会看到什么。但,这看起来太棒了,我看着它就已经饿了。

GregBrockman实时解锁ChatGPT新能力构建面向AI的工具真正实现人机共-7

目前,我们还使用其他工具扩展了 ChatGPT 的能力,例如记忆。用户可以说「将这些保存下来,以后再用」。 有意思的是,这些工具的运行原理非常易于检查。 用户会在这里看到一个小弹出窗口,上面写着 「use the DALL-E app(使用 DALL-E 应用程序)」 (顺便说一下,所有 ChatGPT 用户都将在未来几个月内获得这个功能),用户可以查看它的内部工作机制, 看到它是如何像人类一样编写提示词的 —— 用户拥有这种检查机器如何使用这些工具的能力,这反过来也使我们能够向这些工具提供反馈。

GregBrockman实时解锁ChatGPT新能力构建面向AI的工具真正实现人机共-8

现在 ChatGPT 已经保存好了结果,让我来向大家展示 AI 如何使用这些信息以及如何与其他应用程序集成。用户可以说:「现在基于之前建议的美食做个购物清单。」并且还可以让 AI 尝试一下难度更高的任务,例如,「并在Twitter 上发布给所有的 TED 观众。」如果有人真的做出了这道食物,我真的想知道它的味道如何。

GregBrockman实时解锁ChatGPT新能力构建面向AI的工具真正实现人机共-9

但是,大家也可以看到, 在任何情况下,我都没必要明确告诉 ChatGPT 要选择哪些工具 —— 我认为, 这展示了一种新的用户界面呈现方式的可能性。 我们习惯于认为,通常情况下,面对应用程序,用户只要知道了菜单和所有选项,那么通过在它们之间单击、复制/粘贴就能获得非常好的产品体验。 但通过在工具之上使用统一的语言界面,AI 能够帮助用户省去所有这些操作 ,这样,用户就不必至执行甚至说明每个操作了。

GregBrockman实时解锁ChatGPT新能力构建面向AI的工具真正实现人机共-10

正如我所说的,这是一个实时演示,有时我们会遇到意外情况。让我们来看看 Instacart 的购物清单,大家可以看到,我们向 Instacart 实时发送了一份食材清单,就是做刚才那份食物需要的所有东西。有趣的是,传统的 UI 仍然非常有价值,大家看,我们仍然可以点击这些选项并修改实际数量。

GregBrockman实时解锁ChatGPT新能力构建面向AI的工具真正实现人机共-11

我认为,这表明 传统的 UI 并没有消失,只是我们有了一种新的、更强大的方式来与它们进行互补。 现在我们的一条推文也已经草拟好了,正等待我们的审核,这也很重要 —— 我们可以点击「运行」, 我们是 AI 的管理员, 我们能够检查,如果需要,我们也能够更改它们的工作。在本次演讲之后,用户也能够自己访问这个功能。

GregBrockman实时解锁ChatGPT新能力构建面向AI的工具真正实现人机共-12

GregBrockman实时解锁ChatGPT新能力构建面向AI的工具真正实现人机共-13

现在,我们知道了,如何构建这个应用程序的重点在于,我们不仅要构建工具,还要教会 AI 如何使用它们。比如,当我们提出这些非常高层次的问题时,我们究竟希望它做什么?为了做到这一点,我们采用了一个古老的思想,艾伦·图灵(Alan Turing)在 1950 年关于图灵测试的论文中说, 人永远无法为程序编写答案,但人可以学习,可以构建一个像人类孩子一样的机器,然后通过反馈来教它,让一个人类教师在它尝试或做好事或坏事时,为它提供奖励和惩罚。

GregBrockman实时解锁ChatGPT新能力构建面向AI的工具真正实现人机共-14

You'll never program an answer to this. Instead, you can learn it. You could build a machine, like a human child, and then teach it through feedback. Have a human teacher who provides rewards and punishments as it tries things out and does things that are either good or bad.

这正是我们训练 ChatGPT 的方式,这是一个两步过程。 首先,我们通过无监督学习产生了图灵所谓的「孩子机器」。 我们向它展示了整个世界、整个互联网,并说:「预测你从未见过的文本中接下来会产生什么。」这个过程赋予了它各种精彩技能。例如,如果用户展示给它一个数学问题,要完成这个数学问题,即说出那个绿色的 9,唯一的方法就是真的解决这个数学问题。

GregBrockman实时解锁ChatGPT新能力构建面向AI的工具真正实现人机共-15

但实际上, 我们还需要进行第二步,即教 AI 如何使用这些技能。 为此,我们提供反馈,我们让 AI 尝试以多种方式给我们多个建议,然后由人类进行评分,说「这个比那个好」。这不仅加强了 AI 所说的具体事情的理解,更重要的是优化了 AI 用来产生答案的整个过程,它能够自我学习并泛化,推断出用户意图,并将其应用于它以前没见过、没得到过反馈的情境中。

GregBrockman实时解锁ChatGPT新能力构建面向AI的工具真正实现人机共-16

有时我们需要教 AI 的东西并不是大家所期待的。 例如,当我们首次向可汗学院展示 GPT-4 时,他们说:「哇,这太棒了,我们将能够教授学生很棒的东西。只有一个问题,它不会检查学生的数学问题。如果其中有一些数学错误,它会很高兴地假装 1+1=3 并继续运行。」因此,我们需要收集一些反馈数据。萨尔·可汗(Sal Khan)本人非常友友善,提供了 20 个小时的时间,与我们的团队一起为机器提供反馈。在接下来的几个月里,我们能够教 AI:「嘿,你应该在这种特定的情况下反驳人类。」我们实际上通过这种方式对模型进行了许多改进。当用户在 ChatGPT 中按下「不喜欢」按钮时,实际上就像向我们的团队发出了一个信号,说:「这是一个弱点,你们需要收集反馈。」因此,这样做是我们真正倾听用户并确保为每个人构建更有用的东西的方式之一。

GregBrockman实时解锁ChatGPT新能力构建面向AI的工具真正实现人机共-17

现在,提供高质量的反馈是一件困难的事情。假设用户想让一个孩子收拾房间,如果用户只检查地板,那么必然不知道是否教会了他们将所有的玩具都塞进橱柜(顺便说一句,这是一张很漂亮的 DALL-E 生成的图片),同样的推理也适用于AI。

GregBrockman实时解锁ChatGPT新能力构建面向AI的工具真正实现人机共-18

随着我们的关注点转向更困难的任务,我们必须增强我们提供高质量反馈的能力。 但是对于此,AI 本身也非常乐意提供帮助,它很乐意帮我们提供更好的反馈,并随着时间的推移扩展我们监督机器的能力,我来向大家展示我的意思。

例如,用户可以问 GPT-4 这样一个问题,即这两篇关于无监督学习和从人类反馈中学习的基础博客的发布时间间隔了多久。模型说过去了两个月。但是这是真的吗?这些模型并不是 100% 可靠的,尽管每次我们提供一些反馈,它们就会变得更好。但其实,我们可以使用 AI 来进行事实核查,它可以检查自己的工作 —— 用户可以说:为我核实一下。

GregBrockman实时解锁ChatGPT新能力构建面向AI的工具真正实现人机共-19

现在,在这个例子中,我给 AI 提供了一个新的工具。这是一个浏览工具,模型可以发起搜索查询并点击网页。事实上,它会在进行这些操作时记录下整个思维链。它会说:「我现在要搜索这个」,然后进行搜索,随后找到发布日期和搜索结果,接着它会发起另一个搜索查询,然后点击进入博客文章 —— 这一切都是人类可以做到的,但非常乏味,人类并不喜欢做这种事情 —— 更有趣的是, 在这个过程中,人处于管理者的位置,如果需要的话,可以三番五次地检查 AI 的工作。 最后 AI 会列出引用,因此用户可以轻松地验证整个推理链中的任何一部分。事实证明,两个月是错误的,两个月零一周才是正确的。

GregBrockman实时解锁ChatGPT新能力构建面向AI的工具真正实现人机共-20

GregBrockman实时解锁ChatGPT新能力构建面向AI的工具真正实现人机共-21

GregBrockman实时解锁ChatGPT新能力构建面向AI的工具真正实现人机共-22

回到主题,我觉得这整个过程非常有趣的一点是, 它是人类和 AI 之间多步协作的结果。 因为使用事实核查工具的人是为了给 AI 提供更有用的数据,以便更好地服务于人类。我认为 这真正展示了未来我们应该期望的一种共生形态,即人类和机器之间精心设计的协作模式,以及人所期望的解决问题的方式:我们确保人类提供管理、监督、反馈,而机器以可检查和可信赖的方式运作。 通过共同努力,我们能够创建更加可信赖的机器。我认为,随着时间的推移,如果我们能够正确地推进这个过程,我们将能够解决不可能的问题。

让大家感受一下我所说的「不可能」的程度,我认为我们将能够重新思考我们与计算机互动的方方面面。例如电子表格,可以说,自 40 年前的 VisiCalc 以来,它们都在以某种形式存在着,但我认为它们并没有真正发生太大变化。这是一个特定的电子表格,列出了过去 30 年 arXiv 上所有 AI 论文的列表,总计约 16.7 万篇,用户可以在这里看到数据。让我展示一下 ChatGPT 对于如何分析这样的数据集的看法。

GregBrockman实时解锁ChatGPT新能力构建面向AI的工具真正实现人机共-23

我们可以让 ChatGPT 使用另一个工具,这个工具是 Python 解释器(Interpreter),它能够像数据科学家一样执行代码。你只需要上传一个文件,然后问一些问题。非常有用的是,它能知道文件的名称,而且会说:「哦,这是一个CSV(逗号分隔值)文件,我会为你解析它。」仅需文件名、列名,以及实际的数据,它就能够推断出这些列的含义。比如,这里面并没有这些语义信息,需要 AI 自己拼凑知识来推断,「哦,arXiv 是一个人们提交论文的网站,因此这些东西就是论文,这些是整数值,因此是论文中的作者数量」, 所有这些工作原本都是需要人类做的,而 AI 非常乐意帮忙 。

GregBrockman实时解锁ChatGPT新能力构建面向AI的工具真正实现人机共-24

GregBrockman实时解锁ChatGPT新能力构建面向AI的工具真正实现人机共-25

现在我甚至不知道我想问什么。幸运的是,你可以问机器:「你能制作一些探索性图表吗?」 再次强调,这是一个非常高级的指令,背后有很多意图 。 但我甚至不知道我想要什么,因此,AI 必须推断我可能感兴趣的内容。所以它提出了一些好主意,我想这些都很有趣,每篇论文作者数量的直方图,每年发表的论文时间序列,论文标题的词云等等,所有这些,我认为都非常有趣。而且最棒的是,它真的可以做到。

GregBrockman实时解锁ChatGPT新能力构建面向AI的工具真正实现人机共-26

GregBrockman实时解锁ChatGPT新能力构建面向AI的工具真正实现人机共-27

这里有一个漂亮的钟形曲线,你会发现「3」是最常见的;然后它制作了一张漂亮的图表,显示每年发表的论文数量 —— 不过,令人惊讶的是,2023 年发生了一些疯狂的事情,看起来我们曾经在指数增长,但是却突然断崖式下跌,可能发生了什么(顺便说一下,所有这些都是 Python 代码,用户可以检查);然后我们就可以看到词云,所有这些奇妙的东西,都出现在论文标题中。

GregBrockman实时解锁ChatGPT新能力构建面向AI的工具真正实现人机共-28

GregBrockman实时解锁ChatGPT新能力构建面向AI的工具真正实现人机共-29

GregBrockman实时解锁ChatGPT新能力构建面向AI的工具真正实现人机共-30

但是我对这个关于 2023 年的数据感到非常不满,它让今年看起来很糟糕。当然,问题在于今年还没有结束,所以我要反驳机器。 等等,这不公平!2023 年还没有结束,是到 4 月 13 日为止,那么 2022 年这个日期前,有多少论文被发布了?你能做一个公平的预测吗? 我们会看到,这是一个有挑战的问题。

GregBrockman实时解锁ChatGPT新能力构建面向AI的工具真正实现人机共-31

所以,我觉得机器应该做得更好。我真的希望它能注意到这个问题,也许这有点过分,它需要像变魔术一样推断出我想要什么。但我输入了我的意图,提供了额外的指引,AI 再次编写了代码,如果你想检查它在做什么,是可能的。现在,它做出了正确的预测 —— 它甚至更新了标题, 我并没有要求它这样做,但它知道我想要什么 。

GregBrockman实时解锁ChatGPT新能力构建面向AI的工具真正实现人机共-32

现在我们再回到幻灯片上。这张幻灯片展示了一个故事,说明我认为我们未来可能会如何使用这项技术。一个人带着他生病的狗去看兽医,兽医却决定「等等再看」。如果他听从了这个决定,那么这只狗今天就不会在这里了。但同时,他将血液检测和完整的医疗记录提供给了 GPT-4,它说:「我不是兽医,你需要咨询专业人士,这里有一些假设。」他把这些信息带给了第二个兽医,后者用它拯救了这只狗的生命。现在,这些系统并不完美,你不能过度依赖它们。但我认为这个故事展示了 一个人和一位医疗专业人士,以及 ChatGPT 作为头脑风暴伙伴,能够取得一种其他情况下不可能实现的结果的案例 。我认为当我们考虑如何将这些系统整合到我们的世界中时,这是我们都应该反思并思考的问题。

GregBrockman实时解锁ChatGPT新能力构建面向AI的工具真正实现人机共-33

我深深地相信, 要想让 AI 最大程度地发挥出它的作用,需要每个人的参与。 这包括决定我们希望 AI 如何融入现实世界,制定 AI 运行的规则,以及 AI 能或不能做社么。如果这次演讲只强调一点的话,那就是 这项技术看起来与人们预期的任何东西都不同,因此,我们所有人都必须了解 AI 这项技术 —— 说实话,这也是我们发布 ChatGPT 的原因之一。

我相信,我们可以一起实现 OpenAI 的使命,即确保通用人工智能(AGI)造福全人类。

问答 | Q&A

GregBrockman实时解锁ChatGPT新能力构建面向AI的工具真正实现人机共-34

Chris Anderson(CA,TED 负责人): 哇,我猜在座的每个人都有点儿晕了,在观看这个演讲的人中,有很多人看到这些内容,就会想:「天啊,我工作方式的每一个步骤都需要被重新思考和设计。」在这个层面,有新的可能性出现了。我说的对吗?谁觉得他们必须重新考虑自己做事的方式?是的,这太神奇了,但也真的很可怕。那么让我们谈谈吧,Greg,我的第一个问题是,你们是如何达成这个成就的?OpenAI 只有几百名员工,而 Google 则有数千名员工致力于 AI 领域的研究,为什么是你们开发出了这项震惊世界的技术?

Greg Brockman(GB): 实际上,我 们都是站在巨人的肩膀上,这是毫无疑问的。如果看看计算能力、算法和数据进展,所有这些都是整个行业共同努力和进步的结果 。但我认为,在 OpenAI 内部,我们从早期开始就做了很多非常明智的选择。首要的选择就是直面现实。我们非常努力地思考了这个问题:要取得进展,需要付出什么努力?我们尝试了很多行不通的方法,但大家只看到了成功的方法。 我认为最重要的事情是让截然不同的团队协调合作。

CA: 但你是否也看到了这些语言模型中的某些特点,如果你继续投资并开发它们,最终会出现某些突破性的东西呢?

GB: 是的。而且我认为,说实话,这个故事相当说明问题了: 高层次的深度学习实验室,这我们一直知道自己想成为的,但如何做到?在早期,我们并不知道 。 我们尝试了很多方法,有人正在尝试训练一个模型来预测 Amazon 评论中的下一个字符,这是一个语法过程,他期望这个模型能预测逗号的位置、名词和动词的位置等等,结果他得到了一个非常好的情感分析分类器,这个模型可以告诉你一个评论是积极的还是消极的。现在我们都会觉得,哎呀,这个很简单啊,任何人都能做到。但当第一次看到这种情况出现,从基础的语法分析过程中出现了语义,我们知道,必须扩大规模,看看它到底能做到什么程度。

CA: 所以我认为这有助于解释困扰着每个人的谜题,因为这被描述为预测机器。然而,我们感觉... ChatGPT 的一些能力似乎不可能是来自一个预测机器,就像你刚才展示的那些一样。涌现的核心思想是,当你有更多的东西时,不同的东西会突然出现。这种情况经常发生在蚂蚁群,单个蚂蚁会乱跑,当你把足够多的蚂蚁聚集在一起,你会得到完全不同的群体行为;或者像一个城市,几栋房子聚在一起,就只是简单的房子聚集在一起,但当增加房子的数量,类似郊区、文化中心和交通堵塞这些就会出现。请给我一个你所认为的时间节点,你看到一些突然出现的能力,你根本没有预料到,让你大吃一惊。

GB: 是的,你可以在 ChatGPT 中尝试一下,如果你把 40 位数字加起来...

CA: 40 位?

GB: 是的,如果你让模型相加 40 位数字,它可以做到,这意味着它真正学会了如何进行计算。但真正有意思的点实际上是,如果你让它把一个 40 位数字和一个 35 位数字相加,它却经常会出错。因此,你可以看到,它确实在学习计算,但还没有完全泛化,对吧?就像你无法记忆 40 位加法表,那是比宇宙中的原子还多的东西。所以它必须学习一些通用的东西,但它还没有真正完全学会,就像它还没有完全学会将计算过程推广到任意长度的任意数字的加法。

CA: 所以你让它扩大规模,查看了大量的文本,它正在学习你并不知道它能够学习到的东西。

GB: 是的,而且更加微妙。我们真的开始擅长预测部分新出现的能力的科学。 为了做到这一点,我们非常关注工程质量, 我认为在这个领域中,这之前非常不被重视。但就像你要建造火箭,每个公差都必须非常小,在机器学习中也是一样的,你必须正确地设计每一个单独组件,然后才能开始进行这些预测。有许多平稳的扩展曲线可以告诉你一些关于智能的根本性的东西 —— 如果你看一下我们的 GPT-4 博客文章,就可以看到所有这些曲线。现在我们开始能够进行预测了,例如,我们能够预测模型在编程问题上的表现,基本上比 GPT-3 规模小 10,000 倍或 1,000 倍的模型我们都可以预测。所以即使现在仍然处于早期阶段,这其中有一些东西是很平稳地扩展的。

CA: 所以基于此,这里有一个大担忧。如果这是涌现能力出现的基本原理,当你扩大规模时,会出现一些你可以在一定程度上预测的东西,但也有可能会出乎意料,那么会不会存在一个巨大的风险,发生一些真正可怕的事情?

GB: 嗯,我认为所有这些都是程度、规模和时间的问题。我认为人们也忽略了模型与世界的融合也是一件突发且非常强大的事。这也是我们认为逐步部署非常重要的原因之一。所以,我认为我们现在看到的是,如果你回顾这个演讲,我所专注的多数是提供高质量的反馈。今天我们所做的任务,用户可以检查它们,对吧?大家很容易看到那道数学问题,然后说:「不不不,机器,7 是正确的答案。」但即使是总结一本书也是一件难以监督的事情,比如,你怎么知道这个书摘要是否好?你得读整本书,但没有人想这样做。

所以我认为 重要的是我们要一步一步地走。 当解决书的摘要任务时,我们必须正确监督这个任务,我们必须建立起让这些机器能够真正执行我们意图的记录。而且我认为我们还需要生产更好、更高效、更可靠的方法来扩展这个领域,就像是让机器与你保持一致一样。

CA: 那么在这个会议的后面,我们将听到一些批评者说,你知道,在这个系统内部没有真正的理解,系统总是会,或者我们永远不会知道它是否产生了错误,它是否具有常识等等。Greg,你认为这是真的吗?你认为随着规模的扩大和你谈到的人类反馈的加入,它会逐步接近生成真相和智能的目标吗?你对此信心大吗?

GB: 是的,简单讲就是我相信我们正在朝着这个方向前进。 我认为 OpenAI 的方法一直面对现实,要让现实打脸, 对吧?这个领域充满了失败的承诺,所有专家都说 X 会发生,Y 是它的工作原理,人们已经说神经网络不成 70 年了,他们还没有验证完全正确。也许他们需要七十加一年才能说对。但我认为我们的方法一直是, 你必须将技术推动到极限,才能真正看到它的实际效果, 因为这会告诉你,哦,这才是我们转向新范式的方法,我们还没有完全发掘这个领域的潜力。

CA: 你们采取的做法相当具有争议,就是将其公开发布,然后利用所有的用户反馈,而不仅仅是团队成员反馈的做法。现在全世界都在为你们提供反馈,但如果不好的事情要出现,那就只能出现。所以,我最初听到的关于 OpenAI 的故事是,你们成立了一个非营利组织,作为大公司在 AI 领域做一些未知甚至可能是邪恶的事情的最后监督者。你们将搭建模型,以某种方式使它们是负责任的并且如果有必要的话,有能力减缓领域的发展,这至少这是我听说的。然而,现在发生的事情可以说恰恰相反,你们发布了 GPT,尤其是 ChatGPT,这在科技界引起了强烈的反响,以至于现在 Google、Meta 等公司都在拼命追赶,他们还说,OpenAI 迫使他们在没有适当的防护措施的情况下发布那些模型,否则公司就会死。那么你们如何证明你们所做的是负责任的,而不是鲁莽的呢?

GB: 是的,我们一直在思考这些问题,非常认真地思考。但我认为我们并不总是能够做到完全正确。但有一件事我认为非常重要,从一开始,我们就在考虑如何构建通用人工智能,让它真正惠及全人类,我们该怎么做呢? 初始计划是,秘密地构建一个超级强大的东西,然后再去考虑它的安全性,最后再启动它,并且希望能做对 —— 我不知道如何执行这个计划,也许别人知道怎么做 。但对我来说,这是很可怕的,我一直感觉不对劲。因此, 我认为现在的替代方案是我看到的唯一的另一条道路,那就是让面对现实,让现实狠狠打脸,我认为确实要给用户时间来提供意见 —— 实际上,在这些机器变得完美、超级强大之前,我们有能力看到它们的运作情况。 我们从 GPT-3 中看到了这一点,对吧?我们真的很担心人们会用 GPT-3 生成虚假信息,试图操纵选举,但事实上,它最常见的负面用例是生成伟哥推销垃圾邮件。

CA: 推销伟哥的垃圾邮件是不好,但有些事情比这更糟糕。我们做个思想实验,假设你坐在一个房间里,桌子上有一个盒子,你相信在那个盒子里面有一些东西,很有可能是一些很美妙的东西,将会给你的家人和所有人带来美好的礼物,但也有一个百分之一的可能性,这个盒子上写着「潘多拉」,有可能会释放出无法想象的邪恶,对世界造成毁灭性的影响,你会打开那个盒子吗?

GB: 当然不会。我认为不能这样做。说实话,我告诉你一个我以前从未讲过的故事,就在 OpenAI 刚刚成立的时候,我记得我在波多黎各参加了一次 AI 会议,我坐在旅馆房间里,看着美丽的大海,看着所有玩得很开心的人。如果我问你,你可以选择潘多拉魔盒在 5 年后或 500 年后打开,你会选择哪个?一方面,你可能会认为,对个人来说,5 年后可能更好,但如果它被推迟到 500 年后,人们就有更多的时间来解决问题 —— 我真切地感受到了这一点,当时我哥哥在服役,他比我们任何人更直接地冒着生命危险,而我们只是在电脑上打字和开发技术。我非常坚定地认为人们必须有足够的时间正确地处理这个问题,但我认为这并不是完全符合实际情况。

如果看看整个计算机的历史就会知道,现在我们面临的是一个整个行业乃至整个人类技术发展的变革,我们仍然在制造更快的计算机,改进算法,但如果不把它们整合起来,就会有一个断层,这意味着如果有人成功地连接到这个电路,他会突然拥有一个非常强大的东西,没有人有任何时间来调整策略,也不会有什么安全预防措施。即使是其他技术的发展,比如核武器,人们普遍认为这让人类的能力产生了从零到一的变化,实际上如果看看它的能力的话,也是逐渐发展起来的,所以, 我认为每一项技术的进步都是渐进的、一步步的, 在每个时间段内 , 我们都必须知道如何管理它们。

CA: 所以我可不可以理解为,你希望我们采取的行动是,我们已经孕育了这个非凡的孩子,它可能拥有超能力,可以将人类带到一个全新的境地。我们有集体责任为这个孩子提供防护栏,并共同教导它变得明智,不要把我们所有人毁掉,基本上是这种模式吗?

GB: 我认为是对的。我认为很重要的是,这也可能会发生变化。 我们必须逐步前行,必须以走的每一步为基础。我认为现在非常重要的是,所有人都要熟练掌握这项技术,找出如何提供反馈,决定我们想从中得到什么。 我希望这将继续是最好的实现路径,但现在,正在进行的关于大语言模型的辩论非常重要,如果这些产品没有被公开发布,我们就不会有这样的辩论。

🔗 https://www.ted.com/talks/greg_brockman_the_inside_story_of_chatgpt_s_astonishing_potential/comments

版权声明:
作者:小火箭
链接:https://www.xiaohuojian9.top/39.html
来源:小火箭官网
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
< <上一篇
下一篇>>