ChatGPT 实际上是如何运作的？

跨境快讯 2024-01-29 21:01:34 woniu

导读：Google、Wolfram Alpha 和ChatGPT都通过单行文本输入字段与用户交互并提供文本结果。谷歌返回搜索结果、网页和文章列表（希望）提供与搜索查询相关的信息。Wolfram Alpha 通常提供与数学和数据分析相关的答案。

相比之下，ChatGPT 根据用户问题背后的上下文和意图提供响应。例如，你不能要求 Google 写一个故事或要求 Wolfram Alpha 编写一个代码模块，但 ChatGPT 可以做这些事情。

从根本上来说，Google 的强大之处在于能够进行大量数据库查找并提供一系列匹配。Wolfram Alpha 的强大之处在于能够解析与数据相关的问题并根据这些问题执行计算。ChatGPT 的强大之处在于能够根据世界上大多数可数字访问的基于文本的信息（至少是 2021 年之前训练时存在的信息）解析查询并生成完全充实的答案和结果。

在本文中，我们将了解 ChatGPT 如何生成这些完全充实的答案。

除了本文中引用的来源（其中许多是每种技术背后的原始研究论文）之外，我还使用 ChatGPT 本身来帮助我创建此背景资料。我问了它很多问题。一些答案是在本次讨论的整体背景下解释的。

ChatGPT 操作的两个主要阶段

我们再用谷歌来打个比方。当你要求谷歌查找某些内容时，你可能知道它不会——在你提出要求的那一刻——出去搜索整个网络来寻找答案。相反，谷歌会在其数据库中搜索与该请求匹配的页面。Google 实际上有两个主要阶段：蜘蛛抓取和数据收集阶段，以及用户交互/查找阶段。

粗略地说，ChatGPT 的工作原理是相同的。数据收集阶段称为预训练，而用户响应阶段称为推理。生成式人工智能背后的魔力及其突然爆发的原因是预训练的工作方式突然被证明具有巨大的可扩展性。这种可扩展性是通过最近在经济实惠的硬件技术和云计算方面的创新而实现的。

人工智能预训练的工作原理

一般来说（因为要了解具体细节需要花费大量时间），人工智能使用两种主要方法进行预训练：监督和非监督。对于大多数人工智能项目，直到当前的生成式人工智能系统（如 ChatGPT），都使用了监督方法。

监督预训练是在标记数据集上训练模型的过程，其中每个输入都与相应的输出相关联。

例如，人工智能可以在客户服务对话数据集上进行训练，其中用户的问题和投诉被标记为客户服务代表的适当答复。为了训练人工智能，需要提出诸如“如何重置密码？”之类的问题。将作为用户输入提供，并且诸如“您可以通过访问我们网站上的帐户设置页面并按照提示操作来重置密码”之类的答案将作为输出提供。

在监督训练方法中，整个模型被训练以学习可以准确地将输入映射到输出的映射函数。该过程通常用于监督学习任务，例如分类、回归和序列标记。正如您可能想象的那样，其扩展方式是有限的。人类培训师必须花很大力气来预测所有的输入和输出。培训可能需要很长时间，并且主题专业知识有限。

但正如我们所知，ChatGPT 在主题专业知识方面几乎没有限制。你可以让它为《星际迷航》中的迈尔斯·奥布莱恩酋长写一份简历，让它解释量子物理，写一段代码，写一篇短篇小说，并比较美国前总统的执政风格状态。

不可能预测所有会被问到的问题，因此 ChatGPT 确实不可能用监督模型进行训练。相反，ChatGPT 使用无监督预训练——这就是游戏规则的改变者。

无监督预训练是根据数据训练模型的过程，其中每个输入都没有关联特定的输出。相反，模型经过训练来学习输入数据中的底层结构和模式，而无需考虑任何特定任务。该过程通常用于无监督学习任务，例如聚类、异常检测和降维。在语言建模的背景下，无监督预训练可用于训练模型理解自然语言的语法和语义，使其能够在会话上下文中生成连贯且有意义的文本。

在这里，ChatGPT 看似无限的知识成为可能。因为开发人员不需要知道输入的输出，所以他们所要做的就是将越来越多的信息转储到 ChatGPT 预训练机制中，这称为基于 Transformer 的语言建模。

自然语言处理

自然语言处理（NLP）专注于使计算机能够理解、解释和生成人类语言。随着数字数据的指数级增长和自然语言界面的日益使用，NLP 已成为许多企业的关键技术。

NLP 技术可用于广泛的应用，包括情感分析、聊天机器人、语音识别和翻译。通过利用 NLP，企业可以自动化任务、改善客户服务，并从客户反馈和社交媒体帖子中获得有价值的见解。实施 NLP 的关键挑战之一是处理人类语言的复杂性和歧义性。NLP 算法需要接受大量数据的训练，才能识别模式并学习语言的细微差别。它们还需要不断完善和更新，以跟上语言使用和上下文的变化。

该技术的工作原理是将语言输入（例如句子或段落）分解为更小的组件，并分析它们的含义和关系以生成见解或响应。NLP 技术结合使用统计建模、机器学习和深度学习等技术来识别模式并从大量数据中学习，以便准确地解释和生成语言。

对话管理

您可能已经注意到，ChatGPT 可以提出后续问题来澄清您的意图或更好地了解您的需求，并提供考虑到整个对话历史记录的个性化响应。这就是 ChatGPT 能够以自然且有吸引力的方式与用户进行多轮对话的方式。它涉及使用算法和机器学习技术来理解对话的上下文并在与用户的多次交流中维护它。

对话管理是自然语言处理的一个重要方面，因为它允许计算机程序以一种感觉更像对话而不是一系列一次性交互的方式与人交互。这有助于与用户建立信任和互动，并最终为用户和使用该程序的组织带来更好的结果。

当然，营销人员希望扩大信任的建立方式，但这也是一个可能令人恐惧的领域，因为这是人工智能可能操纵其使用者的一种方式。

文章翻译自：zdnet；原文链接：https://www.zdnet.com/article/how-does-chatgpt-work/

[db:标签]