下一个 ChatGPT 可能有脸和声音

跨境快讯 2024-01-30 00:07:03 woniu
2
导读:ChatGPT可能已经席卷了互联网,但它在交互方式方面仍然非常有限。但未来的聊天机器人可能不会受到如此限制。事实上,他们甚至可能有类似人类的化身,你可以与之进行口头对话,而不是阅读消息。

ChatGPT可能已经席卷了互联网,但它在交互方式方面仍然非常有限。但未来的聊天机器人可能不会受到如此限制。事实上,他们甚至可能有类似人类的化身,你可以与之进行口头对话,而不是阅读消息。

我在巴塞罗那世界移动通信大会上与以色列 D-ID 公司讨论了这种可能性。D-ID 的目的是在某种程度上创造数字人,而现在这意味着为人工智能聊天机器人添加更多的人性化联系——它希望通过推出新的 API 来实现这一目标。该 API 提供实时流功能,让您可以像普通人一样与聊天机器人交谈。该聊天机器人本身可以利用文本到视频技术,并给人留下其数字化身实际上正在用人声说话的印象。当然,如果您发现打字比与机器交谈更好,您也可以选择打字。

作为 API,这意味着 D-ID 的系统可以集成到其他应用程序和服务中。总体想法是企业建立并提供虚拟助理,人们可以在更个人的层面上进行联系——这就是面部方面发挥作用的地方。D-ID 首席执行官兼联合创始人 Gil Perry 表示,人类无法进行仅依赖文本或音频的对话。相反,拥有人脸(或至少是人脸的代表)会让一切变得更加有吸引力和自然——并且可以使用多种语言。

另外,从商业角度来看,让人工智能人员为你做很多事情可以节省你雇佣真人的成本。无论是与客户交谈、培训员工还是人工智能在当前状态下可以处理的任何其他事情。

现在人们往往对人工智能持怀疑态度和警惕态度,佩里认为这种不露面的本质可能是部分原因。添加人脸可以帮助人们在与聊天机器人交谈时感觉更舒服,即使他们知道电话的另一端没有人。

我在 MWC 上看到了各种 D-ID 聊天机器人的演示,包括新的集成流媒体功能。看到各种不同类型的化身在行动当然很有趣,但即使是最先进的化身也会对他们产生一点恐怖谷效应。

对于说话的动画来说尤其如此。一切都不太同步,有时看起来更像是随机的嘴巴张开,而不是一个化身试图发出声音——显然它实际上并没有这样做。

我还注意到,当机器人与人交互时,语音识别和书写出现了一些明显的延迟。但这并不能改变这样一个事实:您可以与机器人交谈,让它理解您所说的内容并提供响应,而无需您输入或阅读任何内容。

唯一的问题是这种体验是否以及何时向公众开放。D-ID 的目标是向企业和企业用户提供其 API。但是,正如我们看到的 ChatGPT 最近的流行程度一样,我们很有可能会看到这种技术出现在更公开的领域。特别是考虑到 MWC 上出现的以人工智能为中心的公司数量,以及最近几周涌现的ChatGPT 竞争对手数量。

文章翻译自:tomsguide;原文链接:https://www.tomsguide.com/news/the-next-chatgpt-could-have-a-face-and-a-voice

版权声明: woniu 发表于 2024-01-30 00:07:03。
转载请注明: 下一个 ChatGPT 可能有脸和声音 | 跨境湾

相关文章