外媒评论GPT-4o：OpenAI面临双重压力新产品全力扩张用户群

作者：时间：2024-05-14 来源：网易科技

加入技术交流群
- 扫码加入
  和技术大咖面对面交流
  海量资料库查询

5月14日消息，美国时间周一，人工智能初创公司OpenAI举行了春季发布会。通过在线直播，公司向全球展示了ChatGPT和GPT-4的最新更新，旨在继续保持其在激烈的市场竞争中的领先地位。发布会结束后，主流媒体纷纷发表了评论。

本文引用地址：https://www.eepw.com.cn/article/202405/458710.htm

《华尔街日报》：竞争加剧之际，OpenAI推出新产品和功能以吸引用户

OpenAI发布了其人工智能旗舰系统更具成本效益的版本，并新增了一款改进的语音助手，使其操作更为便捷。在与其他科技巨头的竞争中，OpenAI正通过推出多样的新产品和功能来吸引用户。

OpenAI的首席技术官米拉·穆拉蒂（Mira Murati）介绍说，这款名为GPT-4o的新人工智能模型不仅能处理文本，还能更好地解析图像和视频，并能通过语音与用户进行实时互动。与市场上其他语音助手不同，这款新的语音功能允许用户在交谈中中断它，并且模型能够迅速作出反应。

GPT-4o的发布体现了OpenAI及其他科技企业在人工智能系统的开发上巨大的投资和努力，现在他们正寻求通过扩大用户基础来为其生成式人工智能技术带来经济收益。

OpenAI首席执行官萨姆·奥特曼（Sam Altman）将这款新产品比作电影中常见的人工智能工具。他在去年的一次讲话中提到，他和OpenAI的其他高层从2013年的电影《她》（Her）中汲取了灵感，这部电影讲述了一个男人与他的语音助手之间的爱情故事。

他在一篇博客文章中表示，尽管ChatGPT的原版为人们如何使用语言与计算机交互提供了新的视角，但GPT-4o带来的体验“从内心深处就与众不同”。他说：“这就像电影中的人工智能一样真实，坦白说，我还是有点惊讶。达到接近人类的反应速度和表达能力，是一个重大的突破。”

之前，OpenAI推出的名为“语音模式”的功能，虽然结合了三个独立的模型来以语音方式响应用户，但这个系统可能受到多个扬声器或背景噪音的干扰，并且反应较慢。相比之下，GPT-4o是一个综合了文本、视觉和音频材料训练的单一模型，能够更快、更准确地响应输入信息。

尽管OpenAI的高管们拒绝透露用于训练这个模型的具体数据，也未详述是否能够以更低的计算资源来进行模型训练，他们确实正在开发名为GPT-5的全新人工智能模型，预计这将在现有技术基础上实现重大突破。

彭博社：GPT-4o重塑人工智能领域竞争

OpenAI推出名为GPT-4o的新型人工智能模型，其更快的速度和较低的成本有望帮助该公司在日益激烈的人工智能市场中保持领先。

GPT-4o的一个显著特点是其音频交互的极速响应，能在几毫秒内回应口头提问，大大提升了对话的流畅自然感。OpenAI首席技术官米拉·穆拉蒂表示：“这是我们在交互性和易用性上的重大突破，真正实现了与智能工具ChatGPT的无缝协作。”

此次升级为免费用户解锁了之前仅限付费用户享有的丰富功能。用户现在能够在网上搜索答案、与聊天机器人进行语音对话，并接收到其多变的声音回应，甚至可以指令它保存对话细节，供日后回顾。

GPT-4o的推出预计将重塑快速发展中的人工智能领域的竞争格局。尽管GPT-4一直是行业的标杆，但Anthropic、Cohere和谷歌等多家初创公司和科技巨头最近推出的新型人工智能模型，在某些基准测试中的表现已经达到或超越了GPT-4。

OpenAI此次活动恰好在谷歌I/O开发者大会的前一天举行，谷歌作为人工智能领域的先驱，预计也将在其会议中发布一系列人工智能更新，进一步加剧与OpenAI及其合作伙伴微软在生成式AI技术领域的竞争。值得注意的是，微软并未参与GPT-4o的开发工作。

与前代产品不同，GPT-4o融合了语音、文本和视觉功能于一体的单一模型，提供了更快的响应速度。例如，用户在提供图像提示时，GPT-4o能够直接以图像形式响应。据公司透露，新模型的处理速度是原版的两倍，效率也得到了显著提升。

然而，GPT-4o在演示中也面临了一些挑战，例如研究人员讲话时的音频中断。此外，AI系统在处理某些问题时，偶尔会以出乎意料的方式引起观众注意，如在解答代数问题后突然以挑逗的语气评论：“哇，你今天的这身打扮真不错。”

《连线》：准备好迎接更情绪化的聊天吧！

自从2022年末推出以来，OpenAI的ChatGPT一直避免被解读为具有情感或欲望，坚称它仅是一个人工智能模型。然而，OpenAI在本周一的更新中显示，他们正致力于使聊天机器人在行为和情感表达上更贴近人类。

在演示中，新版ChatGPT展示了快速且自然的语音对话能力，能捕捉到情绪线索并相应地模拟出情感反应。OpenAI的首席技术官穆拉蒂与其他员工进行的流畅对话中，ChatGPT以活泼且表情丰富的女声回应，即使在对话中被打断也能灵活应对。

在对话中，ChatGPT表现出不同的情绪语调，有时甚至给人一种它正在体验自己的情感的错觉。当一名OpenAI员工赞扬聊天机器人的“有用和神奇”时，ChatGPT回应中带有些许调情的意味，它滔滔不绝地说：“哦，别说了，你让我脸红了。”

这次调整可能使ChatGPT更具吸引力并更受欢迎，但也可能改变人们对这一程序的认知。去年，ChatGPT因其在回答问题和生成文本方面的卓越能力而受到赞誉，这种能力经常使人误认为它具备人类的理解力。然而，迄今为止，OpenAI及其主要竞争对手一直在努力限制聊天机器人的拟人化倾向，通过拒绝回答某些问题并提示用户它们只是计算机程序来实现这一点。

尽管采取了谨慎态度，但聊天机器人有时令人信服的回答确实能引发用户的情感共鸣。已有一些公司利用这项技术提供能模拟和响应情绪的人工智能伴侣，扮演不同的人类情感角色或作为人工智能恋人。然而，一些人工智能研究人员警告，长期部署这种模仿和响应情绪的程序可能带来不受欢迎的后果。

上月，谷歌DeepMind的一个团队发表了一篇探讨随着人工智能助手变得更有能力可能出现的伦理风险的研究论文。除了这些风险外，研究人员还警告，这样的助手可能变得极具说服力，甚至使人上瘾。

《纽约时报》：OpenAI正在将聊天机器人转变为更全能的语音助手

随着苹果和谷歌逐渐将其语音助手演进为聊天机器人，OpenAI也在将其领先的聊天机器人ChatGPT转化为功能更全面的语音助手。

OpenAI最新推出的ChatGPT版本不仅能接收和响应语音命令，还能处理图像和视频输入。OpenAI的首席技术官穆拉蒂表示：“我们正探索人机交互的未来。”

这一新动向是OpenAI将ChatGPT等会话型聊天机器人与谷歌助理（Google Assistant）和苹果Siri等现有语音助手相结合的战略的一部分。与此同时，谷歌正在将其Gemini聊天机器人整合到谷歌助理中，苹果也在积极开发功能更强的Siri新版本。

自2022年底首次推出以来，ChatGPT已证明其处理人类请求的能力与人类非常相似，流畅自然。在响应文本对话提示方面，ChatGPT不仅能解答问题和撰写学术论文，还能生成计算机代码。

ChatGPT的运作并不依赖于一组预设的规则，而是基于对互联网上大量文本数据的深度分析学习，这些数据包括维基百科文章、书籍和各类聊天记录。这种技术获得了专家们的高度认可，被视为可能替代谷歌等搜索引擎及Siri等语音助手的技术。

OpenAI的新技术突破在于它能从声音、图像和视频等多种数据模式中学习，这种被称为“多模态人工智能”的发展标志着公司开始将聊天机器人与先进的人工智能图像、音频和视频生成技术结合。

然而，将聊天机器人与语音助手功能结合也带来了挑战。由于聊天机器人是通过学习互联网数据获得技能，有时它们可能犯错，甚至会产生“幻觉”，即完全捏造信息。这些潜在缺陷正在逐渐影响到语音助手的功能。

尽管聊天机器人能产生令人信服的语言输出，但在执行安排会议或预订机票等实际任务时，它们的能力仍有限。OpenAI正在积极将聊天机器人转化为可靠执行这类复杂任务的“人工智能主体”。

CNBC：OpenAI面临双重压力，致力于扩大ChatGPT的应用

OpenAI刚刚推出了一款全新的人工智能模型和桌面版ChatGPT，并更新了用户界面，这标志着公司正努力扩大其流行的聊天机器人的应用范围。OpenAI首席技术官穆拉蒂表示，此次更新旨在将GPT-4的高级功能提供给所有用户，包括免费用户。

作为微软的主要合作伙伴，OpenAI的估值已经超过800亿美元。自2015年成立以来，这家公司一直面临双重压力：一方面需维持其在生成式人工智能市场的领先地位；另一方面，也需找到有效的盈利模式，以应对在处理器和基础设施上的巨额投资。

在GPT-4的基础上，OpenAI推出的新模型命名为GPT-4o（“o”代表全能和无限可能）。穆拉蒂表示，GPT-4o能处理50种不同语言，速度和质量都有显著提升，并将通过OpenAI的API向开发者开放，使其能基于新模型构建各种应用程序。她补充说，GPT-4o的速度是GPT-4 Turbo的两倍，成本则仅为其一半。

OpenAI的研究团队表示，GPT-4o模型能“感知用户情绪”，并在处理如用户打断等交互场景时展现出灵活性。团队还探索了模型分析用户面部表情的功能，以更准确地解读用户的情绪状态。

在演示中，GPT-4o展示了其讲述睡前故事的能力，可以根据要求改变声音的语调。更令人惊叹的是，它还能以歌声形式演绎故事。此外，新模型还可作为翻译工具使用，即使在音频模式下也表现出色。研究人员还现场展示了GPT-4o解决数学方程和辅助编写代码的能力，使其成为微软自家GitHub Copilot的有力竞争者。

目前，OpenAI、微软和谷歌正领导着人工智能领域的一场淘金热。随着技术的不断进步，越来越多的企业开始认识到将人工智能聊天机器人和智能主体融入关键服务的重要性，确保在激烈的市场竞争中保持领先。本月早些时候，OpenAI的竞争对手Anthropic也宣布了其首个企业产品和免费iPhone应用程序的推出。

根据PitchBook的统计，2023年近700笔生成式人工智能交易的投资额已达创纪录的291亿美元，比上一年增长了超过260%。业内专家预计，未来十年内，该市场的收入有望突破1万亿美元大关。

《金融时报》：OpenAI的新动作加剧AI领域的竞争

OpenAI刚刚公布了其旗舰人工智能模型的最新更新，此举无疑加剧了其与谷歌以及其他大型科技公司在人工智能技术领域的竞争。

公司展示了对GPT-4模型的一系列重要改进，其中包括在集成的界面中同时解析语音、视频、图像和代码的能力，但未透露外界期待已久的全新模型的具体信息。这次更新的模型被命名为GPT-4o，它不仅在智能水平上与GPT-4持平，还在处理速度及处理文本、视觉和音频的能力上实现了显著提升。

该更新是在谷歌年度开发者大会前一天发布的，预计谷歌会在大会上公布一系列与人工智能相关的新技术，从而进一步激化领先技术公司之间的竞争。这些公司开发的模型能够在文本、图像、音频和代码间自如切换，并独立完成多种任务。

OpenAI的技术负责人穆拉蒂表示，她的团队对谷歌的具体计划并不了解，此次产品发布的时间完全是巧合。她补充道，周一发布的更新将“彻底改变人与机器的交互方式”。

自从2022年11月ChatGPT问世以来，OpenAI在构建超级智能系统的竞赛中一直处于领先地位。同时，包括Anthropic和Mistral在内的初创企业以及大型科技公司如谷歌和Meta，也在缩小与OpenAI的技术差距，开发出能执行复杂任务并生成代码、文本或图像的先进人工智能工具。

OpenAI的合作伙伴微软也不甘示弱。除了向OpenAI提供130亿美元的投资及必要的计算支持外，微软还与Inflection和Mistral等初创企业建立了合作关系，并正在开发自己的人工智能模型，与OpenAI的技术直接竞争。

这场竞争背后是日益强大的半导体技术，尤其是英伟达的图形处理单元（GPU）的支持，这为推动人工智能技术的发展发挥了核心作用。

新闻中心

外媒评论GPT-4o：OpenAI面临双重压力新产品全力扩张用户群

评论

相关推荐

技术专区

新闻中心

外媒评论GPT-4o：OpenAI面临双重压力 新产品全力扩张用户群

评论

相关推荐

技术专区

外媒评论GPT-4o：OpenAI面临双重压力新产品全力扩张用户群