新版Siri跳票,苹果员工痛诉AI危机:我们的船正在下沉
5月19日消息,2018年,苹果从谷歌挖来AI负责人约翰·詹南德里亚(John Giannandrea),试图扭转其在人工智能领域的落后局面。然而七年过去,苹果的AI战略屡屡受挫:承诺的Siri升级多次跳票,自研大模型进展缓慢,功能发布滞后于竞争对手。尽管投入巨资并重组团队,苹果仍面临技术短板、内部决策分歧和隐私政策限制等多重挑战。如今,苹果被迫调整策略,一边加速开发"LLM Siri"新架构,一边寻求与OpenAI等对手合作。内部人士称,在AI领域的持续失利正威胁着iPhone的主导地位,乃至机器人和其他未来产品的规划。
本文引用地址:https://www.eepw.com.cn/article/202505/470598.htm以下为英文翻译节选:
早在2018年,苹果的人工智能业务似乎终于步入正轨。那年年初,软件主管克雷格·费德里吉(Craig Federighi)召集高层团队,宣布了一项重磅人事任命:苹果从谷歌挖来了詹南德里亚出任人工智能业务负责人。这位业内人称“JG”的高管,此前掌管谷歌的搜索和AI团队,曾推动将前沿人工智能技术应用于Google Photos、Google Translate和Gmail等核心产品。这些成果,加上2014年谷歌对英国AI公司DeepMind的收购,让该公司在人工智能领域确立了标杆地位。
对苹果高层来说,延揽詹南德里亚不仅是从最强劲对手手中赢得的一场胜利,更被寄予厚望:这或许将是苹果向AI巨头转型的关键一步。2011年,在联合创始人史蒂夫·乔布斯(Steve Jobs)去世前夕,苹果首次发布了语音助手Siri。最初,Siri看起来宛如科幻电影中走进现实的技术创新——苹果再次将前沿科技变成主流产品。然而,短短几年后,谷歌、亚马逊等竞争对手相继推出更强大的语音助手,而苹果的Siri却在理解能力和执行指令方面问题频出。
出生于苏格兰的詹南德里亚被赋予全面统筹苹果AI业务的职责。多位员工表示,苹果在人工智能方面进展缓慢,部分原因在于AI相关工作长期分散在多个产品团队中。詹南德里亚上任后,机器学习研究、测试部门以及Siri团队被整合为统一架构。他直接向首席执行官蒂姆·库克(Tim Cook)汇报工作,使人工智能成为继软件、硬件和服务之后的第四大核心业务。
费德里吉在宣布詹南德里亚的任命时难掩激动之情。自Siri推出以来,该团队几经易手,最终由他接手,如今则正式交棒给詹南德里亚。“他正是我们需要的AI领军人物,”费德里吉在团队会议中表示。许多人认为詹南德里亚在谷歌的地位仅次于CEO,他不仅主导AI战略,还曾担任互联网先驱网景(Netscape)的首席技术官。“你还能找到比他更合适的人选吗?”一位参与招聘的人士反问。
努力七年,差距却越来越大
然而,七年过去,詹南德里亚带来的希望与乐观早已消退。苹果不仅未能在AI领域迎头赶上,反而逐渐被拉开了距离。自2022年OpenAI推出ChatGPT以来,全球科技公司纷纷加速开发大语言模型(LLM),将其整合进语音助手等工具,并积极向消费者推广。
苹果虽也推出了新AI功能,但往往被外界视为“姗姗来迟”且“缺乏亮点”。在去年的全球开发者大会上,苹果发布了“Apple Intelligence”,将其宣传为“为每个人打造的人工智能”——呼应1984年首款Mac电脑“为所有人设计的计算机”的标语。
苹果承诺,“Apple Intelligence”将具备写作优化、邮件与通知摘要、生成功能性图像和自定义表情符号等能力,并预告Siri将迎来重磅升级:首次能够深度访问用户的个人数据与屏幕内容,智能回答个性化问题。在现场演示中,詹南德里亚的一位高管助手请求Siri查询其母亲的行程安排,系统能无缝从邮件和短信中提取信息,自动构建出一份旅行计划。苹果还表示,用户将可通过Siri实现更多操作,例如选取、裁剪并发送照片,全程无需手动触控。
真正由AI驱动的iPhone前景,也助推苹果股价走高。去年9月,苹果宣称全新iPhone 16“从底层重构”,以支持Apple Intelligence,引发市场热议。然而该机上市时并未内建AI功能——写作工具与通知摘要等基础功能推迟一个半月才上线,自定义“生成表情”(Genmojis)直到12月才正式发布。至于按紧急程度自动整理的系统通知功能,则到今年3月才姗姗来迟。
而备受期待的Siri升级版,据开发团队透露,原计划于2025年4月上线。但多位知情高管表示,发布前数周,费德里吉在使用测试版iOS 18.4时发现,多个宣传中的功能(例如通过语音读取驾驶证号)根本无法使用。发布日期先是推迟至5月,随后再次被无限期延后——而此时,iPhone 16的广告中仍在高调宣传这些尚未实现的功能。部分用户遂以“虚假广告”为由对苹果提起集体诉讼。
新版Siri已确认无法赶在下月的全球开发者大会前推出——距离最初宣布整整过去了一年。用户依旧无法迎来一次彻底升级的语音助手,更谈不上获得一个可媲美ChatGPT的成熟产品。目前,他们只能继续等待苹果逐步兑现对Apple Intelligence功能的承诺。
“这是一场危机。” 一位苹果人工智能团队的资深成员直言不讳。另一位成员则将苹果当前的人工智能努力比作“一艘正在下沉的船”。根据内部数据,苹果的AI技术仍落后于竞争对手多年。
“后发制人”策略还有用吗?
但对苹果来说,错失一项可能改变世界的技术,未必就是生死存亡的问题。该公司一贯的战略,是让竞争对手率先推出新技术、承担初期风险,自己则在时机成熟时,向超过十亿用户推出精致易用、系统整合良好的版本。苹果曾在MP3播放器、智能手机、平板电脑、智能手表乃至耳机产品上,屡次通过这种“后发制人”的策略取得成功。
在今年5月的季度财报电话会议上,当被问及AI相关功能一再跳票的情况时,首席执行官蒂姆·库克(Tim Cook)提到了已上线的Apple Intelligence功能,以及它对西班牙语、中文等语言的支持扩展。他强调,Siri升级只是需要更长时间来达到苹果的质量标准。“没有其他复杂原因,”库克说,“只是比我们预期的要花更长一点时间而已。”
值得关注的是,尽管苹果在AI领域投入了巨大的资源,成效却相对有限。据多位高管透露,长期以来,苹果的AI专职员工数量远少于竞争对手,用于训练与运行大语言模型所需的GPU采购量也严重不足。今年,苹果高层为此进行了一次重大组织架构调整,将Siri和其他AI相关团队从詹南德里亚手中划出。
虽然有员工将这一困境归咎于个别高管的判断失误,也有人认为问题根源更为深层。苹果之所以能成为全球最具价值的科技公司,靠的是精雕细琢的硬件产品、经过严格筛选的内容生态,以及每年一次的大型系统更新。但人工智能的发展节奏截然不同——更快速、更不可预测,也更具侵入性。
苹果最成功的产品,通常建立在其自研的核心技术基础上,比如iPhone的多点触控,或iPad和最新Mac所用的自研芯片。但在AI领域,这一成功逻辑似乎并未奏效。去年,苹果砍掉了曾耗资百亿美元的自动驾驶汽车项目,部分原因正是公司意识到:现阶段,其人工智能能力无法实现真正的自动驾驶。
如果AI方面的困境持续下去,苹果的多个未来项目可能将受到根本性影响——从增强现实眼镜、机器人,到能识别周围物体的智能手表和耳机。如果苹果在这场关于“人与智能设备如何互动”的新一轮技术变革中败下阵来,其所处的劣势将极其严重。
苹果未能及时推出自有聊天机器人,也令高管层倍感不安。据员工透露,詹南德里亚始终对生成式AI持保守态度。他曾表示,智能体距离真正替代人类还有很长路要走,大多数用户与他一样对其信任有限,因此他并未将打造ChatGPT竞品视为优先事项。他还称,用户最常提出的请求之一就是“关闭它”。这种误判造成方向反复。2025年3月,苹果宣布推迟Siri重大升级,并撤下相关广告。
Siri的底层架构被“一分为二”
问题的根源在于Siri的底层架构已经被“一分为二”:旧代码支撑设置闹钟等传统功能,新代码则支撑调用个人数据的新请求。这种“临时拼接”的方式被视为将新功能尽快推向市场的必要手段,但最终适得其反,导致整合问题频发,从而造成大量延迟。员工们说,单个功能可能看起来运行良好,但当这些代码整合在一起、在Siri中统一测试时,就开始出问题了。
随着项目进展受挫,工程团队的士气持续低迷。一名成员抱怨:“我们甚至不知道发生了什么,也不知道为什么发生,这里缺乏真正的领导力。”
他很难融入苹果核心圈层——这些人一起共事了数十年,把公司当作家族企业来运营。而他也像此前那些“外来高管”一样意识到,在这样的文化中推行变革异常困难。苹果高层由一群强势的人物组成,最终是否被认可,取决于能否将新产品成功推向市场。相比之下,詹南德里亚性格低调,一些人认为他在争取所需资源时不够积极。
也有人认为,詹南德里亚的管理过于松散,对团队要求不够严格。一位高管说:“苹果的其他团队,至少在工程部门,都是拼命赶工、按时交付的节奏,但JG的团队完全不是这样,他们就是执行力不行。”这种“被特殊对待”的印象还延伸到了福利上。在苹果总部,和其他硅谷科技巨头不同,员工通常需要自费在食堂用餐。但在詹南德里亚的团队奋力推进Apple Intelligence时,一些工程师却经常能领到免费用餐券,引发其他团队的不满。一位员工说:“我知道听起来有点小题大做,但苹果一向不给员工提供免费食物。而他们在比别人晚了一年发布产品的情况下,竟然还能吃白食。”
詹南德里亚看似缺乏紧迫感,也许更多是一种理念问题,而非性格问题。他对AI发展的节奏持保守态度,对聊天机器人的价值也持怀疑态度。他在内部曾主张说,OpenAI、Meta、谷歌等并不构成紧迫威胁,用户真正想要的是一个可以控制设备的界面型助手。尽管出现了延误和挫折,他仍然坚持这个愿景。
当然,失败从来不是单方面造成的,将失误归咎于个人过于简单化。据知情人士透露,詹南德里亚本人曾表示,苹果的市场营销和广告团队才应为过度宣传未完成功能承担更多责任——这些团队分别由格雷格·乔斯维亚克(Greg Joswiak)和托尔·迈伦(Tor Myhren)负责。产品经理有责任向市场部门明确告知产品何时才能真正准备就绪。而软件方面的最终决策人是克雷格·费德里吉(Craig Federighi)。整个公司的产品文化,最终由蒂姆·库克(Tim Cook)设定方向。
前首席财务官卢卡·梅斯特里(Luca Maestri)对购买GPU的保守态度,事后看起来也不够明智。长期以来,库克主导下的苹果善于利用其市场主导地位和现金储备来塑造全球供应链——从半导体到智能手机屏幕玻璃都不例外。但GPU的需求后来远远超过供应,而苹果对这种新兴技术不完全信任、选择慢慢采购的做法最终自食其果。当亚马逊、微软等竞争对手抢购全球大部分GPU时,苹果只能眼睁睁看着。GPU数量不足,意味着苹果的AI模型训练速度明显滞后。一位AI团队成员说:“当竞争对手早就把GPU全抢走了,你不可能凭空变出更多GPU。”
苹果长期以来对用户隐私的承诺,也限制了它的发展。苹果拥有23.5亿活跃设备,能获取比许多竞争对手更多的数据——包括网页搜索、个人兴趣、通信内容等。但苹果对AI研究人员访问用户数据的限制,比谷歌、Meta和OpenAI都要严格。这种隐私承诺甚至延伸到非苹果用户的数据:苹果的网页爬虫Applebot会抓取网页数据,用于Siri、Spotlight和其他搜索功能,但它也允许网站轻松拒绝让自己的数据被用于改进Apple Intelligence。许多网站确实选择了屏蔽。
这些因素导致苹果的研究人员不得不更依赖从第三方授权的数据集,或者是所谓的“合成数据”——即为AI训练而特意生成的人工数据。一位熟悉苹果AI和软件开发的人说:“在这个领域有成千上万的‘不准’,你必须突破隐私监管才能做成任何事情。”另一位高管也持类似观点:“你看看X的Grok,他们会越来越强,因为他们能用整个X平台的数据。那苹果要用什么来训练?”
这又是AI技术与苹果传统优势“格格不入”的一个例子。一位在苹果工作多年的高管说:“我们的传统打法是:我们虽然起步晚,但有10亿以上用户,我们会坚持下去,最终赢得胜利。但这一次,这个策略行不通了。”
DeepSeek等新对手不断涌现
在苹果试图再次挽救其AI业务的当下,它还面临着一些独特的外部挑战。据知情人士透露,为满足欧盟即将实施的监管要求,苹果正计划修改其操作系统,首次允许用户将默认语音助手从Siri切换为第三方选项,如果苹果产品无法取得实质性突破,许多用户可能真的会选择更换语音助手。除了OpenAI、Anthropic、Meta和Alphabet的产品,像DeepSeek这样的创新型初创公司也在不断涌现。
据员工透露,如今苹果在苏黎世的AI办公室正在构建全新的软件架构,旨在取代目前问题缠身的Siri混合系统。这套所谓的“单体模型”(monolithic model)将完全基于大语言模型构建,最终目标是让Siri的对话更自然、信息整合更精准。这个秘密项目毫不意外地被命名为“LLM Siri”。
从得克萨斯到西班牙再到爱尔兰,苹果部署了数千名分析师,对Apple Intelligence生成的摘要进行准确性审查,将输出结果与原始资料进行比对,以确定系统出现AI“幻觉”(即事实扭曲)的频率。得益于最近一次软件更新,iPhone也开始参与改进苹果的合成数据:通过将系统生成的假数据与用户邮件中的语言进行比对,设备能够为AI训练提供真实世界的语言参考点——无需将用户的实际数据输入模型。
今年春天,詹南德里亚被剥夺了对产品开发的全部控制权,包括Siri工程团队和未来机器人设备项目。据几位高管透露,此举是因为库克对他在打造新产品方面的执行能力失去了信心。Siri现在由迈克·洛克韦尔(Mike Rockwell)接管,他曾领导团队开发Vision Pro混合现实头显。洛克韦尔直接向费德里吉汇报工作,而后者则接手了更多与苹果AI软件产品路线图相关的职责。
詹南德里亚的产品经理团队已归入费德里吉的管理体系,而洛克韦尔则重组了Siri管理层,将其头显项目的得力干将安插进关键岗位。原Siri主管沃克手下工程师几乎全被调离,被转派至新项目。
詹南德里亚目前仍负责管理AI研究、大语言模型的开发与优化、AI分析师团队以及部分基础设施团队。据内部人士透露,部分苹果高层曾讨论过进一步缩减詹南德里亚的职责,甚至安排他退休(他已年满60岁)。但费德里吉及其他人担心,若他离职,他招募进苹果的顶尖研究员和工程师也可能会随之出走。至少目前,詹南德里亚仍留任,并告诉同事他不希望在苹果AI工作尚未步入正轨前离开。他还坦言,Siri现在归他人负责,他反而松了一口气。
知情人士透露,詹南德里亚去年曾力推将谷歌的Gemini集成到Siri中,如今它有望在iOS 19中以ChatGPT替代选项的形式亮相。另有消息称,苹果也在与新兴公司Perplexity展开初步洽谈,可能让该公司在Siri中提供ChatGPT替代服务,同时成为Safari中的AI搜索引擎提供商。
在自研聊天机器人的方向上,尽管詹南德里亚过去态度消极,但现在一些高管正推动将Siri真正打造为ChatGPT的竞争对手。为此,苹果正探讨让Siri能够访问开放网络,从多个来源抓取并整合信息。据员工称,苹果内部正在测试的聊天机器人在过去六个月内取得显著进步,部分高管认为其表现已可媲美最近版本的ChatGPT。
将该聊天机器人整合进Siri,有助于为苹果提供“双保险”——以防谷歌每年高达200亿美元的搜索默认协议最终被美国反垄断监管机构叫停。苹果高层对另一项延迟的AI功能也抱有期待:让Siri能与iPhone应用深度整合,使用户能通过语音更全面地控制设备。这项能力若能实现,也将使年收入同样在200亿美元左右的应用商店得以继续在与聊天机器人共存的生态中保持优势。
据苹果内部人士称,在将于2025年6月的WWDC亮相的下一版iOS系统中,苹果计划专注于改进现有的Apple Intelligence功能,并新增一些能力,例如AI优化的电池管理模式和虚拟健身教练。至于Siri的重大升级——包括一年前承诺的内容——可能不会在大会上重点讨论,距离真正发布仍需数月时间。
消息人士还称,尽管苹果对“LLM Siri”寄予厚望,该公司目前正准备在品牌传播中将“Apple Intelligence”与“Siri”进行切割。这实则默认了语音助手口碑不佳已拖累AI形象。此外,苹果还决定,今后大多数功能将在发布前不提前几个月进行公开预告。
Siri联合创始人基特劳斯对AI版Siri仍持乐观态度。他说:“所有大型模型公司都不懂什么是真正的助手,而苹果自2010年起就在探索这个概念。”他认为,苹果现在只需完成“Siri大脑移植”, 凭借其入口优势和品牌认知,完全可能重夺智能助手霸主地位。
评论