金融时报:DeepSeek 因华为芯片问题推迟新人工智能模型
英国《金融时报》周四援引三位知情人士的话报道称,由于使用华为芯片的训练工作失败,DeepSeek推迟了其新人工智能模型的发布。
据英国《金融时报》报道,这家中国人工智能初创公司在使用华为的昇腾芯片训练其 R2 模型时遇到了持续存在的技术问题,促使其使用 Nvidia 芯片进行训练,使用 Ascend 进行推理。
报告称,这些问题是 Deepseek 备受期待的 R2 车型发布从 5 月推迟的主要原因。
英国《金融时报》的报道强调了中国人工智能开发商在减少对美国技术(特别是英伟达人工智能芯片)的依赖方面面临的困难。DeepSeek及其同行早些时候受到北京的鼓励,使用华为的昇腾芯片,尤其是在美国对华芯片出口成为今年的主要争论点的情况下。
虽然美国确实允许英伟达在 7 月份恢复在中国销售其 H20 芯片,但北京对在关键的中国人工智能开发中使用美国制造的芯片表示了安全担忧。
推理——涉及使用经过训练的人工智能模型来生成响应——通常比训练需要更少的计算能力,训练涉及使用大量预先存在的数据来提高人工智能模型的能力。
英伟达的 H20 仍然是迄今为止中国最受欢迎的人工智能芯片,尽管华为和北京都在推动采用后者的 Ascend 系列。美国已将昇腾系列列入黑名单,理由是华为使用受限的美国技术来开发该芯片。
DeepSeek 的 R1 模型今年早些时候震撼了人工智能领域,主要使用 H20 芯片开发。这些芯片还被其他主要的中国人工智能开发商使用,包括字节跳动、腾讯控股有限公司(HK:0700)和 阿里巴巴集团(纽约证券交易所代码:BABA)。
本周早些时候,中国要求当地开发商证明他们订购英伟达芯片的合理性。
中国媒体报道称,R2 型号将在未来几周内发布,因为 DeepSeek 落后于竞争对手的一系列高调发布。
评论