首页  资讯  商机   下载  拆解   高校  招聘   杂志  会展  EETV  百科   问答  电路图  工程师手册   Datasheet  100例   活动中心  E周刊阅读   样片申请
EEPW首页 >> 主题列表 >> deepseek-r1

deepseek-r1 文章 最新资讯

中国开源AI模型崛起,Llama彻底出局

  • AGI虽在实际应用中仍存局限性,但曙光现已成为今年行业的共识。在一系列技术任务中,从ChatGPT到Gemini,许多世界领先的AI模型正超越人类基准线:据斯坦福大学《2025年AI指数报告》,AI已在7项测试中超越人类基准线,这些测试衡量的任务包括:图像分类、视觉推理、中等阅读理解、英语语言理解、多任务语言理解、竞赛级数学、博士级科学问题。
  • 关键字: 开源  AI  模型  Llama  DeepSeek  

中国开源AI模型下载量首超美国,DeepSeek再出手

  • 近日,一份来自麻省理工学院(MIT)与开源社区Hugging Face的联合报告显示:在刚刚过去的一年里,中国研发的开源人工智能模型在全球下载量中的占比达到了17.1%,历史上首次超越了美国的15.8%。图(来源:Financial Times) | 每周开发者下载份额,红色及粉色区域为中国AI模型这项研究表明,在开放模型这一关键领域,中国企业正以其开源策略对美国公司过去主要依赖闭源模型所建立的竞争优势,已经构成了不可忽视的挑战。DeepSeek和阿里巴巴的Qwen等中国模型,正凭借其独特的开发与推广模式
  • 关键字: 开源  AI  大模型  DeepSeek  

趁硅谷过节“开大”!DeepSeek上线“奥数金牌”模型!填平谷歌OpenAI护城河

  • 专挑节假日搞大新闻”的DeepSeek又出手了。就在大洋彼岸的工程师们准备切火鸡庆祝节日时,DeepSeek保持了极客传统,悄然上线了DeepSeekMath-V2。开源权重、IMO金牌水平、超越GPT-5。 这套熟悉的“三连击”,再次巩固了DeepSeek作为“开源灯塔”的地位。 在算力受限的背景下,DeepSeek 再次证明了自己:不需要庞大的 GPU 集群,也能用算法奇迹在最硬核的数学赛道上,教闭源巨头们“做人”。它“不搞虚的”,直接拿数学竞赛界的“终极试金石”,包括2025国际
  • 关键字: 硅谷过节  DeepSeek  奥数金牌  谷歌  OpenAI  

DeepSeek低调发布3.2版本:曾经的顶流大模型,如今热度减退了?

  • 前不久,DeepSeek 悄悄更新了全新的V3.1 版本,这次更新全无公告,只在微信群里做了通知,既没有官方预告,也未同步发布基准测试榜单,仅以“v3.1+”这样保守的命名悄然上线。不得不说,DeepSeek 的低调更新方式,使其在大模型领域也就此一家了。与之形成鲜明对比的是,R1 在大多数人的心目中排名前五,与开启时代的GPT4 等模型并列,其在全球范围内的影响力不容小觑。DeepSeek的低调更新,或许是一种策略,避免过度曝光带来的负面影响,但同时也导致了部分网友的“过山车式”的误解。年初DeepSe
  • 关键字: 202509  DeepSeek  大模型  

英特尔Gaudi 2E AI加速器为DeepSeek-V3.1提供加速支持

  • 英特尔® Gaudi 2E AI加速器现已为DeepSeek-V3.1提供深度优化支持。凭借出色的性能和成本效益,英特尔Gaudi 2E以更低的投入、更高的效率,实现从模型训练的深度突破到推理部署的实时响应,为大模型的加速落地提供新选择。英特尔Gaudi 2E配备96 GB大容量内存,搭载先进的HBM控制器,针对随机访问、线性访问场景进行深度优化,有效避免了AI训练或推理任务的延迟,从而保障了计算流程的流畅性。英特尔Gaudi 2E拥有卓越的可扩展能力,支持多卡互联,为用户提供了灵活的、可定制化的解决方案
  • 关键字: 英特尔  AI加速器  DeepSeek  

金融时报:DeepSeek 因华为芯片问题推迟新人工智能模型

  • 英国《金融时报》周四援引三位知情人士的话报道称,由于使用华为芯片的训练工作失败,DeepSeek推迟了其新人工智能模型的发布。据英国《金融时报》报道,这家中国人工智能初创公司在使用华为的昇腾芯片训练其 R2 模型时遇到了持续存在的技术问题,促使其使用 Nvidia 芯片进行训练,使用 Ascend 进行推理。报告称,这些问题是 Deepseek 备受期待的 R2 车型发布从 5 月推迟的主要原因。英国《金融时报》的报道强调了中国人工智能开发商在减少对美国技术(特别是英伟达人工智能芯片)的依赖方面
  • 关键字: 金融时报  DeepSeek  华为  芯片  人工智能模型  

OpenAI再度回归“开放”赛道,一场精心布局的阳谋

  • 8月6日凌晨(美东时间8月5日),OpenAI发布了两款免费试用的开放权重语言模型gpt-oss-120b和gpt-oss-20b,同时放出的34页技术报告显示模型采用了最先进的预训练和后训练技术,但没有提供用于训练模型的数据。OpenAI联合创始人兼首席执行官山姆·奥特曼(Sam Altman)在社交媒体表示:“gpt-oss是一个重大突破,这是最先进的开放权重推理模型,具有与o4-mini相当的强大现实世界性能,可以在你自己的电脑(或手机的较小版本)上本地运行。我们相信这是世界上最好、最实用的开放模型
  • 关键字: OpenAI  开源  大模型  DeepSeek  

DeepSeek又被“拉黑”

  • 近日,德国联邦数据保护专员迈克·坎普(Meike Kamp)正式向苹果(Apple)与谷歌(Google)提出请求,要求将中国人工智能初创企业深度求索(DeepSeek)的应用程序,从德国区App Store和Google Play下架。2025年6月27日,相应的报告已发送给苹果和谷歌,两家公司现在必须立即审查该报告并决定是否实施封杀DeepSeek。指控“非法转移数据”根据德国当局调查表示,DeepSeek的隐私政策显示,用户的对话内容、上传文件、IP地址、设备信息、敲击键盘的节奏等数据都存储在中国的
  • 关键字: DeepSeek  ChatGPT  AI  GPT-4o  

AI 颠覆者 DeepSeek 的下一代模型因 Nvidia GPU 对中国出口限制而延迟——AI GPU 短缺阻碍开发

  • (图片来源:英伟达)DeepSeek 凭借其今年的 R1 AI 模型吸引了大量关注,但似乎下一代 R2 模型的开发因中国 Nvidia H20 处理器的短缺而停滞,据 信息报道 。DeepSeek 本身尚未评论其 R2 模型的发布时间。DeepSeek 使用由其投资者 High-Flyer Capital Management 获得的包含 50,000 个 Hopper GPU 的集群——其中包括 30,000 个 H20、10,000 个 H800 和 10,000 个 H100——
  • 关键字: DeepSeek  AI  大语言模型  GPU  英伟达  

DeepSeek的下一代模型因Nvidia GPU对中国的出口限制而推迟

  • 据 The Information 报道,DeepSeek 今年早些时候的 R1 AI 模型吸引了大量关注,但由于 Nvidia 的 H20 处理器在中国短缺,下一代 R2 模型的开发似乎已经停滞不前。DeepSeek 本身尚未对其 R2 模型何时可用发表评论。DeepSeek 使用由 50000 个 Hopper GPU 组成的集群(包括 30000 个 H20、10000 个 H800 和 10000 个 H100),该 GPU 由其投资者 High-Flyer Capital M
  • 关键字: DeepSeek  下一代模型  Nvidia  GPU  

美国再出重磅AI禁用法案

  • 当地时间6月25日,美国国会推出了一项重磅法案,旨在“强化美国联邦机构对于外国对手人工智能技术风险的防护能力”。这项名为《禁用敌对人工智能法案》(No Adversarial AI Act)的法案,由国会众议院中特会资深成员拉贾·克里希纳纳莫蒂(Raja Krishnamoorthi)和主席约翰·穆勒纳尔(John Moolenaar)共同提出。该法案得到了两党、两院制的支持,其核心目的在于建立一道明确的“防火墙”,将由外国对手所控制的AI技术从美国政府的敏感系统与数据中有效隔离。美国议员声称这项法案的出
  • 关键字: AI  DeepSeek  

星云智联发布S1400系列AI智算高速互联网卡

  • 6月3日,星云智联正式发布国内领先的S1400系列AI智算高速互联网卡。该系列产品专为满足人工智能大模型训练与推理等智算场景的极致需求而设计,凭借其全自研核心技术与卓越性能,为飞速发展的人工智能产业提供极致高效、稳定可靠的全场景互联解决方案与坚实的网络底座。 目前,产品已成功适配DeepSeek的DeepEP开源通信库,显著提升AI计算集群的通信效率,为AI应用创新注入强劲动力。S1400系列AI智算高速互联网卡具备1x400G或2x200G的网络接口模式,采用PCIe Gen 5.0 x16接口,提供高
  • 关键字: 星云智联  高速互联网卡  DeepSeek  AI训推  

便宜大碗,阿里云开源Qwen3系列大模型

  • 4月29日凌晨,阿里云正式开源Qwen3系列大模型,包括2个MoE模型和6个稠密模型。发布仅2小时,Qwen3已在GitHub收获超16.9k颗Star。据介绍,旗舰模型Qwen3-235B-A22B在编程、数学、通用能力等基准测试中登顶全球,超越DeepSeek-R1、OpenAI o1、Grok-3等主流模型。Qwen3系列是全球首个开源的混合推理(混合思考模式)大模型。也就是说它可根据任务自由切换“思考模式”和“非思考模式”,在不同推理深度下优化输出效果和效率。新一代Qwen3提供8个不同尺寸的模型
  • 关键字: 阿里云  开源  Qwen3  DeepSeek-R1  OpenAI o1  Grok-3  

DeepSeek不是万能 李彦宏:不能理解生成多媒体 外加3项缺陷

  • DeepSeeek大语言模型自从在全球人工智能(AI)界一鸣惊之后,大陆各大科技巨头纷纷将其产品接入,追捧DeepSeek可谓盛况空前。 大陆互联网巨头百度公司创始人李彦宏最近在一场演讲中就DeepSeek的性能坦承,DeepSeek虽强,但也非万能的,它还不能理解和生成图片、视频等多媒体内容,幻觉率较高,更大的问题则是「慢」和「贵」。DeepSeek在全球引起轰动,俨然成为中国对抗西方的民族精神指标,任何批评都可能招来部份热情网民上纲上线的轰炸与指责。 现在「超英赶美」的热情消散,DeepSeek在接入
  • 关键字: DeepSeek  李彦宏  百度  

OpenAI正打造“最强”开源模型 最早夏初发布

  • 4月24日消息,今年3月下旬,OpenAI宣布将在年内推出自GPT-2以来的首个"开源"语言模型。随着该公司与AI开发者社区的交流持续推进,关于这款模型的更多细节也逐步浮出水面。据知情人士透露,OpenAI研究副总裁艾丹·克拉克(Aidan Clark)正主导这项开发工作,目前仍处于初期阶段。OpenAI计划在今年初夏发布该模型,目标是打造一个在开源推理模型中达到顶尖水平的产品。这款模型定位为推理能力模型,类似于OpenAI现有的o系列产品。知情人士称,OpenAI正考虑为该模
  • 关键字: OpenAI  开源模型  GPT-2  DeepSeek  人工智能  
共105条 1/7 1 2 3 4 5 6 7 »
关于我们 - 广告服务 - 企业会员服务 - 网站地图 - 联系我们 - 征稿 - 友情链接 - 手机EEPW
Copyright ©2000-2015 ELECTRONIC ENGINEERING & PRODUCT WORLD. All rights reserved.
《电子产品世界》杂志社 版权所有 北京东晓国际技术信息咨询有限公司
备案 京ICP备12027778号-2 北京市公安局备案:1101082052    京公网安备11010802012473