首页  资讯  商机   下载  拆解   高校  招聘   杂志  会展  EETV  百科   问答  电路图  工程师手册   Datasheet  100例   活动中心  E周刊阅读   样片申请
EEPW首页 >> 主题列表 >> deepseek-r2

deepseek-r2 文章 最新资讯

高达256GB/s带宽+160 TFLOPS算力,安谋科技“周易”X3 NPU IP R2升级

  • 近日,在安谋科技Tech Talk AI技术开放麦第二期活动中,NPU高级产品经理Benjamin Ye围绕“周易”X3 NPU IP R2版本升级进行了主题分享,详细介绍了R2版本在算力与算力密度方面的显著提升,并结合“周易”X3智能座舱、AI推理加速芯片及新兴市场等多个领域的落地案例,系统展示了“周易”X3系列NPU的最新进展与广泛应用。 1、最高算力翻倍、算力密度提升超70%据Benjamin Ye介绍,“周易”X3 R2版本相较R1最高算力翻倍,针对W4A8、W4A16主流大模型量化精度
  • 关键字: 安谋科技  周易”X3 NPU IP R2  

中国AI史上最大融资:DeepSeek背后的野心与变局

  • DeepSeek正进行首轮融资,金额高达500亿元人民币,其中创始人梁文锋个人或出资200亿。若顺利完成将刷新中国AI公司融资纪录,其估值也将飙升至515亿美元,重塑全球大模型产业格局。更值得关注的是,DeepSeek V4.1或于6月登场,主打MCP协议适配与多模态能力。而大洋彼岸OpenAI发布GPT-5.5系列的同时,Anthropic年化收入已突破440亿美元。在多模态理解、长程智能体、商业营收等维度上,DeepSeek与顶尖对手仍存在差距。这笔融资将如何缩短追赶距离,又将把中国AI引向何方?商业
  • 关键字: AI  DeepSeek  OpenAI  Anthropic  大语言模型  

摩尔线程完成DeepSeek-V4全链路工程化适配:S5000基于MUSA+SGLang实现复杂MoE模型快速落地

  • 近日,摩尔线程依托旗舰级AI训推一体智算卡MTT S5000与自研MUSA软件栈,基于SGLang 开源推理框架,成功完成DeepSeek-V4的完整运行验证。该成果表明,面向新一代MoE大模型,摩尔线程已构建起从硬件架构核心计算引擎承接、热点算子支持,再到端到端部署验证的系统化适配链路,验证了国产GPU平台对前沿大模型“框架级兼容、开箱即落地”的承载实力及工程化落地能力。随着大模型架构持续演进,DeepSeek-V4等先进模型对底层精度能力、算子覆盖、编译优化、并行通信和推理效率提出了严苛要求。摩尔线程
  • 关键字: 摩尔线程  DeepSeek-V4  全链路工程化  

摩尔线程S5000 + 智源FlagOS:基于原生FP8引擎,Day-0适配DeepSeek-V4

  • 4月24日,摩尔线程携手智源众智FlagOS社区,在旗舰级AI训推一体全功能GPU MTT S5000上,率先实现对新一代大模型DeepSeek-V4-Flash的Day-0极速适配,并完成了全量核心算子的深度优化与部署支持。DeepSeek-V4-Flash 采用混合专家(MoE)架构,总参数量高达284B,激活参数13B,支持百万token上下文长度。其预训练数据超32Ttoken,在最大推理力度模式(Flash-Max)下推理能力逼近Pro版本。值得关注的是,V4模型首次采用“FP4+FP8”混合精
  • 关键字: 摩尔线程  S5000  智源  FlagOS  FP8引擎  DeepSeek-V4  

特斯拉中国车机牵手豆包、DeepSeek

  • 据网信上海消息,特斯拉车机语音大模型服务于4月20日完成备案。这也是自2013年进入中国市场以来,特斯拉车机语音助手的一次大更新。备受关注的特斯拉中国车机语音大模型服务终于尘埃落定。据科创板日报从知情人士处获悉,特斯拉车机语音服务将接入豆包大模型。按照相关规定,已上线的生成式人工智能应用应在显著位置或产品详情页面公示所使用已备案生成式人工智能服务情况,注明模型名称及备案号,并根据《人工智能生成合成内容标识办法》添加生成合成内容标识。事实上,早在备案消息公布之前,特斯拉中国官网的《特斯拉车机语音助手使用条款
  • 关键字: 特斯拉  豆包  DeepSeek  

DeepSeek V4发布前奏?已适配华为AI芯片

  • 4月8日凌晨,DeepSeek迎来重要更新,在最新版本中DeepSeek输入框上方新增“快速模式”与“专家模式”。系统提示:快速模式适合日常对话,即时响应;专家模式擅长复杂问题,高峰需等待。不过,目前新版本还处于灰度测试中,并不是全量版本,可以在对话框里输入“专家模式”,就会自动启用新版本。当然,将用户自然分流至两个入口,这本身也是一种算力调度策略,有助于实现限额限流、缓解峰值压力。根据当前测试与网友分析:快速模式背后可能调用了一个更轻量的V4 Lite模型;专家模式则疑似路由至更大、更强的模型,有猜测认
  • 关键字: DeepSeek  华为  AI  芯片  

再决胜负?中国AI人才正在改写全球版图

  • 《经济学人(The Economist)》近日发表题为“中国正赢得人工智能人才竞赛(China is winning the AI talent race”的文章。指出,过去十年,尽管美国在AI人才争夺战上保持领先,但在关键的AI“顶尖人才”维度上,中国正迅速超越美国。去年底,英伟达掌门人黄仁勋在一场关于人工智能的问答活动中,问了自己一个问题:“美国有没有可能在人工智能上落后于我们国家?”他的回答也很直接:“绝对有可能。”这似乎有些令人惊讶,因为过去十年大部分时间里,美国在AI竞赛中一直处于相对领先的位置
  • 关键字: AI  制造业  DeepSeek  姚班  

日本最强AI被曝套壳DeepSeek

  • 3月17日,日本互联网巨头乐天集团发布大模型Rakuten AI 3.0,并将其定义为在日本经济产业省与新能源产业技术综合开发机构(NEDO)推动的GENIAC项目框架下开发的“日本国内最大规模高性能AI模型”。然后发布当天,这款日本最强大模型就“翻车”了。截至目前,乐天集团没有任何公开回应。根据乐天的官方新闻稿,Rakuten AI 3.0是"基于开源社区最优秀的模型,结合乐天独自的高品质双语数据、技术力和研究成果开发"的,对Deepseek只字未提。不过,模型上线后不久,技术社区很
  • 关键字: AI  DeepSeek  Rakuten  

深度求索上下文窗口扩大十倍,智谱同步发布新模型,中国AI竞赛加速

  • 中国的AI大模型竞赛正在加速升温。据《南华早报》报道,中国AI初创公司深度求索(DeepSeek)已对其旗舰模型进行重大升级,显著扩展了上下文窗口并更新了知识库,引发市场对其下一代重磅模型发布的高度期待。报道称,此次升级将模型的上下文窗口从12.8万token大幅扩展至超过100万token——接近十倍的增长,有望显著增强其处理和回应复杂提示的能力。同时,模型的知识截止时间也从2024年7月延长至2025年5月,新增近一年的信息,使用户能够获取更近期的数据。不过,据凤凰网科技指出,此次升级并未引入多模态视
  • 关键字: deepseek  AI  

深度求索有望获准采购英伟达H200芯片,中国 reportedly 给出有条件放行信号

  • 路透社报道,在市场传闻深度求索(DeepSeek)计划于农历新年假期期间发布其下一代AI大模型之际,中国已向这家头部初创公司发出有条件批准,允许其采购英伟达(NVIDIA)的H200 AI芯片,但具体监管条款仍在最终敲定中。深度求索可能并非唯一获准的企业。路透社此前曾报道,包括字节跳动、阿里巴巴和腾讯在内的其他中国科技巨头也已获得授权,合计可采购超过40万颗H200芯片。报道称,中国工业和信息化主管部门已对这四家公司发放了采购许可,但均附带条件,相关细则尚在完善。据一位消息人士透露,这些具体条款正由中国的
  • 关键字: Deepseek  英伟达  H200  

字节跳动、阿里、深度求索据传将于2月集中发布新模型,助推中国AI竞赛白热化

  • 据传,中国多家科技公司计划在2026年农历新年假期期间(2月)密集推出新一代人工智能大模型。根据自媒体“ijiwei”报道,消息人士透露,字节跳动和阿里巴巴正筹备在此期间发布全新旗舰AI模型。此前,《EE Times China》曾指出,深度求索(DeepSeek)近期在其GitHub代码库中更新了名为“MODEL1”的新架构标识,被广泛视为其下一代旗舰模型 DeepSeek V4 的技术基础。有消息称,该模型最早可能于2026年2月中旬发布,将进一步加剧行业竞争。字节跳动加码AI:三
  • 关键字: 字节跳动  阿里  Deepseek  

周年回顾|DeepSeek如何改变开源AI

  • 在DeepSeek R1发布一周年之际,让我们一起来回顾DeepSeek究竟是如何改变了开源AI —— R1并不是当时最强的模型,真正意义而在于它如何降低了三重壁垒。i. 技术壁垒:通过公开分享其推理路径和后训练方法,R1将曾经封闭在API背后的高级推理能力,转变为可下载、可蒸馏、可微调的工程资产,推理开始表现得像一个可复用的模块,在不同的系统中反复应用。这也推动行业重新思考模型能力与计算成本之间的关系,这种转变在中国这样算力受限的环境中尤为有意义。ii. 采用壁垒:R1以MIT许可证发布,使其使用、修改
  • 关键字: DeepSeek  开源  AI  

DeepSeek新模型曝光:MODEL1代码预示新架构,最快有望2月发布

  • 1 月 21 日消息,The Information 月初爆料称,DeepSeek 将在今年 2 月中旬农历新年期间推出新一代旗舰 AI 模型 ——DeepSeek V4,将具备更强的写代码能力。1 月 20 日,正值 DeepSeek-R1 发布一周年之际,有开发者发现 DeepSeek 在 GitHub 中更新了一系列 FlashMLA 代码,横跨 114 个文件中有 28 处都提到了未知的“MODEL1”大模型标识符。该标识符与已知的现有模型“V32”(即 DeepSeek-V3.2)被并列或区别提
  • 关键字: DeepSeek  MODEL1  代码  新架构  DeepSeek V4  

中国开源AI模型崛起,Llama彻底出局

  • AGI虽在实际应用中仍存局限性,但曙光现已成为今年行业的共识。在一系列技术任务中,从ChatGPT到Gemini,许多世界领先的AI模型正超越人类基准线:据斯坦福大学《2025年AI指数报告》,AI已在7项测试中超越人类基准线,这些测试衡量的任务包括:图像分类、视觉推理、中等阅读理解、英语语言理解、多任务语言理解、竞赛级数学、博士级科学问题。
  • 关键字: 开源  AI  模型  Llama  DeepSeek  

中国开源AI模型下载量首超美国,DeepSeek再出手

  • 近日,一份来自麻省理工学院(MIT)与开源社区Hugging Face的联合报告显示:在刚刚过去的一年里,中国研发的开源人工智能模型在全球下载量中的占比达到了17.1%,历史上首次超越了美国的15.8%。图(来源:Financial Times) | 每周开发者下载份额,红色及粉色区域为中国AI模型这项研究表明,在开放模型这一关键领域,中国企业正以其开源策略对美国公司过去主要依赖闭源模型所建立的竞争优势,已经构成了不可忽视的挑战。DeepSeek和阿里巴巴的Qwen等中国模型,正凭借其独特的开发与推广模式
  • 关键字: 开源  AI  大模型  DeepSeek  
共113条 1/8 1 2 3 4 5 6 7 8 »
关于我们 - 广告服务 - 企业会员服务 - 网站地图 - 联系我们 - 征稿 - 友情链接 - 手机EEPW
Copyright ©2000-2015 ELECTRONIC ENGINEERING & PRODUCT WORLD. All rights reserved.
《电子产品世界》杂志社 版权所有 北京东晓国际技术信息咨询有限公司
备案 京ICP备12027778号-2 北京市公安局备案:1101082052    京公网安备11010802012473