首页  资讯  商机   下载  拆解   高校  招聘   杂志  会展  EETV  百科   问答  电路图  工程师手册   Datasheet  100例   活动中心  E周刊阅读   样片申请
EEPW首页 >> 主题列表 >> deepseek

deepseek 文章 进入deepseek技术社区

挑战DeepSeeK 「AI教母」打造AI模型训练成本不到50美元

  • DeepSeek强敌来了! 被誉为「AI教母」的知名华裔美籍科学家李飞飞领导的团队,以低于50美元的云计算成本,成功训练出名为「s1」的人工智能推理模型。 此模型在数学和编码能力测验中的表现,据称媲美OpenAI o1和DeepSeek R1等尖端推理模型。科创板日报、新浪科技报道,李飞飞团队的s1模型并非从头训练,而是建立在阿里巴巴的Qwen2.5 和 Google DeepMind的Gemini 2.0 Flash Thinking的基础之上。 他们搜集了1000个精心挑选的问题及其解答,并通过记录
  • 关键字: DeepSeeK  AI模型  李飞飞  

DeepSeek引爆 AI,国产 GPU 集体撑腰

  • 近日,想必诸多用户都怀揣着这样的疑惑:我的手机为何频频推送关于 DeepSeek 的资讯?这 DeepSeek 究竟是什么?它又为何能在问世之际,就引发如此热烈的关注与轰动?DeepSeek,全称杭州深度求索人工智能基础技术研究有限公司,其起源于一家中国的对冲基金公司 High-Flyer。2023 年 5 月 High-Flyer 剥离出一个独立实体,也就是 DeepSeek。这是一家致力于打造高性能、低成本的 AI 模型。它的目标是让 AI 技术更加普惠,让更多人能够用上强大的 AI 工具。DeepS
  • 关键字: DeepSeek  

中小AI芯片企业感谢DeepSeek R1:给了我们机会和订单

  • 2月8日消息,中国AI企业深度求索(DeepSeek)最新发布的推理模型R1撼动了美国主导的人工智能生态系统,导致芯片巨头英伟达(NVIDIA)市值缩水数千亿美元。在行业龙头应对冲击波之际,中小型AI企业却将此视为规模化发展的战略机遇。多家AI相关企业表示,DeepSeek的崛起对其而言是"重大机遇"而非威胁。AI芯片初创公司Cerebras Systems首席执行官安德鲁·费尔德曼(Andrew Feldman)指出:"开发者正积极寻求用DeepSeek R1等开源
  • 关键字: AI  DeepSeek R1  

英特尔Gaudi 2D AI加速器为DeepSeek Janus Pro模型提供加速

  • 近日,DeepSeek发布Janus Pro模型,其超强性能和高精度引起业界关注。英特尔® Gaudi 2D AI加速器现已针对该模型进行优化,这使得AI开发者能够以更低成本、更高效率实现复杂任务的部署与优化,有效满足行业应用对于推理算力的需求,为AI应用的落地和规模化发展提供强有力的支持。作为一款创新性的 AIGC模型,DeepSeek Janus模型集成了多模态理解和生成功能。该模型首次采用统一的Transformer架构,突破了传统AIGC模型依赖多路径视觉编码的限制,实现了理解与生成任务的一体化支
  • 关键字: 英特尔  Gaudi 2D  AI加速器  DeepSeek  Janus Pro  

AI基建需求续成长,DeepSeek崛起凸显产业将更注重高成本效益

  • 根据TrendForce集邦咨询最新研究,DeepSeek近期连续发布DeepSeek-V3、DeepSeek-R1等AI模型,将促使终端客户未来更审慎评估投入AI基础设施的合理性,采用更具效率的软件运算模型,以降低对GPU等硬件的依赖。CSP则可能扩大采用自家ASIC基础设施,以降低建置成本。因此,2025年以后产业对GPU AI芯片或半导体实际需求可能出现变化。 TrendForce集邦咨询表示,全球AI Server市场自2023年起快速成长,预期2025年占整体Server出货比
  • 关键字: AI  基建  DeepSeek  

DeepSeek低成本AI模型促光收发模块出货量年增56.5%

  • DeepSeek模型虽降低AI训练成本,但AI模型的低成本化可望扩大应用场景,进而增加全球数据中心建置量。光收发模块作为数据中心互连的关键组件,将受惠于高速数据传输的需求。未来AI服务器之间的数据传输,都需要大量的高速光收发模块,这些模块负责将电信号转换为光信号并通过光纤传输,再将接收到的光信号转换回电信号。根据全球市场研究机构TrendForce集邦咨询统计,2023年400Gbps以上的光收发模块全球出货量为640万个,2024年约2,040万个,预估至2025年将超过3,190万个,年增长率达56.
  • 关键字: TrendForce  集邦咨询  DeepSeek  低成本AI  光通信  光收发模块  

国产大模型 DeepSeek-V3 开源:6710 亿参数自研 MoE,性能和 GPT-4o 不分伯仲

  • 12 月 27 日消息,“深度求索”官方公众号昨日(12 月 26 日)发布博文,宣布上线并同步开源 DeepSeek-V3 模型,用户可以登录官网 chat.deepseek.com,与最新版 V3 模型对话。援引博文介绍,DeepSeek-V3 是一个 6710 亿参数的专家混合(MoE,使用多个专家网络将问题空间划分为同质区域)模型,激活参数 370 亿,在 14.8 万亿 token 上进行了预训练。多项评测成绩超越 Qwen2.5-72B 和 Llama-3.1-405B 等开源模型,
  • 关键字: DeepSeek-V3  AI  大语言模型  人工智能  
共82条 6/6 |‹ « 1 2 3 4 5 6
关于我们 - 广告服务 - 企业会员服务 - 网站地图 - 联系我们 - 征稿 - 友情链接 - 手机EEPW
Copyright ©2000-2015 ELECTRONIC ENGINEERING & PRODUCT WORLD. All rights reserved.
《电子产品世界》杂志社 版权所有 北京东晓国际技术信息咨询有限公司
备案 京ICP备12027778号-2 北京市公安局备案:1101082052    京公网安备11010802012473