你的位置:刘涛李晨车震 > hongkongdoll >

bt工厂网址 华泰证券:DeepEP开源有望开释推理需求 神气诳骗与算力


发布日期:2025-03-18 18:52    点击次数:154

bt工厂网址 华泰证券:DeepEP开源有望开释推理需求 神气诳骗与算力

  华泰证券觉得,DeepSeek通过优化推理老本,有望股东LLM贸易化诳骗加快。基于此bt工厂网址,看好推理需求开释带动IaaS作事商稼动率种植,云厂商有望受益。其次,接头到R1带来模子才气种植的同期又可竣事低老本部署,有望带动AI诳骗加快浸透。终末,尽管现在DeepEP仍需要在Hopper+CUDA+NVLink的框架下竣事,但中永恒来看,跟着国产卡的适配跟进,时期有望向更多国产生态移动,国产AI算力板块有望迎来成长机遇。

  全文如下

  华泰 | 磋磨机:DeepSeek - EP降本,神气诳骗与算力

  2025年3月1日,DeepSeek发布《One More Thing, DeepSeek-V3/R1 Inference System Overview》,其中提到通过大模子跨节点内行并行,DeepSeek竣事了$87,072/天的低老本推理,有用算力获得权臣种植。咱们觉得,跟着国产算力硬件缓缓适配DeepEP体系,DeepSeek模子或通过性价比上风带动推理需求开释,国产算力有望加快成长。

探花极品

  中枢不雅点

  中枢亮点:推理老本大幅裁减bt工厂网址,理思景况下15%付费率即可盈亏平衡

  据DeepSeek,V3和R1推理作事占用节点总数,峰值占用为278个节点,平均占用226.75个节点,DeepSeek假设GPU租借老本为2好意思金/小时,总老本为$87,072/天。此外,在2025/02/27 12:00 PM至2025/02/28 12:00 PM,V3和R1模子推理耗尽Token 776B(输入608B+输出168B),平均每百万Token经管老本为0.11好意思元。DeepSeek假设要是通盘Tokens一起按照DeepSeekR1的订价磋磨,表面上一天的总收入为$562,027,老本利润率545%。但接头到现在DeepSeek仅通过API收费,旧地们测算若按照R1收费订价,付费Token占总Token的15%即可竣事推理经过的盈亏平衡。

  中枢时期:通过EP竣事更高的浑沌量和更低的蔓延

  DeepSeek-V3 / R1 推理系统的优化主义是:更大的浑沌,更低的蔓延。为了竣事这两个主义,DeepSeek的有缱绻是使用大边界跨节点内行并行(Expert Parallelism/EP),并开源了DeepEP代码。具体来看,中枢才气包括:1)大边界跨节点内行并行:选择了预填充-解码剖析架构,不同阶段同期进行多个内行并行磋磨;2)磋磨/通讯重迭:将GPU中的SM(流多经管器)辩认为磋磨、通讯两部分,各自同期推行相应使命负载,减少蔓延恭候时间;3)负载平衡:通过预填充负载平衡、解码负载平衡、内行并行负载平衡,尽可能地为每个 GPU 分派平衡的磋磨负载、通讯负载。

  中枢原因:推理订价/老本的相反或为外部算力供应受限的扫尾

  对比来看,国外模子如OpenAI o3-mini在推理订价方面较DeepSeek更贵,如每百万Token输入的价钱为$0.55(缓存掷中),而R1为$0.14。咱们觉得,API订价的相反或有格外一部分来自于推理老本的相反,DeepSeek或凭借EP等更极致的软硬件优化,竣事推理老本的省俭。咱们觉得,这一欢畅的背后,反应的是国表里算力供应以及产业地点的相反。国内大模子厂商在算力供给受限的配景下,通落后期优化的阵势按捺压榨硬件性能,在有限的算力下竣事最优的模子恶果。基于此,咱们觉得,国内模子有望凭借性价比上风,带动下流贸易化诳骗,竣事群众商场的份额种植。

  中枢受益:DeepEP开源有望开释推理需求,神气诳骗与算力

  咱们觉得,DeepSeek通过优化推理老本,有望股东LLM贸易化诳骗加快。基于此,咱们看好推理需求开释带动IaaS作事商稼动率种植,云厂商有望受益。其次,接头到R1带来模子才气种植的同期又可竣事低老本部署,有望带动AI诳骗加快浸透。终末,尽管现在DeepEP仍需要在Hopper+CUDA+NVLink的框架下竣事,但中永恒来看,跟着国产卡的适配跟进,时期有望向更多国产生态移动,国产AI算力板块有望迎来成长机遇。

  风险领导:AI时期迭代不足预期;AI贸易化不足预期;本论述基于客不雅信息整理bt工厂网址,不组成投资提议。

图片图片

友情链接: