锦鲤体育-梁文锋署名，DeepSeek再发论文

产品

iEnter|智慧企业 iEnter|智慧企业: 企业资源计划管理系统智钉

iManu|智能制造 iManu|智能制造: 制造执行系统物流执行系统高级计划及排程

iSupply|智慧供应链 iSupply|智慧供应链: 运输管理系统仓储管理系统供应商关系管理系统

EP|智慧生态营销 EP|智慧生态营销: 经销商管理系统全面营销管理系统客户关系管理系统

Connect|智能网联 Connect|智能网联: 智能网联云平台新能源汽车监控平台商用车企业监控平台电检系统行驶记录仪车载T-BOX 汽车故障诊断仪国六OBD产品后装GPS产品

DataValue|数据价值赋能 DataValue|数据价值赋能: 智慧质量线索运营智慧广告

Platform|云原生PaaS平台 Platform|云原生PaaS平台: 云原生PaaS平台容器引擎（QKP） AI智能服务平台 API网关平台低代码平台-QLCP 元宇宙技术探索平台数据中台智能运维平台

服务

咨询咨询: 车路协同解决方案 IT咨询云原生技术架构规划与咨询服务

评测评测: 网络安全等级保护测评

实施实施: 电子电气检测服务网联产品组装制造

运维运维: 桌面及外围设备运维服务云服务（IDC）销贷服务乘用车车联网运营服务商用车车联网运营服务客户联络中心运营服务数据价值运营服务 K8s运维

关于锦鲤体育

企业简介企业简介: 企业简介

企业价值企业价值: 企业荣誉行业地位资质认证

社会责任社会责任

企业文化企业文化

投资者关系投资者关系

麾下企业麾下企业

加入锦鲤体育加入锦鲤体育: 业务发展规划福利待遇人才招聘

信息公开

企业基本信息企业基本信息: 企业概况经营范围市场主体登记基本信息组织机构成员单位资质荣誉

企业重大事项企业重大事项: 股权信息产权信息研发成果

企业经营管理企业经营管理: 财务与经营状况品牌与产品

安全环保安全环保: 安全信息

招标招募招标招募: 招标信息

人力资源人力资源: 招聘信息

社会责任社会责任

企业公告企业公告: 上市公司公告信息

投资者关系加入锦鲤体育客户留言

产品 +

iEnter|智慧企业 +

企业资源计划管理系统

iManu|智能制造 +

制造执行系统

物流执行系统

高级计划及排程

iSupply|智慧供应链 +

运输管理系统

仓储管理系统

供应商关系管理系统

EP|智慧生态营销 +

经销商管理系统

全面营销管理系统

客户关系管理系统

Connect|智能网联 +

智能网联云平台

新能源汽车监控平台

商用车企业监控平台

行驶记录仪

汽车故障诊断仪

国六OBD产品

后装GPS产品

DataValue|数据价值赋能 +

Platform|云原生PaaS平台 +

云原生PaaS平台

容器引擎（QKP）

AI智能服务平台

API网关平台

低代码平台-QLCP

元宇宙技术探索平台

智能运维平台

服务 +

车路协同解决方案

云原生技术架构规划与咨询服务

评测 +: 网络安全等级保护测评

电子电气检测服务

网联产品组装制造

桌面及外围设备运维服务

云服务（IDC）

乘用车车联网运营服务

商用车车联网运营服务

客户联络中心运营服务

数据价值运营服务

关于锦鲤体育 +

企业简介 +: 企业简介

企业价值 +

社会责任 +

企业文化 +

投资者关系 +

麾下企业 +

加入锦鲤体育 +

业务发展规划

投资者关系

加入锦鲤体育

客户留言

锦鲤体育-梁文锋署名，DeepSeek再发论文

2026-04-08 04:19:45

　　

近日

DeepSeek团队发表新论文

论文以DeepSeek-V3为焦点案例

披露其于AI硬件架构

与模子设计方面的要害立异

为实现具备成本效益的

年夜范围练习及推理提供思绪

论文显示

DeepSeek开创人兼CEO梁文锋

也是介入者之一

梁文锋署名，DeepSeek再发论文

DeepSeek论文《深切解读 DeepSeek-V3：AI 架构的扩大挑战与硬件思索》

图源：论文截图

有业内子士暗示

该论文聚焦“硬件-模子”

协同立异底层逻辑

直击当前年夜模子练习

与推理的效率痛点

一路来看↓

揭秘DeepSeek模子设计原则

于练习年夜模子这条路上

可以说一直有“三浩劫题”

内存不敷用

计较效率低

通讯速率慢

而这篇论文所要解决的

恰是上述的这些问题

与此前发布的V3技能陈诉差别

这篇论文具体论述了DeepSeek

怎样做到于硬件资源的“紧箍咒”下

经由过程精妙的“软硬一体”协同设计

将成本效益这笔账算好

DeepSeek于论文中提到

本文的目的不是重申

DeepSeek-V3的具体架谈判算法细节

是超过硬件架谈判模子设计

采用两重视角来摸索它们之间

扑朔迷离的彼此作用

以实现具备成本效益的

年夜范围练习及推理

梁文锋署名，DeepSeek再发论文

DeepSeek-V3的基本架构

图源：论文截图

详细而言

论文聚焦内存效率、成本节制、

推理速率等方面睁开申明

DeepSeek模子设计原则

于内存效率方面

多头潜于留意力（MLA）技能

经由过程压缩键值（KV）缓存

缓存显著降低了内存耗损

FP8混淆精度练习技能

将内存耗损显著降低了一半

从数据来看

比拟其他模子

（如LLaMA-三、Qwen-2.5）

DeepSeek-V3的KV缓存巨细

每一token仅需70 KB

是传统要领的1/7到1/4

年夜幅降低显存压力

特别合适长文本处置惩罚

于成本节制方面

DeepSeek开发了DeepSeek MoE架构

其两年夜上风包括降低练习成本

及利在小我私家利用及当地部署

于提高推理速率方面

DeepSeek-V3采用的是

多token猜测（MTP）的要领

传统模子每一次只能天生1个token

而MTP经由过程轻量级子模子并行

猜测多个候选token

验证后选择最优成果

试验效果显示

天生速率晋升1.8倍

OpenAI结合开创人

Andrej Karpathy此前惊叹

“DeepSeek-V3的呈现

实现了高机能与低成本的均衡

将来也许不需要

超年夜范围的GPU集群了”

六年夜要害摸索将来AI基础举措措施

下一代AI基础举措措施

将怎样进级？

DeepSeek从硬件架构的角度

提出六年夜标的目的

触及内存、互连、收集、

计较等焦点范畴

梁文锋署名，DeepSeek再发论文

图源：虎嗅

总体来看，包括

“鲁棒性优先：

构建不容易瓦解的练习体系”

“倾覆互连架构：

CPU-GPU直连消弭节点瓶颈”

“智能收集进级：

动态路由实现低延迟”

“通讯挨次‘硬件化’：

消弭软件分外开消”

“收集计较交融：

硬件加快通讯效率”

“内存架构重构：

从‘芯片重叠’到‘晶圆集成’”

这些专业名词

非里手乍一看有些难明

有业内子士“翻译”称

就是下一代AI硬件要向

算数快（低精度计较+当地细粒器量化）

传话快（直连收集+智能路由）

记性好（3D内存+近存计较）

不宕机（自愈收集）的标的目的改良

才能更好地运用在年夜模子练习

实现高效扩大

梁文锋署名，DeepSeek再发论文

图源：收集

DeepSeek暗示

这些内存中央的架构立异

旨于打破当前内存成长

滞后在模子范围扩张的瓶颈

是下一代AI体系连续迈向

“更年夜、更快、更稳”的要害路径之一

同时这些方案也于DeepSeek-V3

练习与推理实践中均取患了实效

为下一代高机能AI体系

构建了坚实的内存支撑基础

参考：上海证券报、财联社、量子位

撰文：雷渺鑫编纂：李飞排版：李汶键兼顾：李政葳

-锦鲤体育

地址：长春净月高新技术产业开发区百合街1009号

版权所有：锦鲤体育信息技术股份有限公司

电话：0431-85861717/ 4001182299