37000Con威斯人(中国)有限公司-Weixin百科

13922884048

首页
关于我们
产品展示
- 功率器件
  功率器件
  - MOS场效应管
    
     MOS场效应管
    
     低压MOS管
    
     中压MOS管
    
     高压MOS管
    
     COOLMOS
  - IGBT
    
    IGBT
    
    IGBT单管
    
     IGBT模块
  - 可控硅
    
     可控硅
    
     单向可控硅
    
     双向可控硅
  - 碳化硅器件
    
     碳化硅器件
    
     碳化硅场效应管
    
     碳化硅肖特基二极管
  - 功率电子开关
    
     功率电子开关
- 二极管三极管
  二极管三极管
  - 二极管
    
     二极管
    
     稳压二极管
    
     瞬态抑制二极管TVS
    
    静电放电ESD
    
    肖特基二极管
    
     快恢复二极管
    
     超快恢复二极管
    
     开关二极管
    
     触发二极管
    
     半导体放电管(TSS)
    
    通用二极管
    
     高效二极管
    
     整流桥
  - 晶体管
    
     晶体管
    
     三极管(BJT)
    
    数字晶体管
    
     达林顿晶体管
- 电源管理
  电源管理
- 数据转换器
  数据转换器
  - 模数转换器（ADC）
    
    模数转换器（ADC）
  - V/F和F/V转换芯片
    
     V/F和F/V转换芯片
- 传感器
  传感器
- 光电器件
  光电器件
  - 光耦
    
     光耦
  - 光电二极管
    
     光电二极管
- 放大器及基准芯片
  放大器及基准芯片
- 接口芯片
  接口芯片
  - RS232芯片
    
     RS232芯片
  - RS485芯片
    
     RS485芯片
  - CAN芯片
    
     CAN芯片
  - 视频接口芯片
    
     视频接口芯片
- 其他
  其他
  - 达林顿晶体管阵列
    
     达林顿晶体管阵列
  - 晶振
    
     晶振
  - 存储器芯片
    
     存储器芯片
  - 时钟芯片
    
     时钟芯片
  - 小规模逻辑芯片
    
     小规模逻辑芯片
  - 逻辑门
    
     逻辑门
  - 定时器芯片
    
     定时器芯片
  - 触摸屏控制器
    
     触摸屏控制器
  - 触发器
    
     触发器
  - 反相器
    
     反相器
  - 缓冲器和驱动器
    
     缓冲器和驱动器
资讯中心
专家专栏
技术交流
招兵买马
销售网络
免费样品

中文 English

资讯中心

资讯中心

information centre

/

/

/

端侧AI为什么需要SRAM存算一体架构？

发布时间：2025-07-28作者来源：37000Con威斯人浏览：613

从端侧AI芯片工程师的角度来看，面对带宽、能耗与成本三重挑战，引入SRAM存算一体架构（In-Memory Computing, IMC） 是应对当前大模型端侧部署瓶颈的核心解决方案之一。

一、为什么DRAM主存+传统计算架构难以满足端侧大模型部署？

1. 带宽瓶颈（Memory Wall）

DRAM（如LPDDR5/DDR5）的总线带宽在端侧芯片上极为有限（10–50 GB/s），远低于大模型推理所需的数据吞吐量。
以一个70亿参数的FP16模型为例，模型参数约占14GB，若每轮推理都需频繁从DRAM中调入权重，将带来巨大的访问延迟与能耗开销。

2. 功耗与能效不足

数据搬移的能耗远高于计算本身：

一次DRAM访问：约100~200 pJ/bit
一次SRAM访问：约1~10 pJ/bit
一次MAC操作：<1 pJ（单精度）

在Transformer这类大模型中，90%以上能耗和延迟都来源于内存访问。

3. 算力利用率低

传统Von Neumann架构中，计算单元（MAC阵列）等待内存数据的时间极长，导致NPU/AI Core利用率远低于理想值（通常 <50%）。

二、为什么选择SRAM + 存算一体架构？

1. 本质目标：减少数据搬移，提高能效比

将权重存入SRAM，并在SRAM中进行局部计算，可显著减少DRAM读写与片上总线流量，缓解带宽瓶颈。
SRAM的高带宽、低延迟特性，天然适合对参数读取频繁的模型结构（如注意力机制中的QKV矩阵计算）。

2. 实现方式：SRAM阵列+低位宽MAC计算

将部分权重映射到SRAM bitcell结构中，结合周边MAC逻辑实现矩阵向量乘法（MVM）计算。
采用低位宽计算（如INT8甚至Binary），进一步降低功耗。
典型结构如：Processing-in-SRAM，或者更激进的Analog IMC in SRAM（电压、电流作为计算媒介）。

三、SRAM存算一体的优势（工程技术层面）

四、工程实践挑战与解决思路

五、典型芯片案例（支撑观点）

六、总结

SRAM存算一体架构是端侧AI芯片实现“大模型部署”的关键方向。它本质上通过“就地计算”打破传统架构的带宽墙，显著提高能效比和模型推理吞吐，降低功耗和散热压力，同时避免昂贵的DRAM访问带来的BOM成本上升，是应对端侧算力三大矛盾（带宽、功耗、成本）最可行的架构突破。

免责声明：本文采摘自“老虎说芯”，本文仅代表作者个人观点，不代表 37000Con威斯人及行业观点，只为转载与分享，支持保护知识产权，转载请注明原出处及作者，如有侵权请联系我们删除。

上一条：穿越寒冬，向海而行 —— 一位芯片分销人的出海之路
下一条：微芯科技（Microchip）的产品线

新闻推荐

每日芯闻公司动态

热门标签

光耦 IGBT 二极管三极管可控硅整流桥霍尔元件 COOLMOS MOS场效应管碳化硅场效应管碳化硅肖特基二极管

产品推荐

查看更多+

友情链接：站点地图 37000Con威斯人官方微博立创商城-37000Con威斯人专卖金航标官网金航标英文站

Copyright ©2015-2025 37000Con威斯人(中国)有限公司-Weixin百科版权所有粤ICP备20017602号粤公网安备44030002007346号

咨询在线客服

服务热线

0755-83044319

霍尔元件咨询

肖特基二极管咨询

TVS/ESD咨询

获取产品资料

客服微信