AI存储新纪元:三星与SK海力士全力冲刺尖端NAND产能
AI存储新纪元:三星与SK海力士全力冲刺尖端NAND产能
ongwu 深度观察
在人工智能驱动的数据洪流中,存储不再是“后台配角”,而是决定AI系统性能与效率的“神经末梢”。当三星与SK海力士双双加码尖端NAND产能,我们正见证一场静默却深刻的产业变革。
一、AI的“饥饿”:存储需求的结构性跃迁
人工智能,尤其是大模型训练与推理的爆发式增长,正在重塑整个计算架构的底层逻辑。传统以CPU为中心的冯·诺依曼架构,正面临“内存墙”与“存储墙”的双重挤压。而在这场变革中,NAND闪存——这一长期被视为“冷数据存储”的介质,正悄然站上舞台中央。
据TrendForce最新数据显示,2024年全球AI服务器出货量预计同比增长超过60%,其中配备高性能存储的机型占比已突破75%。更关键的是,AI工作负载对存储提出了前所未有的要求:高带宽、低延迟、大容量、高耐久性。传统eMMC或低端TLC NAND已无法满足需求,取而代之的是高耐久性TLC/QLC、ZNS(Zoned Namespaces)NAND、以及面向CXL协议的存储级内存(SCM)解决方案。
“AI不是跑在CPU上,而是跑在数据流上。”一位不愿具名的三星半导体高管在内部会议中如此强调。这正是三星与SK海力士加速布局尖端NAND产能的核心动因——AI正在将存储从‘成本中心’转变为‘性能瓶颈与价值高地’。
二、三星:从“量”到“质”的战略跃迁
作为全球NAND市场的长期领导者,三星电子在2024年Q2财报中明确表示,将把超过70%的NAND资本支出投向176层以上V-NAND及下一代236层技术。这一决策背后,是其对AI存储市场的精准卡位。
1. 技术路线:垂直堆叠的极限突破
三星的V-NAND技术已实现176层量产,并计划在2025年初推出236层产品。层数的提升不仅意味着单位面积存储密度的增加,更关键的是,通过通道孔(Channel Hole)蚀刻精度的提升与电荷陷阱型(Charge Trap Flash, CTF)结构的优化,三星在保持高耐久性的同时,显著降低了读写延迟。
更重要的是,三星正在将ZNS NAND作为AI存储的核心突破口。ZNS通过将存储空间划分为“区域”(Zone),允许主机(Host)直接管理数据写入顺序,从而减少垃圾回收(GC)开销,提升写入性能与寿命。在AI训练场景中,ZNS可减少高达40%的写入放大(Write Amplification),这对于频繁写入检查点(Checkpoint)的模型训练至关重要。
2. 产能布局:平泽P4工厂的“AI专线”
三星位于韩国平泽的P4工厂,是其NAND产能扩张的核心基地。该工厂不仅具备236层V-NAND的量产能力,更被内部称为“AI存储专线”。据供应链消息,P4工厂已预留30%产能专供AI客户,包括微软Azure、谷歌Cloud及多家中国AI芯片厂商。
值得注意的是,三星正在推动NAND与CXL(Compute Express Link)协议的深度融合。通过CXL.mem接口,NAND可被系统识别为“近内存”资源,实现与DRAM的协同调度。这种“存储级内存”架构,正是AI推理场景中降低延迟的关键路径。
三、SK海力士:以“差异化”破局高端市场
与三星的全面领先不同,SK海力士采取的是“技术+生态”双轮驱动策略,试图在AI存储的红海中开辟一条差异化路径。
1. 4D NAND:堆叠之外的维度创新
SK海力士的“4D NAND”并非字面意义上的四维,而是指在三维堆叠基础上引入外围电路(Periphery)下移技术,从而释放更多存储单元空间。其最新176层4D NAND已实现每平方毫米1.67Gb的密度,优于同期三星产品。
更关键的是,SK海力士正在大力推广PLC(Penta-Level Cell)NAND,即每个存储单元存储5比特数据。尽管PLC在耐久性与误码率上面临挑战,但SK海力士通过先进的LDPC纠错算法与动态电压校准技术,已将PLC的P/E周期提升至3000次以上,接近TLC水平。在AI冷数据存储(如训练数据集归档)场景中,PLC可显著降低单位存储成本。
2. 与AI芯片厂商的深度绑定
SK海力士的另一个杀手锏,是其与NVIDIA、AMD等AI芯片厂商的紧密合作。例如,其HBM3E内存已广泛应用于NVIDIA H200 GPU,而NAND部门则顺势推出配套的AI优化型SSD,如面向DGX系统的“AI-Ready SSD”系列。
该系列SSD采用多流写入(Multi-Stream Write)技术,可识别AI工作负载的数据类型(如权重、梯度、日志),并分配至不同耐久性等级的NAND区域,从而延长整体寿命。据测试,在ResNet-50训练任务中,该SSD的寿命较传统产品提升2.3倍。
四、产能竞赛背后的隐忧:技术、成本与地缘政治
尽管三星与SK海力士在尖端NAND产能上高歌猛进,但这场竞赛远非一帆风顺。
1. 技术瓶颈:层数竞赛的边际效益递减
随着V-NAND层数突破200层,通道孔深宽比(Aspect Ratio)已接近蚀刻工艺的物理极限。业界普遍认为,300层可能是当前技术的天花板。未来突破将依赖新材料(如氧化物半导体通道)或新结构(如横向堆叠),而非单纯增加层数。
此外,QLC与PLC的普及也带来可靠性挑战。在AI场景中,数据完整性至关重要,任何比特错误都可能导致模型训练失败。因此,纠错能力与数据路径保护将成为下一代NAND的核心竞争力。
2. 成本压力:资本开支的“军备竞赛”
据估算,建设一条12英寸NAND产线需投入超过100亿美元。三星与SK海力士在2024年的合计资本支出预计达280亿美元,其中NAND占比超60%。这种高强度投入在需求波动时极易导致产能过剩。
更严峻的是,中国厂商如长江存储(YMTC)已在232层NAND上实现量产,并积极拓展AI存储市场。尽管其在高端市场仍处追赶阶段,但价格优势可能迫使韩系厂商陷入“技术领先但利润承压”的困境。
3. 地缘政治:供应链的“去风险化”挑战
美国《芯片与科学法案》及欧盟《芯片法案》均强调本土半导体制造能力。三星已宣布在美国得州泰勒市投资170亿美元建设先进NAND工厂,预计2026年投产。SK海力士也计划在美扩大封装产能。
然而,海外建厂面临人才短缺、成本高昂、供应链不完整等问题。韩国本土的“半导体集群效应”——从材料、设备到测试的一体化生态——难以在海外复制。如何在“全球化布局”与“本土效率”之间取得平衡,将是两大巨头的长期课题。
五、未来展望:AI存储的“新范式”
三星与SK海力士的产能冲刺,不仅是商业竞争,更是一场存储架构范式转移的预演。未来AI存储将呈现三大趋势:
- 存储即计算(Storage as Compute):NAND将集成轻量级处理单元(如存内计算),实现数据“就近处理”,减少数据搬运开销。
- 异构存储池(Heterogeneous Memory Pool):DRAM、SCM、NAND将通过CXL或CXL-like协议统一管理,形成动态分层的存储架构。
- AI原生存储(AI-Native Storage):存储系统将内置AI模型,实时预测工作负载、优化数据布局、主动预防故障。
结语:存储的“觉醒时刻”
当AI的算力需求以每年10倍的速度增长,存储不再是“够用就好”的配角。三星与SK海力士的产能扩张,正是对这一趋势的深刻回应。它们不仅在争夺市场份额,更在定义AI时代的数据基础设施标准。
这场竞赛的终点,或许不是谁的层数更高,谁的产能更大,而是谁能率先构建一个高效、可靠、智能的存储生态系统——一个真正服务于AI“数据饥渴”的神经末梢网络。
ongwu 结语:
在AI的浪潮中,存储正从“沉默的仓库”变为“智慧的管道”。三星与SK海力士的冲刺,不仅是技术的跃进,更是产业认知的升维。我们正站在一个新时代的门槛上——在那里,每一比特数据,都承载着智能的重量。