近期內(nèi)存現(xiàn)貨市場價(jià)格出現(xiàn)小幅回落,一些觀望者以為抄底時(shí)機(jī)已到。但這不過是長期上漲趨勢中的微小波動(dòng)。只要AI應(yīng)用持續(xù)深入,內(nèi)存需求就只會(huì)向上攀升。在Token經(jīng)濟(jì)學(xué)的法則下,內(nèi)存已成為AI時(shí)代名副其實(shí)的“數(shù)字石油”。

Token:AI世界的通用貨幣

要理解內(nèi)存為何不可或缺,先要明白AI的“口糧”是什么。大模型如同一個(gè)數(shù)字大腦,Token(詞元)是其思考與交流的最小單元。當(dāng)你向AI提問時(shí),系統(tǒng)會(huì)將文字拆解成一個(gè)個(gè)Token編號(hào)進(jìn)行處理。

英偉達(dá)CEO黃仁勛提出的“Token經(jīng)濟(jì)學(xué)”認(rèn)為,Token不僅是算力的計(jì)量單位,更是智能時(shí)代的硬通貨。他描繪的未來圖景中,AI智能體將像靈活的“龍蝦鉗”一樣處理各類事務(wù),而驅(qū)動(dòng)這些智能體運(yùn)轉(zhuǎn)的根本燃料,就是源源不斷的Token產(chǎn)出。

每一個(gè)Token都在消耗內(nèi)存

為什么Token激增必然拉動(dòng)內(nèi)存需求?這要回到AI推理的“工作記憶”機(jī)制。在AI系統(tǒng)中,DRAM扮演著短期記憶的角色——每一次對(duì)話交互都需要內(nèi)存實(shí)時(shí)存儲(chǔ)相關(guān)數(shù)據(jù)。

數(shù)據(jù)顯示,一個(gè)日均消耗1000萬Token的重度用戶,原始文本僅約40MB,但為了快速響應(yīng),系統(tǒng)需要將其轉(zhuǎn)換為向量索引并保存會(huì)話狀態(tài),數(shù)據(jù)量會(huì)膨脹至50GB到100GB。打個(gè)比方:讓AI編寫代碼時(shí),它會(huì)同時(shí)開啟多個(gè)智能體分別負(fù)責(zé)編寫、審查、測試、修改——每個(gè)智能體都要占用大量內(nèi)存。一句話:AI越復(fù)雜,內(nèi)存越費(fèi)。

正因如此,全球資本和終端廠商都緊盯著屈指可數(shù)的內(nèi)存供應(yīng)商——三星、SK海力士、美光,以及中國唯一規(guī)模化量產(chǎn)的長鑫存儲(chǔ)。誰掌握內(nèi)存,誰就掌握AI時(shí)代的供應(yīng)鏈話語權(quán)。

谷歌TurboQuant:實(shí)驗(yàn)室里的插曲

谷歌研究院近期發(fā)布的TurboQuant論文,一度讓市場擔(dān)心內(nèi)存需求會(huì)被壓縮。但深入分析就會(huì)發(fā)現(xiàn),一篇論文遠(yuǎn)不足以改變內(nèi)存的長期走勢。

首先,摩根士丹利指出,TurboQuant主要針對(duì)KV緩存壓縮,影響僅限于部分三級(jí)存儲(chǔ)成本,而非整體內(nèi)存需求。其次,從算法原型到大規(guī)模工業(yè)落地需要漫長周期,歷史上類似優(yōu)化從未逆轉(zhuǎn)硬件規(guī)格升級(jí)的趨勢。最關(guān)鍵的是,即便算法真的能壓縮單個(gè)Token的內(nèi)存占用,根據(jù)“杰文斯悖論”,效率提升反而會(huì)降低使用門檻,刺激更廣泛的調(diào)用,最終使總內(nèi)存需求爆炸式增長。

端側(cè)AI引發(fā)內(nèi)存焦慮

Token爆發(fā)帶來的內(nèi)存焦慮正從云端蔓延至個(gè)人設(shè)備。為了讓端側(cè)AI流暢運(yùn)行,廠商開始瘋狂堆料:

AI PC正邁向32GB時(shí)代——16GB僅夠勉強(qiáng)運(yùn)行AI應(yīng)用,2026年下半年換機(jī)潮中,32GB乃至更高容量將成為標(biāo)配。旗艦手機(jī)同樣面臨“生存紅利”,16GB/24GB內(nèi)存正成為新機(jī)標(biāo)配。多模態(tài)應(yīng)用更是存儲(chǔ)吞噬者——一分鐘視頻的體積是同長度文本的上萬倍,這些必須秒開的“熱數(shù)據(jù)”全部壓在高速內(nèi)存上。

閑魚上的內(nèi)存降價(jià)只是浮云。當(dāng)前內(nèi)存價(jià)格仍是兩年前低點(diǎn)的近兩倍。全球主流AI存儲(chǔ)產(chǎn)品基本處于“下線即發(fā)貨”的缺貨狀態(tài)。正如“HBM之父”金正浩所言:未來架構(gòu)將徹底轉(zhuǎn)向“以內(nèi)存為中心”。算法的修修補(bǔ)補(bǔ)擋不住Token時(shí)代的滾滾車輪。只要你還想用上更聰明的AI,內(nèi)存需求就沒有天花板。