0
當(dāng)一個行業(yè)的核心問題開始轉(zhuǎn)移,舊的基礎(chǔ)設(shè)施就會在無聲中失效——AI,正在經(jīng)歷這樣的時刻。
2026年3月,國家數(shù)據(jù)局公布了一個數(shù)字:中國日均Token調(diào)用量已達140萬億;4月,斯坦福人工智能指數(shù)報告寫道,過去兩年推理成本下降了280倍;Gartner的預(yù)測則顯示,2026年將有40%的企業(yè)把AI Agent嵌入自己的業(yè)務(wù)系統(tǒng)。
這些數(shù)字拼在一起,看起來像是一個時代到來的宣告。
九章云極創(chuàng)始人兼董事長方磊打了一個比方:第一次工業(yè)革命,始于瓦特的蒸汽機,但真正定義那個時代的,是福特的流水線——它把天才的一次性靈感,變成了每個人都能享用的產(chǎn)品。
AI正站在完全相同的拐點上:過去幾年的大模型突破是"蒸汽機時刻",而現(xiàn)在,真正的考驗是能不能建起那條"流水線"。
但這條"流水線",究竟建起來了多少?
把視線從宏觀數(shù)字移開,去問那些真正在大規(guī)模部署AI的工程師,你會發(fā)現(xiàn)數(shù)字的另一面,是一組依然懸而未決的問題——大量Token消耗并未轉(zhuǎn)化為實際的業(yè)務(wù)成功,代碼在本地、算力在云端的開發(fā)環(huán)境依然割裂,企業(yè)在評估AI項目的真實回報率時缺乏可靠的工具。
這些現(xiàn)象指向一個根源:整個行業(yè)缺少一套能夠度量“智能生產(chǎn)”的基礎(chǔ)設(shè)施。
6月17日,九章云極正式發(fā)布“AI工廠”核心戰(zhàn)略,推出基于AI工廠鍛造的新一代智算云Alaya NeW Cloud 3.0——一套從算力投入到專業(yè)智能交付的工程體系。
這是一家擁有超過十年AI技術(shù)積淀的公司,對當(dāng)下這組困境給出的系統(tǒng)性回答。
理解它的設(shè)計邏輯,需要先把問題看清楚。
AI工業(yè)化卡在了度量上
AI產(chǎn)業(yè)的競爭重心,正在悄然轉(zhuǎn)向。
九章云極副總裁胡宗星把這個轉(zhuǎn)變拆成了三段歷史:模型發(fā)明期,核心問題是“能不能做出更強的模型”,基礎(chǔ)設(shè)施形態(tài)是算法、參數(shù)和單點突破;產(chǎn)業(yè)驗證期,核心問題是“能不能跑通行業(yè)場景”,基礎(chǔ)設(shè)施形態(tài)是項目制、PoC和私有部署。
而現(xiàn)在,正在進入的是第三個階段——智能工業(yè)化期,核心問題變成了“能不能規(guī)模化生產(chǎn)與交付智能”,需要的基礎(chǔ)設(shè)施是AI工廠、標準化生產(chǎn)和專業(yè)Token。
胡宗星認為,前兩個階段,行業(yè)已經(jīng)走完;第三個階段,才是真正的硬仗。
它意味著基礎(chǔ)設(shè)施的競爭邏輯已經(jīng)徹底改變,而大多數(shù)企業(yè)賴以運轉(zhuǎn)的基礎(chǔ)設(shè)施,還停留在上一個階段。這種錯配,正在讓三件事同時失效。
今天,一家企業(yè)如果同時采購了不同架構(gòu)的GPU和NPU,它很難用一把統(tǒng)一的尺子回答:這筆錢到底換來了多少“有效算力”?
不同芯片的FLOPS數(shù)字互不可比,不同廠商的“X卡時”定義各異,算力利用率更因架構(gòu)差異天壤之別。
這不只是報表難看的問題,更深的麻煩在于:一旦說不清投入了多少,優(yōu)化就無從下手——換芯片、調(diào)調(diào)度、改模型,哪個更值得試?根本沒有判斷的依據(jù)。
對于需要長期規(guī)劃算力預(yù)算的智算中心運營方而言,這直接決定了采購能否理性化、資源能否跨平臺調(diào)度、規(guī)模擴張的邊際成本能否被真正管控。
沒有統(tǒng)一的“度”,就沒有現(xiàn)代電力工業(yè);同樣,沒有統(tǒng)一的算力度量,算力就無法成為可以被采購、被運營、被持續(xù)優(yōu)化的社會級基礎(chǔ)設(shè)施。
Token價格戰(zhàn)打了兩年,中端模型的Token單價已經(jīng)接近為零。但對于企業(yè)而言,比起“每百萬Token多少錢”,更關(guān)心完成一項業(yè)務(wù)的總成本,即真實成本。
這兩者的差距,遠比想象中大。
假設(shè)一個AI Agent執(zhí)行一項20步的自動化任務(wù),每一步的成功率是85%,那么整個任務(wù)完成的概率只有約4%。如果把單步成功率從85%提升到98%,任務(wù)完成率就會躍升至67%——模型的專業(yè)程度,在多步任務(wù)中產(chǎn)生的收益,是指數(shù)級而非線性的。
胡宗星把這個邏輯拆成了一個公式:AI應(yīng)用成本=Token消耗×推理時延×重試次數(shù)×人工兜底成本。
這意味著,任意一項失控,即使單Token再便宜,任務(wù)總成本也會面臨失控的風(fēng)險,這也解釋了為什么在Token價格大幅下降的當(dāng)下,很多企業(yè)的AI部署成本反而還在上升。
每家行業(yè)客戶都需要一個真正理解自己業(yè)務(wù)的專業(yè)模型,但今天,訓(xùn)練一個垂類模型的路徑,往往是:收集數(shù)據(jù)、清洗數(shù)據(jù)、精調(diào)、評測、部署、運維——每一步都是定制的、不可復(fù)用的、需要大量人工介入的。
手工生產(chǎn)最大的問題,不只是慢,而且經(jīng)驗難以形成復(fù)用。一次金融領(lǐng)域的專業(yè)模型訓(xùn)練積累的業(yè)務(wù)知識,很難直接遷移到制造業(yè)的專業(yè)模型生產(chǎn)中;每個客戶的模型交付,在數(shù)據(jù)和業(yè)務(wù)層面幾乎都是從零開始的新項目。
這意味著,無論做多少個項目,邊際成本都很難實質(zhì)性下降。
大量企業(yè)因此陷在PoC(概念驗證)階段出不來,從模型研發(fā)到上線動輒半年以上,模型交付,正是在“作坊化”里被大規(guī)模浪費。
三種失效,指向同一個本質(zhì):AI競爭的形態(tài)已經(jīng)改變,但工業(yè)化所需要的基礎(chǔ)設(shè)施——一套能夠標準化度量投入、降低任務(wù)完成成本,并實現(xiàn)模型規(guī)模化生產(chǎn)的體系——至今仍然缺位。
而這,正是九章云極試圖填補的空白。
AI工廠如何讓「算力到智能」第一次可被計量
從本質(zhì)上看,AI工廠試圖讓“智能生產(chǎn)”第一次具備工業(yè)體系中的三要素:統(tǒng)一計量、標準生產(chǎn)與規(guī)模交付。
胡宗星在發(fā)布會上給AI工廠下了一個定義:"AI工廠,是智能工業(yè)化的工程底座。"
“工程底座”這個定語,透露了產(chǎn)品的底層邏輯:一套能被度量、被管理、能持續(xù)優(yōu)化的生產(chǎn)體系。工廠的本質(zhì),是一條可以持續(xù)運轉(zhuǎn)、不斷降低邊際成本的生產(chǎn)線。
沿著這個邏輯,AI工廠的完整鏈條可以概括為:DCU(標準化算力單位)→訓(xùn)練工廠(專業(yè)模型生成)→Token工廠(專業(yè)智能流通)→企業(yè)任務(wù)(價值實現(xiàn))→數(shù)據(jù)回流(模型迭代)。

鏈條的起點是DCU。九章云極把DCU定義為1度算力=312TFLOPS*1小時,第一次把異構(gòu)、多廠商、多架構(gòu)的算力資源折算成一個可以跨平臺比較的標準量。
客戶按DCU采購,不必理解底層芯片型號和集群拓撲,GPU、NPU、不同代際的芯片,都可以換算成統(tǒng)一的DCU單位進行采購和結(jié)算。
只有投入側(cè)有了度量,生產(chǎn)才有核算的基礎(chǔ)。
有了標準化的算力投入,下一步是把它轉(zhuǎn)化為專業(yè)智能,這是訓(xùn)練工廠的任務(wù)。
訓(xùn)練工廠負責(zé)把“通用智能”冶煉為“專業(yè)智能”,胡宗星特意用了“冶煉”這個詞,其背后的工藝由四個節(jié)點構(gòu)成:數(shù)據(jù)處理、領(lǐng)域精調(diào)、強化學(xué)習(xí)、評測反饋。
其中強化學(xué)習(xí)是最關(guān)鍵的一環(huán),也是訓(xùn)練工廠區(qū)別于平臺精調(diào)服務(wù)最核心的地方。
通用大模型經(jīng)過領(lǐng)域精調(diào)之后,能更好地“回答問題”;但只有經(jīng)過強化學(xué)習(xí),模型才能真正學(xué)會“完成任務(wù)”——拆解復(fù)雜目標、調(diào)用外部工具、在失敗后調(diào)整路徑。
胡宗星把這個區(qū)別概括為:讓專業(yè)模型從"會回答"走向"會執(zhí)行"。
這個區(qū)別在Agent大規(guī)模落地的今天尤為重要,對企業(yè)而言,模型會不會回答問題早已不是門檻,真正的門檻是:模型能不能在有容錯率約束、有工具調(diào)用鏈路、有業(yè)務(wù)邊界限制的真實生產(chǎn)環(huán)境里穩(wěn)定執(zhí)行任務(wù)。
專業(yè)模型從訓(xùn)練工廠產(chǎn)出后,需要經(jīng)過壓縮、量化、評測和分發(fā),才能進入下一段——Token工廠,胡宗星將這個“中間環(huán)節(jié)”稱之為“模型轉(zhuǎn)運”,是專業(yè)智能從“被生產(chǎn)”到“被消費”之間不可省略的工程步驟。
Token工廠則負責(zé)專業(yè)智能的流通與交付,不同于行業(yè)常說的推理工廠,推理工廠的出發(fā)點是資源調(diào)度,核心命題是如何把已有模型部署穩(wěn)、服務(wù)好、延時低,優(yōu)化的是單任務(wù)性能。
而Token工廠的出發(fā)點是價值交付,核心命題是如何把智能封裝為可以精確計量的價值單元,優(yōu)化的是規(guī)模化產(chǎn)出的效率。
這意味著Token工廠交付的不是泛化的Token,而是分層分檔的專業(yè)Token——消費級、專業(yè)級、前沿級,對應(yīng)不同類型的模型、不同復(fù)雜度的任務(wù)和不同的服務(wù)等級。每一類Token的定義,對應(yīng)的是它所封裝的智能密度與業(yè)務(wù)價值,而不只是它背后消耗的算力成本。
在這個框架下,“每任務(wù)完成成本”終于有了被計算的基礎(chǔ):投入側(cè)用DCU度量,產(chǎn)出側(cè)用專業(yè)Token度量,兩者之間的轉(zhuǎn)換效率,就是工廠效率。
胡宗星將其總結(jié)為:"同樣的DCU,能不能生產(chǎn)更多、更穩(wěn)定、更高價值的專業(yè)Token,這就是工廠效率,也是客戶價值。"
每一次企業(yè)任務(wù)的完成,都會產(chǎn)生反饋數(shù)據(jù)——成功了什么、失敗了什么、哪里卡殼、哪個步驟需要人工兜底,這些數(shù)據(jù)會持續(xù)回流到訓(xùn)練工廠,驅(qū)動專業(yè)模型的下一代迭代。
至此,閉環(huán)完成。
AI工廠因此不只是算力到智能的一次性轉(zhuǎn)化,更成為了一個可以自我優(yōu)化的生產(chǎn)體系,每一輪任務(wù),都在為下一個更專業(yè)的模型積累原料。
這套體系為企業(yè)用戶帶來的變化,可以歸結(jié)為三個更直接的結(jié)果:
第一,算力成本開始具備可預(yù)測性。通過DCU統(tǒng)一計量,算力投入不再依賴多廠商、多口徑的碎片化統(tǒng)計,而是可以像電力一樣被預(yù)算、被核算。
第二,智能交付效率顯著提升。Token Factory將底層芯片、模型與調(diào)度能力封裝為標準化的Token服務(wù),專業(yè)Token的分層分檔交付,使不同復(fù)雜度的業(yè)務(wù)任務(wù)可以被更穩(wěn)定地規(guī)模化執(zhí)行,減少重復(fù)試錯與人工兜底。
第三,模型能力可以持續(xù)復(fù)用與迭代。業(yè)務(wù)任務(wù)產(chǎn)生的反饋數(shù)據(jù)持續(xù)回流至訓(xùn)練工廠,驅(qū)動專業(yè)模型的下一代迭代,形成“越用越強”的價值增強回路。
工廠用得越多,模型越專業(yè);模型越專業(yè),任務(wù)完成率越高;任務(wù)完成率越高企業(yè)落地 AI 項目的綜合價值可清晰衡量。這是雙工廠區(qū)別于單純算力租賃和推理服務(wù)的本質(zhì)所在。
當(dāng)前,智算賽道參與者日趨多元,綜合云廠商、大模型企業(yè)、傳統(tǒng) IDC 服務(wù)商紛紛布局算力領(lǐng)域,行業(yè)競爭維度不斷豐富。九章云極堅持獨立智算云定位,走出差異化發(fā)展路徑。
綜合云廠商業(yè)務(wù)布局較為全面,同時覆蓋算力、應(yīng)用等多個領(lǐng)域。九章不競爭模型,不競爭應(yīng)用,意味著它和每一家模型公司、每一家行業(yè)客戶之間,理論上都不存在利益對立——平臺的中立性,讓它有可能成為整個生態(tài)的"公共基礎(chǔ)設(shè)施"。
而不做模型、不做應(yīng)用,就意味著九章的價值,需要通過生態(tài)的繁榮來兌現(xiàn)。平臺不以單一業(yè)務(wù)作為利潤核心,價值依托整個產(chǎn)業(yè)生態(tài)共同成長實現(xiàn)。只有當(dāng)足夠多的專業(yè)模型在平臺上被訓(xùn)練、被交付、被調(diào)用,當(dāng)足夠多的行業(yè)任務(wù)在AI工廠里跑通,平臺的價值才得以實現(xiàn)。
這套體系要真正運轉(zhuǎn)起來,前提是必須有足夠多、足夠好的專業(yè)模型進入Token工廠——沒有專業(yè)模型,專業(yè)Token就是一個空概念。
于是,九章啟動了"智算開放計劃",計劃遴選并孵化1000個高價值專業(yè)模型與智能應(yīng)用,通過算力支持、技術(shù)共創(chuàng)、商業(yè)分成、市場聯(lián)動,與行業(yè)開拓者深度綁定,這是整個雙工廠體系能否成立的公開驗證。
目前持有的籌碼來自三處。
首先是已被驗證的規(guī)模:九章累計服務(wù)超過3萬次客戶算力任務(wù),平臺上已經(jīng)預(yù)置了50多款主流基座模型 以及100余款的面向金融、制造、政務(wù)、科研等真實開源數(shù)據(jù)集。
其次是全棧自研的效率護城河:全棧自研的智算操作系統(tǒng)、算電協(xié)同優(yōu)化、跨中心跨型號全局調(diào)度、模型量化與推理優(yōu)化,五條路徑相乘,構(gòu)成獨立于硬件之外的效率優(yōu)勢,即使競爭對手購入同等算力,也未必能在任務(wù)完成成本上達到同等水平。
第三是更遠處的一個思考。當(dāng)千倍降本實現(xiàn)、算力便宜如水電,什么會成為下一道關(guān)卡?九章的判斷指向高質(zhì)量產(chǎn)業(yè)數(shù)據(jù),以及傳統(tǒng)企業(yè)缺乏AI原生工作流與組織能力。打通算力這一關(guān),正是為了讓產(chǎn)業(yè)界盡早面對這些更深層次的"軟性"瓶頸。
這個判斷,或許是理解九章戰(zhàn)略的另一個視角:AI工廠既回應(yīng)了當(dāng)下的競爭格局,也提前布了一局棋——關(guān)于“算力之后是什么”。
推理成本的下降,確實讓AI進入了規(guī)模化應(yīng)用的臨界點,但下一階段產(chǎn)業(yè)效率的真正決定因素,已經(jīng)從“能否用AI”轉(zhuǎn)向了“能否用工業(yè)化方式持續(xù)生產(chǎn)智能”。
在這一點上,AI行業(yè)仍處于基礎(chǔ)設(shè)施重構(gòu)的早期階段:算力需要統(tǒng)一計量,智能需要標準化生產(chǎn),模型需要工程化交付。
九章云極提出的AI工廠,本質(zhì)上是在嘗試回答一個更基礎(chǔ)的問題:當(dāng)AI從能力競爭進入工業(yè)化競爭階段,誰來定義“智能生產(chǎn)”的基礎(chǔ)設(shè)施標準?
這套體系的成熟度,最終取決于兩個層面的驗證:它能否支撐更多行業(yè)場景中穩(wěn)定運行的專業(yè)模型,以及這些模型能否在真實業(yè)務(wù)中持續(xù)創(chuàng)造可衡量的價值。
雷峰網(wǎng)(公眾號:雷峰網(wǎng))雷峰網(wǎng)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。