給 AI 建「流水線」，九章云極看清了什么？

本文作者：楊依婷

2026-06-17 18:32

導(dǎo)語：九章云極能成為AI時代的“公共基礎(chǔ)設(shè)施”嗎？

當(dāng)一個行業(yè)的核心問題開始轉(zhuǎn)移，舊的基礎(chǔ)設(shè)施就會在無聲中失效——AI，正在經(jīng)歷這樣的時刻。

2026年3月，國家數(shù)據(jù)局公布了一個數(shù)字：中國日均Token調(diào)用量已達140萬億；4月，斯坦福人工智能指數(shù)報告寫道，過去兩年推理成本下降了280倍；Gartner的預(yù)測則顯示，2026年將有40%的企業(yè)把AI Agent嵌入自己的業(yè)務(wù)系統(tǒng)。

這些數(shù)字拼在一起，看起來像是一個時代到來的宣告。

九章云極創(chuàng)始人兼董事長方磊打了一個比方：第一次工業(yè)革命，始于瓦特的蒸汽機，但真正定義那個時代的，是福特的流水線——它把天才的一次性靈感，變成了每個人都能享用的產(chǎn)品。

AI正站在完全相同的拐點上：過去幾年的大模型突破是"蒸汽機時刻"，而現(xiàn)在，真正的考驗是能不能建起那條"流水線"。

但這條"流水線"，究竟建起來了多少？

把視線從宏觀數(shù)字移開，去問那些真正在大規(guī)模部署AI的工程師，你會發(fā)現(xiàn)數(shù)字的另一面，是一組依然懸而未決的問題——大量Token消耗并未轉(zhuǎn)化為實際的業(yè)務(wù)成功，代碼在本地、算力在云端的開發(fā)環(huán)境依然割裂，企業(yè)在評估AI項目的真實回報率時缺乏可靠的工具。

這些現(xiàn)象指向一個根源：整個行業(yè)缺少一套能夠度量“智能生產(chǎn)”的基礎(chǔ)設(shè)施。

6月17日，九章云極正式發(fā)布“AI工廠”核心戰(zhàn)略，推出基于AI工廠鍛造的新一代智算云Alaya NeW Cloud 3.0——一套從算力投入到專業(yè)智能交付的工程體系。

這是一家擁有超過十年AI技術(shù)積淀的公司，對當(dāng)下這組困境給出的系統(tǒng)性回答。

理解它的設(shè)計邏輯，需要先把問題看清楚。

AI工業(yè)化卡在了度量上

AI產(chǎn)業(yè)的競爭重心，正在悄然轉(zhuǎn)向。

九章云極副總裁胡宗星把這個轉(zhuǎn)變拆成了三段歷史：模型發(fā)明期，核心問題是“能不能做出更強的模型”，基礎(chǔ)設(shè)施形態(tài)是算法、參數(shù)和單點突破；產(chǎn)業(yè)驗證期，核心問題是“能不能跑通行業(yè)場景”，基礎(chǔ)設(shè)施形態(tài)是項目制、PoC和私有部署。

而現(xiàn)在，正在進入的是第三個階段——智能工業(yè)化期，核心問題變成了“能不能規(guī)模化生產(chǎn)與交付智能”，需要的基礎(chǔ)設(shè)施是AI工廠、標準化生產(chǎn)和專業(yè)Token。

胡宗星認為，前兩個階段，行業(yè)已經(jīng)走完；第三個階段，才是真正的硬仗。

它意味著基礎(chǔ)設(shè)施的競爭邏輯已經(jīng)徹底改變，而大多數(shù)企業(yè)賴以運轉(zhuǎn)的基礎(chǔ)設(shè)施，還停留在上一個階段。這種錯配，正在讓三件事同時失效。

▎第一重失效：算力投入無法被標準化度量

今天，一家企業(yè)如果同時采購了不同架構(gòu)的GPU和NPU，它很難用一把統(tǒng)一的尺子回答：這筆錢到底換來了多少“有效算力”？

不同芯片的FLOPS數(shù)字互不可比，不同廠商的“X卡時”定義各異，算力利用率更因架構(gòu)差異天壤之別。

這不只是報表難看的問題，更深的麻煩在于：一旦說不清投入了多少，優(yōu)化就無從下手——換芯片、調(diào)調(diào)度、改模型，哪個更值得試？根本沒有判斷的依據(jù)。

對于需要長期規(guī)劃算力預(yù)算的智算中心運營方而言，這直接決定了采購能否理性化、資源能否跨平臺調(diào)度、規(guī)模擴張的邊際成本能否被真正管控。

沒有統(tǒng)一的“度”，就沒有現(xiàn)代電力工業(yè)；同樣，沒有統(tǒng)一的算力度量，算力就無法成為可以被采購、被運營、被持續(xù)優(yōu)化的社會級基礎(chǔ)設(shè)施。

▎第二重失效：Token單價已經(jīng)不是成本標尺

Token價格戰(zhàn)打了兩年，中端模型的Token單價已經(jīng)接近為零。但對于企業(yè)而言，比起“每百萬Token多少錢”，更關(guān)心完成一項業(yè)務(wù)的總成本，即真實成本。

這兩者的差距，遠比想象中大。

假設(shè)一個AI Agent執(zhí)行一項20步的自動化任務(wù)，每一步的成功率是85%，那么整個任務(wù)完成的概率只有約4%。如果把單步成功率從85%提升到98%，任務(wù)完成率就會躍升至67%——模型的專業(yè)程度，在多步任務(wù)中產(chǎn)生的收益，是指數(shù)級而非線性的。

胡宗星把這個邏輯拆成了一個公式：AI應(yīng)用成本=Token消耗×推理時延×重試次數(shù)×人工兜底成本。

這意味著，任意一項失控，即使單Token再便宜，任務(wù)總成本也會面臨失控的風(fēng)險，這也解釋了為什么在Token價格大幅下降的當(dāng)下，很多企業(yè)的AI部署成本反而還在上升。

▎第三重失效：專業(yè)模型生產(chǎn)還停留在“手工作坊”階段

每家行業(yè)客戶都需要一個真正理解自己業(yè)務(wù)的專業(yè)模型，但今天，訓(xùn)練一個垂類模型的路徑，往往是：收集數(shù)據(jù)、清洗數(shù)據(jù)、精調(diào)、評測、部署、運維——每一步都是定制的、不可復(fù)用的、需要大量人工介入的。

手工生產(chǎn)最大的問題，不只是慢，而且經(jīng)驗難以形成復(fù)用。一次金融領(lǐng)域的專業(yè)模型訓(xùn)練積累的業(yè)務(wù)知識，很難直接遷移到制造業(yè)的專業(yè)模型生產(chǎn)中；每個客戶的模型交付，在數(shù)據(jù)和業(yè)務(wù)層面幾乎都是從零開始的新項目。

這意味著，無論做多少個項目，邊際成本都很難實質(zhì)性下降。

大量企業(yè)因此陷在PoC（概念驗證）階段出不來，從模型研發(fā)到上線動輒半年以上，模型交付，正是在“作坊化”里被大規(guī)模浪費。

三種失效，指向同一個本質(zhì)：AI競爭的形態(tài)已經(jīng)改變，但工業(yè)化所需要的基礎(chǔ)設(shè)施——一套能夠標準化度量投入、降低任務(wù)完成成本，并實現(xiàn)模型規(guī)模化生產(chǎn)的體系——至今仍然缺位。

而這，正是九章云極試圖填補的空白。

AI工廠如何讓「算力到智能」第一次可被計量

從本質(zhì)上看，AI工廠試圖讓“智能生產(chǎn)”第一次具備工業(yè)體系中的三要素：統(tǒng)一計量、標準生產(chǎn)與規(guī)模交付。

胡宗星在發(fā)布會上給AI工廠下了一個定義："AI工廠，是智能工業(yè)化的工程底座。"

“工程底座”這個定語，透露了產(chǎn)品的底層邏輯：一套能被度量、被管理、能持續(xù)優(yōu)化的生產(chǎn)體系。工廠的本質(zhì)，是一條可以持續(xù)運轉(zhuǎn)、不斷降低邊際成本的生產(chǎn)線。

沿著這個邏輯，AI工廠的完整鏈條可以概括為：DCU（標準化算力單位）→訓(xùn)練工廠（專業(yè)模型生成）→Token工廠（專業(yè)智能流通）→企業(yè)任務(wù)（價值實現(xiàn)）→數(shù)據(jù)回流（模型迭代）。

給 AI 建「流水線」，九章云極看清了什么？

鏈條的起點是DCU。九章云極把DCU定義為1度算力=312TFLOPS*1小時，第一次把異構(gòu)、多廠商、多架構(gòu)的算力資源折算成一個可以跨平臺比較的標準量。

客戶按DCU采購，不必理解底層芯片型號和集群拓撲，GPU、NPU、不同代際的芯片，都可以換算成統(tǒng)一的DCU單位進行采購和結(jié)算。

只有投入側(cè)有了度量，生產(chǎn)才有核算的基礎(chǔ)。

有了標準化的算力投入，下一步是把它轉(zhuǎn)化為專業(yè)智能，這是訓(xùn)練工廠的任務(wù)。

訓(xùn)練工廠負責(zé)把“通用智能”冶煉為“專業(yè)智能”，胡宗星特意用了“冶煉”這個詞，其背后的工藝由四個節(jié)點構(gòu)成：數(shù)據(jù)處理、領(lǐng)域精調(diào)、強化學(xué)習(xí)、評測反饋。

其中強化學(xué)習(xí)是最關(guān)鍵的一環(huán)，也是訓(xùn)練工廠區(qū)別于平臺精調(diào)服務(wù)最核心的地方。

通用大模型經(jīng)過領(lǐng)域精調(diào)之后，能更好地“回答問題”；但只有經(jīng)過強化學(xué)習(xí)，模型才能真正學(xué)會“完成任務(wù)”——拆解復(fù)雜目標、調(diào)用外部工具、在失敗后調(diào)整路徑。

胡宗星把這個區(qū)別概括為：讓專業(yè)模型從"會回答"走向"會執(zhí)行"。

這個區(qū)別在Agent大規(guī)模落地的今天尤為重要，對企業(yè)而言，模型會不會回答問題早已不是門檻，真正的門檻是：模型能不能在有容錯率約束、有工具調(diào)用鏈路、有業(yè)務(wù)邊界限制的真實生產(chǎn)環(huán)境里穩(wěn)定執(zhí)行任務(wù)。

專業(yè)模型從訓(xùn)練工廠產(chǎn)出后，需要經(jīng)過壓縮、量化、評測和分發(fā)，才能進入下一段——Token工廠，胡宗星將這個“中間環(huán)節(jié)”稱之為“模型轉(zhuǎn)運”，是專業(yè)智能從“被生產(chǎn)”到“被消費”之間不可省略的工程步驟。

Token工廠則負責(zé)專業(yè)智能的流通與交付，不同于行業(yè)常說的推理工廠，推理工廠的出發(fā)點是資源調(diào)度，核心命題是如何把已有模型部署穩(wěn)、服務(wù)好、延時低，優(yōu)化的是單任務(wù)性能。

而Token工廠的出發(fā)點是價值交付，核心命題是如何把智能封裝為可以精確計量的價值單元，優(yōu)化的是規(guī)模化產(chǎn)出的效率。

這意味著Token工廠交付的不是泛化的Token，而是分層分檔的專業(yè)Token——消費級、專業(yè)級、前沿級，對應(yīng)不同類型的模型、不同復(fù)雜度的任務(wù)和不同的服務(wù)等級。每一類Token的定義，對應(yīng)的是它所封裝的智能密度與業(yè)務(wù)價值，而不只是它背后消耗的算力成本。

在這個框架下，“每任務(wù)完成成本”終于有了被計算的基礎(chǔ)：投入側(cè)用DCU度量，產(chǎn)出側(cè)用專業(yè)Token度量，兩者之間的轉(zhuǎn)換效率，就是工廠效率。

胡宗星將其總結(jié)為："同樣的DCU，能不能生產(chǎn)更多、更穩(wěn)定、更高價值的專業(yè)Token，這就是工廠效率，也是客戶價值。"

每一次企業(yè)任務(wù)的完成，都會產(chǎn)生反饋數(shù)據(jù)——成功了什么、失敗了什么、哪里卡殼、哪個步驟需要人工兜底，這些數(shù)據(jù)會持續(xù)回流到訓(xùn)練工廠，驅(qū)動專業(yè)模型的下一代迭代。

至此，閉環(huán)完成。

AI工廠因此不只是算力到智能的一次性轉(zhuǎn)化，更成為了一個可以自我優(yōu)化的生產(chǎn)體系，每一輪任務(wù)，都在為下一個更專業(yè)的模型積累原料。

這套體系為企業(yè)用戶帶來的變化，可以歸結(jié)為三個更直接的結(jié)果：

第一，算力成本開始具備可預(yù)測性。通過DCU統(tǒng)一計量，算力投入不再依賴多廠商、多口徑的碎片化統(tǒng)計，而是可以像電力一樣被預(yù)算、被核算。

第二，智能交付效率顯著提升。Token Factory將底層芯片、模型與調(diào)度能力封裝為標準化的Token服務(wù)，專業(yè)Token的分層分檔交付，使不同復(fù)雜度的業(yè)務(wù)任務(wù)可以被更穩(wěn)定地規(guī)模化執(zhí)行，減少重復(fù)試錯與人工兜底。

第三，模型能力可以持續(xù)復(fù)用與迭代。業(yè)務(wù)任務(wù)產(chǎn)生的反饋數(shù)據(jù)持續(xù)回流至訓(xùn)練工廠，驅(qū)動專業(yè)模型的下一代迭代，形成“越用越強”的價值增強回路。

工廠用得越多，模型越專業(yè)；模型越專業(yè)，任務(wù)完成率越高；任務(wù)完成率越高企業(yè)落地 AI 項目的綜合價值可清晰衡量。這是雙工廠區(qū)別于單純算力租賃和推理服務(wù)的本質(zhì)所在。

在算力與模型之間，AI開始出現(xiàn)“中立工廠層”

當(dāng)前，智算賽道參與者日趨多元，綜合云廠商、大模型企業(yè)、傳統(tǒng) IDC 服務(wù)商紛紛布局算力領(lǐng)域，行業(yè)競爭維度不斷豐富。九章云極堅持獨立智算云定位，走出差異化發(fā)展路徑。

綜合云廠商業(yè)務(wù)布局較為全面，同時覆蓋算力、應(yīng)用等多個領(lǐng)域。九章不競爭模型，不競爭應(yīng)用，意味著它和每一家模型公司、每一家行業(yè)客戶之間，理論上都不存在利益對立——平臺的中立性，讓它有可能成為整個生態(tài)的"公共基礎(chǔ)設(shè)施"。

而不做模型、不做應(yīng)用，就意味著九章的價值，需要通過生態(tài)的繁榮來兌現(xiàn)。平臺不以單一業(yè)務(wù)作為利潤核心，價值依托整個產(chǎn)業(yè)生態(tài)共同成長實現(xiàn)。只有當(dāng)足夠多的專業(yè)模型在平臺上被訓(xùn)練、被交付、被調(diào)用，當(dāng)足夠多的行業(yè)任務(wù)在AI工廠里跑通，平臺的價值才得以實現(xiàn)。

這套體系要真正運轉(zhuǎn)起來，前提是必須有足夠多、足夠好的專業(yè)模型進入Token工廠——沒有專業(yè)模型，專業(yè)Token就是一個空概念。

于是，九章啟動了"智算開放計劃"，計劃遴選并孵化1000個高價值專業(yè)模型與智能應(yīng)用，通過算力支持、技術(shù)共創(chuàng)、商業(yè)分成、市場聯(lián)動，與行業(yè)開拓者深度綁定，這是整個雙工廠體系能否成立的公開驗證。

目前持有的籌碼來自三處。

首先是已被驗證的規(guī)模：九章累計服務(wù)超過3萬次客戶算力任務(wù)，平臺上已經(jīng)預(yù)置了50多款主流基座模型以及100余款的面向金融、制造、政務(wù)、科研等真實開源數(shù)據(jù)集。

其次是全棧自研的效率護城河：全棧自研的智算操作系統(tǒng)、算電協(xié)同優(yōu)化、跨中心跨型號全局調(diào)度、模型量化與推理優(yōu)化，五條路徑相乘，構(gòu)成獨立于硬件之外的效率優(yōu)勢，即使競爭對手購入同等算力，也未必能在任務(wù)完成成本上達到同等水平。

第三是更遠處的一個思考。當(dāng)千倍降本實現(xiàn)、算力便宜如水電，什么會成為下一道關(guān)卡？九章的判斷指向高質(zhì)量產(chǎn)業(yè)數(shù)據(jù)，以及傳統(tǒng)企業(yè)缺乏AI原生工作流與組織能力。打通算力這一關(guān)，正是為了讓產(chǎn)業(yè)界盡早面對這些更深層次的"軟性"瓶頸。

這個判斷，或許是理解九章戰(zhàn)略的另一個視角：AI工廠既回應(yīng)了當(dāng)下的競爭格局，也提前布了一局棋——關(guān)于“算力之后是什么”。

推理成本的下降，確實讓AI進入了規(guī)模化應(yīng)用的臨界點，但下一階段產(chǎn)業(yè)效率的真正決定因素，已經(jīng)從“能否用AI”轉(zhuǎn)向了“能否用工業(yè)化方式持續(xù)生產(chǎn)智能”。

在這一點上，AI行業(yè)仍處于基礎(chǔ)設(shè)施重構(gòu)的早期階段：算力需要統(tǒng)一計量，智能需要標準化生產(chǎn)，模型需要工程化交付。

九章云極提出的AI工廠，本質(zhì)上是在嘗試回答一個更基礎(chǔ)的問題：當(dāng)AI從能力競爭進入工業(yè)化競爭階段，誰來定義“智能生產(chǎn)”的基礎(chǔ)設(shè)施標準？

這套體系的成熟度，最終取決于兩個層面的驗證：它能否支撐更多行業(yè)場景中穩(wěn)定運行的專業(yè)模型，以及這些模型能否在真實業(yè)務(wù)中持續(xù)創(chuàng)造可衡量的價值。

雷峰網(wǎng)(公眾號：雷峰網(wǎng))雷峰網(wǎng)

雷峰網(wǎng)原創(chuàng)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

0人收藏

相關(guān)文章

楊依婷

編輯

歡迎添加作者微信EATINGNTAE進行交流~

發(fā)私信

當(dāng)月熱門文章