• <sub id="pqc61"><p id="pqc61"></p></sub><sub id="pqc61"></sub>
    在线精品视频一区二区,亚洲中文字幕无码一久久区,正在播放肥臀熟妇在线视频,国内精品视频一区二区三区八戒 ,国产毛片三区二区一区,国产精品一区中文字幕,丰满少妇被猛烈进出69影院,国产成人无码
    您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
    此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
    人工智能開(kāi)發(fā)者 正文
    發(fā)私信給高允毅
    發(fā)送

    0

    1B 參數(shù)跑出 2B 性能?面壁 MiniCPM5-1B 用 AI 自進(jìn)化,提速 AGI 進(jìn)程

    本文作者: 高允毅   2026-05-29 10:43
    導(dǎo)語(yǔ):AI“自造”時(shí)代開(kāi)啟,端側(cè)算力迎來(lái)“工業(yè)母機(jī)”。
    1B 參數(shù)跑出 2B 性能?面壁 MiniCPM5-1B 用 AI 自進(jìn)化,提速 AGI 進(jìn)程
    AI“自造”時(shí)代開(kāi)啟,端側(cè)算力迎來(lái)“工業(yè)母機(jī)”。

        作者丨高允毅

        編輯丨岑峰 馬曉寧

                                                                                                           

    在萬(wàn)億參數(shù)的軍備競(jìng)賽中,全球 AI 行業(yè)正陷入算力受制、高質(zhì)量數(shù)據(jù)枯竭、電力成本飆升的資源消耗戰(zhàn)。當(dāng)北美巨頭們斥資數(shù)十億美元狂賭超算中心時(shí),中國(guó)的一支 AI “特種部隊(duì)”正繞開(kāi)物理瓶頸,切入另一條決定勝負(fù)的岔路。

    在資源有限的背景下,想讓大模型的能力繼續(xù)狂飆,唯一的解法就是從底層改變研發(fā)模式,大幅壓縮每一代模型的迭代成本與周期。基于這一共識(shí),“AI 制造 AI”的技術(shù)路徑應(yīng)運(yùn)而生。

    面壁智能發(fā)現(xiàn),大模型進(jìn)化速度,正面臨一個(gè)隱形的天花板,即“碳基程序員”手寫(xiě)代碼的生理極限。如果底層的訓(xùn)練框架持續(xù)依賴(lài)人工迭代,智能的進(jìn)化速度就會(huì)被永遠(yuǎn)鎖死。

    正如 AI 大神 Andrej Karpathy 提出的“自動(dòng)研究員”設(shè)想,行業(yè)的底層共識(shí)正在發(fā)生根本性轉(zhuǎn)移:破局的關(guān)鍵不再是盲目堆砌算力,而是讓 AI 接管編碼,激活“遞歸自我改進(jìn)”的速率爆發(fā)。一旦“AI 研發(fā) AI 的速度”超越了“人類(lèi)研發(fā) AI 的速度”,人類(lèi)距離 AGI 的時(shí)間將被大幅縮短。

    2026年5月25日,面壁智能正式交出答卷——全球首個(gè)由“AI創(chuàng)造AI”孕育而生的基座模型MiniCPM5-1B震撼發(fā)布。

    1B 參數(shù)跑出 2B 性能?面壁 MiniCPM5-1B 用 AI 自進(jìn)化,提速 AGI 進(jìn)程

    01


    MiniCPM5-1B的越級(jí)性能與端側(cè)革命

    作為“AI 創(chuàng)造 AI”的時(shí)代首作,MiniCPM5-1B一登場(chǎng),就讓人眼前一亮。

    首先是堪比行業(yè)標(biāo)桿的“越級(jí)性能”。 作為一款參數(shù)量極小的 1B模型,它在綜合知識(shí)儲(chǔ)備、邏輯推理與工具調(diào)用等長(zhǎng)板能力上,展現(xiàn)出了極高的參數(shù)利用率。在國(guó)際權(quán)威第三方評(píng)測(cè)機(jī)構(gòu)Artificial Analysis (AA) 最新發(fā)布的榜單中,MiniCPM5-1B綜合分位列「小尺寸模型」榜單第一,成為了全球 2B 參數(shù)規(guī)模以?xún)?nèi)最強(qiáng)的開(kāi)源基座模型。

    這一跨代級(jí)的性能飛躍,在對(duì)比中尤為顯著,它僅憑一半的參數(shù)量,便超越了 3 個(gè)月前的主流 2B 級(jí)別模型,用事實(shí)有力地驗(yàn)證了面壁“智能密度約每 3.5 個(gè)月翻一番”的行業(yè)定律。

    1B 參數(shù)跑出 2B 性能?面壁 MiniCPM5-1B 用 AI 自進(jìn)化,提速 AGI 進(jìn)程

    圖注:MiniCPM5-1B在Artificial Analysis 智能指數(shù)輕量級(jí)大模型性能排行第一


    1B 參數(shù)跑出 2B 性能?面壁 MiniCPM5-1B 用 AI 自進(jìn)化,提速 AGI 進(jìn)程

    圖注:MiniCPM5-1B在 Artificial Analysis “模型智能與輸出 Token 消耗量”對(duì)比圖


    在衡量“奧賽級(jí)”代碼能力的 LCB-Pro 25Q2 (Easy) 測(cè)評(píng)中,它以 22.68 的高分遙遙領(lǐng)先,而在奧林匹克競(jìng)賽級(jí)數(shù)學(xué)推理測(cè)試 AIME-2025/2026 中,它同樣斬獲了 40.42 的高分。

    1B 參數(shù)跑出 2B 性能?面壁 MiniCPM5-1B 用 AI 自進(jìn)化,提速 AGI 進(jìn)程

    圖注:MiniCPM5-1B與同體量模型評(píng)測(cè)結(jié)果對(duì)比圖


    其次,是釋放應(yīng)用潛能的“極致壓縮比”。與云端那些動(dòng)輒需要千卡集群支撐、高不可攀的API不同,MiniCPM5-1B天生具備極強(qiáng)的“生存能力”,支持 CPU 和瀏覽器運(yùn)行,日常設(shè)備都能輕松駕馭。

    在 FP16 高精度下,它僅占約 2GB 內(nèi)存;而在極限的 INT4/Q4 量化下,更是被壓縮至驚人的 0.5GB且?guī)缀鯚o(wú)損。

    1B 參數(shù)跑出 2B 性能?面壁 MiniCPM5-1B 用 AI 自進(jìn)化,提速 AGI 進(jìn)程

    圖注:MiniCPM5-1B在不同精度下的權(quán)重體積與推薦部署場(chǎng)景


    這極大降低了開(kāi)發(fā)者的部署門(mén)檻,讓“人人擁有一個(gè)聰明的賽博桌寵”與端側(cè)全能助手成為現(xiàn)實(shí)。

    圖注:MiniCPM5-1B落地端側(cè)應(yīng)用,低載、常駐“賽博桌寵”演示

    項(xiàng)目地址:https://github.com/OpenBMB/MiniCPM-Desk-Pet

    (本項(xiàng)目基于clawd-on-desk項(xiàng)目二次開(kāi)發(fā))


    最后,是模型表現(xiàn)出的均衡能力。在與同等體量的模型對(duì)比中,MiniCPM5-1B在七個(gè)評(píng)估維度中名列前茅,展現(xiàn)了“六邊形戰(zhàn)士”般的整體實(shí)力。其中,在智能體和代碼編程領(lǐng)域大幅領(lǐng)先,在邏輯推理、數(shù)學(xué)推理、綜合知識(shí)方面也優(yōu)勢(shì)明顯。

    1B 參數(shù)跑出 2B 性能?面壁 MiniCPM5-1B 用 AI 自進(jìn)化,提速 AGI 進(jìn)程

    圖注:MiniCPM5-1B與同體量模型各領(lǐng)域能力維度對(duì)比圖


    那么問(wèn)題來(lái)了:為什么一個(gè)體量如此小巧的模型,卻能打破“小參數(shù)=低智能”的魔咒?這并非單純的參數(shù)微調(diào),而是源于面壁智能重構(gòu)的一套由“模型、框架、數(shù)據(jù)”并駕齊驅(qū)的全新自進(jìn)化范式。

    1B 參數(shù)跑出 2B 性能?面壁 MiniCPM5-1B 用 AI 自進(jìn)化,提速 AGI 進(jìn)程

    02


    模型、框架、數(shù)據(jù):面壁AI自進(jìn)化范式三駕馬車(chē)

    MiniCPM5-1B之所以表現(xiàn)驚艷,根源在于其底層采用了面壁智能提出的全新軟件工程范式,“Forge Engineering”(鍛造工程)。

    它讓“AI 制造 AI”從前沿的實(shí)驗(yàn)室概念,真正落地為了可復(fù)用的工業(yè)化流水線。

    放眼全球,“AI 制造 AI”的探索正在快速推進(jìn)。從 Anthropic 用智能體編寫(xiě) C 編譯器,到 OpenAI 的 Harness 規(guī)約工程,再到 Andrej Karpathy 提出的“自動(dòng)研究員”構(gòu)想,這些嘗試都在不同方向上驗(yàn)證了 AI 自主編程的可行性。

    然而,在難度最高、架構(gòu)最復(fù)雜的“完整訓(xùn)練框架”這一粒度上,已有嘗試大多停留在研究原型或局部工具鏈層面。例如,英偉達(dá)的 VibeTensor 官方明確標(biāo)注為“研究級(jí)系統(tǒng)”,不適合生產(chǎn)使用;Anthropic 的 C 編譯器規(guī)模較小;OpenAI 的 Harness 更側(cè)重于規(guī)約方法論而非完整框架。 相比之下,面壁發(fā)布的 ForgeTrain,是目前已知首個(gè)完全由 AI 編寫(xiě)、并已成功訓(xùn)練出工業(yè)生產(chǎn)級(jí)模型(MiniCPM5-1B)的大模型訓(xùn)練框架。

    ForgeTrain,可以被理解為“AI版 Megatron”。

    Megatron 是過(guò)去幾年大模型訓(xùn)練領(lǐng)域最具影響力的工業(yè)標(biāo)準(zhǔn)之一,而 ForgeTrain 背后的 Forge Engineering 范式,則重構(gòu)了傳統(tǒng)軟件工程的核心邏輯:

    當(dāng) AI 生成代碼的成本趨近于零時(shí),行業(yè)不再需要長(zhǎng)期維護(hù)臃腫的通用框架。面對(duì)新的硬件或模型,F(xiàn)orge Engineering 可以讓 AI 直接“按需生成”專(zhuān)用的極致優(yōu)化代碼。

    可以說(shuō),面壁率先在業(yè)內(nèi)跑通了“AI制造AI”任務(wù)中這個(gè)由算法(模型)、算力(Infra/框架)、數(shù)據(jù)三駕馬車(chē)環(huán)環(huán)相扣湊成的遞歸閉環(huán)。參照行業(yè)對(duì)“AI制造AI”進(jìn)化能力的L1-L5梯度劃分,面壁正向自改進(jìn)的 L4 階段發(fā)起全面沖鋒。

    在算力/Infra層,打造動(dòng)力澎湃的發(fā)動(dòng)機(jī):AI 徹底告別了人類(lèi)手寫(xiě)代碼的局限,能夠針對(duì)特定硬件,動(dòng)態(tài)地“現(xiàn)場(chǎng)鍛造”出專(zhuān)屬的最優(yōu)算子與分布式策略。

    ForgeTrain 提供了一套由 AI 生成訓(xùn)練框架的工程實(shí)現(xiàn)。 在實(shí)際使用中,人類(lèi)設(shè)定目標(biāo),例如“在昇騰 910B 上訓(xùn)練 1B 模型”,后續(xù)的代碼生成、測(cè)試與調(diào)優(yōu)均在 AI 主導(dǎo)的閉環(huán)中完成。ForgeTrain 是該范式下的首個(gè)訓(xùn)練框架實(shí)例,在一定條件下實(shí)現(xiàn)了針對(duì)特定場(chǎng)景的定制化生成,部分緩解了通用框架在效率與適配之間的權(quán)衡問(wèn)題。

    在數(shù)據(jù)層,提煉高純度的燃油:優(yōu)秀的模型離不開(kāi)高質(zhì)量的數(shù)據(jù)。ForgeTrain 解決了“怎么訓(xùn)”的效率問(wèn)題,而面壁的分級(jí)數(shù)據(jù)治理與大規(guī)模合成數(shù)據(jù)(超 1T Tokens,中文部分開(kāi)源最大)則解決了“用什么訓(xùn)”的質(zhì)量問(wèn)題。兩者結(jié)合,才造就了 MiniCPM5-1B 的驚艷表現(xiàn)。

    面對(duì)高質(zhì)量數(shù)據(jù)日益枯竭的行業(yè)痛點(diǎn),面壁與清華、OpenBMB聯(lián)合推出了 L0-L4 模型驅(qū)動(dòng)分層數(shù)據(jù)管理框架。這套體系摒棄了傳統(tǒng)的粗放式清洗,通過(guò)“人類(lèi)定義標(biāo)準(zhǔn)、AI 執(zhí)行操作”的邏輯將數(shù)據(jù)精準(zhǔn)分級(jí),將數(shù)據(jù)從原始資源到結(jié)構(gòu)化知識(shí)精準(zhǔn)分為五級(jí)。

    1B 參數(shù)跑出 2B 性能?面壁 MiniCPM5-1B 用 AI 自進(jìn)化,提速 AGI 進(jìn)程

    圖注:面壁智能與清華、OpenBMB聯(lián)合提出 L0–L4 分級(jí)數(shù)據(jù)治理框架


    其中,L1 階段通過(guò)工程化方法完成基礎(chǔ)清洗和去重,L2階段針對(duì)特定任務(wù)或領(lǐng)域篩選出相關(guān)數(shù)據(jù),構(gòu)建模型的基礎(chǔ)語(yǔ)言與邏輯能力。

    而在關(guān)鍵的 L3 階段,面壁讓 AI “自主擇數(shù)”,對(duì)海量網(wǎng)頁(yè)與數(shù)學(xué)語(yǔ)料進(jìn)行系統(tǒng)性編輯與合成,識(shí)別出更接近第一性原理的數(shù)據(jù)。

    而 L4 則轉(zhuǎn)化為可驗(yàn)證的結(jié)構(gòu)化知識(shí),為 RAG 系統(tǒng)提供事實(shí)支撐。

    實(shí)驗(yàn)效果是十分驚人的,在相同的訓(xùn)練算力下,使用 L3 數(shù)據(jù)訓(xùn)練的模型比使用傳統(tǒng) L1 數(shù)據(jù)的模型,數(shù)學(xué)能力提升了 7.06pp,而這種提升還能跨域遷移到英文、中文和代碼任務(wù)上,通用推理能力平均提升超過(guò) 3pp。

    此外,分級(jí)管理也徹底重塑了訓(xùn)練策略。當(dāng)采用 “先 L1 筑基、再 L2 強(qiáng)化、最后 L3 拔高” 的分級(jí)訓(xùn)練策略時(shí),同樣 120B Tokens 的數(shù)據(jù)量,整體性能比傳統(tǒng)混合訓(xùn)練提升了 1.49pp,后期訓(xùn)練效率更是達(dá)到了混合策略的 1.7 倍。

    高質(zhì)量合成數(shù)據(jù)不僅可以替代天然數(shù)據(jù),在很多方面甚至優(yōu)于天然數(shù)據(jù),這將為解決數(shù)據(jù)枯竭問(wèn)題提供系統(tǒng)性方案。 基于這一流程,團(tuán)隊(duì)開(kāi)源了 Ultra-Fineweb-zh-L3 數(shù)據(jù)集,包含超過(guò) 1T Tokens(其中中文約 410B Tokens),不僅服務(wù)于面壁自身的模型訓(xùn)練,也將這套數(shù)據(jù)提純能力開(kāi)放出來(lái),反哺社區(qū)生態(tài)。

    這也是目前開(kāi)源社區(qū)中規(guī)模最大的中文預(yù)訓(xùn)練合成數(shù)據(jù)集之一。

    在算法/模型層,驅(qū)動(dòng)自進(jìn)化飛輪:AI 編寫(xiě)的框架加上 AI 提純的高質(zhì)量數(shù)據(jù),最終孕育出了更強(qiáng)大的基座模型(MiniCPM5-1B)。

    一個(gè)更聰明的基座模型,本身也具備更強(qiáng)的代碼生成能力與數(shù)據(jù)理解能力。這意味著,它可以用 ForgeTrain 同樣的方法,生成比當(dāng)前版本更優(yōu)的訓(xùn)練框架,也可以從海量語(yǔ)料中篩選出比當(dāng)前 L3 數(shù)據(jù)集更高質(zhì)量的訓(xùn)練數(shù)據(jù)。 用新框架 + 新數(shù)據(jù),又能訓(xùn)練出下一代更強(qiáng)的模型。如此循環(huán)往復(fù),形成一個(gè)“模型越強(qiáng) → 框架與數(shù)據(jù)越優(yōu) → 下一代模型更強(qiáng)”的自進(jìn)化飛輪。這正是面壁“AI 制造 AI”閉環(huán)能夠加速運(yùn)轉(zhuǎn)的核心機(jī)制。

    在這套體系的全面落地中,F(xiàn)orgeTrain 交出了實(shí)質(zhì)性的工程數(shù)據(jù):

    在“零人工代碼介入”的硬約束下,面對(duì)國(guó)產(chǎn)算力,它僅耗時(shí) 3-5 天便跑通華為昇騰系列,跨越了底層適配的周期長(zhǎng)考;在頂尖算力端,其生成的純 AI 代碼在英偉達(dá) H100 上的訓(xùn)練速度超越標(biāo)桿 Megatron 10%,直接等效降低 10% 算力成本。

    ForgeTrain在華為昇騰上預(yù)訓(xùn)練MiniCPM5-1B,相比昇騰的MindSpeed框架也有10%的加速。而基于該框架訓(xùn)練的 MiniCPM5-1B性能反超同級(jí)基準(zhǔn)。

    這背后的商業(yè)價(jià)值不言而喻:當(dāng)企業(yè)需要為某款芯片(比如國(guó)產(chǎn)芯片)或某個(gè)端側(cè)場(chǎng)景做模型時(shí),不需要請(qǐng)專(zhuān)門(mén)的技術(shù)團(tuán)隊(duì)花幾個(gè)月去手動(dòng)調(diào)優(yōu)。只要告訴系統(tǒng)需求,AI 就能在幾天內(nèi)為特定端側(cè)設(shè)備“現(xiàn)場(chǎng)鍛造”一套最契合的專(zhuān)屬模型和專(zhuān)屬訓(xùn)練/推理框架,真正將模型訓(xùn)練從“手工作坊”帶進(jìn)了“工業(yè)流水線”時(shí)代。

    1B 參數(shù)跑出 2B 性能?面壁 MiniCPM5-1B 用 AI 自進(jìn)化,提速 AGI 進(jìn)程

    03


    重塑?chē)?guó)產(chǎn)算力的底層軟件棧

    在國(guó)際地緣博弈的背景下,英偉達(dá)萬(wàn)億市值的真正護(hù)城河,并不在于 GPU 硬件本身,而在于其背后經(jīng)過(guò)十幾年積累、由百萬(wàn)開(kāi)發(fā)者共同構(gòu)建的 CUDA 軟件生態(tài)。

    正如創(chuàng)始人黃仁勛自己所承認(rèn)的:“英偉達(dá)本質(zhì)上是一家軟件公司。” 確實(shí),如果沒(méi)有這套涵蓋算法庫(kù)、編譯器、開(kāi)發(fā)工具在內(nèi)的完整生態(tài)系統(tǒng),再?gòu)?qiáng)大的芯片也無(wú)法高效運(yùn)行客戶(hù)的業(yè)務(wù)。

    當(dāng)前,以華為昇騰為代表的國(guó)產(chǎn)異構(gòu)芯片在硬件算力與架構(gòu)創(chuàng)新上發(fā)展迅猛,展現(xiàn)出強(qiáng)大的硬件潛力。然而,隨著新算法與新芯片層出不窮,異構(gòu)計(jì)算的 "組合爆炸" 已成為全行業(yè)的適配難題。從手機(jī)里的異構(gòu)芯片,到驅(qū)動(dòng)萬(wàn)億參數(shù)大模型的上萬(wàn)張加速卡集群,問(wèn)題的本質(zhì)沒(méi)有變,只是復(fù)雜度呈指數(shù)級(jí)放大。

    面對(duì)這一底層困局,整個(gè)高性能計(jì)算(HPC)行業(yè)苦苦摸索了近十年。

    行業(yè)曾嘗試通過(guò)傳統(tǒng)編譯器抹平異構(gòu)差異,但傳統(tǒng)編譯器極度依賴(lài)人類(lèi)專(zhuān)家提前寫(xiě)好優(yōu)化規(guī)則。但面對(duì)如今海量的硬件和算法組合,人力根本無(wú)法覆蓋所有可能性。這導(dǎo)致生成的代碼性能,通常只能觸及人類(lèi)手寫(xiě)極致代碼的 70%-80%。

    另一種方法是行業(yè)嘗試讓AI自動(dòng)寫(xiě)底層代碼,結(jié)果卻變成了“盲拼樂(lè)高”,AI往往只能做好局部的單個(gè)功能,一旦要把這些功能組裝成一個(gè)大系統(tǒng),接口之間就會(huì)互相沖突,最終導(dǎo)致系統(tǒng)崩潰。

    在人類(lèi)試圖用規(guī)則掌控硬件的時(shí)代,頂級(jí)科學(xué)家陳天奇主導(dǎo)的 TVM,成為了那個(gè)時(shí)代最引人矚目的突破;而到了 AI 自動(dòng)生成軟件的新時(shí)代,NVIDIA 實(shí)驗(yàn)室推出的VibeTensor,用AI完整寫(xiě)出深度學(xué)習(xí)系統(tǒng)軟件,更是為行業(yè)后續(xù)探索鋪平了道路。而面壁智能今天的突破,正是站在了前人的肩膀上,補(bǔ)齊了工業(yè)級(jí)落地的最后一塊拼圖。

    VibeTensor和ForgeTrain的故事,生動(dòng)地演示了在AI生成軟件的新時(shí)代中,僅靠模型本身的能力是遠(yuǎn)遠(yuǎn)不夠的。成功的關(guān)鍵,在于如何設(shè)計(jì)一套能有效約束和引導(dǎo)AI的“游戲規(guī)則”。

    ForgeTrain通過(guò)在限定范圍、明確目標(biāo)、自動(dòng)驗(yàn)證的工程范式下取得了成功,而VibeTensor則在更廣闊、更模糊的空間里,為我們揭示了未來(lái)的挑戰(zhàn),同樣意義重大。它們分別代表了AI在軟件工程領(lǐng)域的兩種探索路徑,共同推動(dòng)著這個(gè)領(lǐng)域的進(jìn)步。

    通過(guò) ForgeTrain 的范式創(chuàng)新,國(guó)產(chǎn)芯片終于不必再去痛苦地像素級(jí)模仿、追趕英偉達(dá)的 CUDA 生態(tài),也不必在傳統(tǒng)編譯器的死胡同里耗盡心血。

    隨著這一技術(shù)有望徹底重寫(xiě)昇騰的底層軟件棧,它不僅將實(shí)質(zhì)性解決“國(guó)產(chǎn)卡難用”的工程瓶頸,更在戰(zhàn)略層面上,為中國(guó) AI 產(chǎn)業(yè)提供了一條繞過(guò)英偉達(dá) CUDA 生態(tài)壁壘、實(shí)現(xiàn)底層軟件解耦的非線性突圍路徑。

    1B 參數(shù)跑出 2B 性能?面壁 MiniCPM5-1B 用 AI 自進(jìn)化,提速 AGI 進(jìn)程

    04


    “端側(cè)大模型開(kāi)源狀元”的堅(jiān)持

    2024年,面壁智能提出大模型“密度定律”(Densing Law ):大模型的最大智能密度,大約每 100 天就會(huì)翻一倍。在“密度定律”的指引下,面壁智能自然而然地選擇了一條與北美巨頭完全不同、追求極致智能密度的道路。

    回顧面壁智能的探索史,從 2024 年初的 MiniCPM 1.0開(kāi)始,這支“小鋼炮”家族就在不斷刷新大模型“以小博大”的物理極限。憑借極小的參數(shù)量,先后越級(jí)超越 Llama2-13B 與 GPT-3.5,并將端側(cè)推理速度一路提升至最高 600 Token/s 的行業(yè)巔峰。

    憑借在端側(cè)模型上毫無(wú)保留的貢獻(xiàn),面壁智能毫無(wú)疑問(wèn)是“中國(guó)端側(cè)大模型開(kāi)源狀元”。

    今天,MiniCPM5-1B的發(fā)布,不僅僅是一個(gè)好用的小模型問(wèn)世,其背后的Forge Engineering就是這種思維的延續(xù),更是一種全新 AI 生產(chǎn)力范式的宣告。

    當(dāng)大模型能夠自主鍛造底層框架,研發(fā)與適配的軟件成本被 AI 壓縮到接近于零時(shí),大模型將真正蛻變?yōu)槿袠I(yè)都能低成本接入、每一臺(tái)日常設(shè)備都能被智能點(diǎn)亮的普惠事業(yè)。

    當(dāng)算力資源逐步向巨頭集中,面壁智能不僅堅(jiān)持把強(qiáng)大的大模型壓縮到每個(gè)普通人的手機(jī)、電腦里,更試圖將制造大模型的“鐵錘”交還給 AI 自己。在通往AGI的道路上,一條無(wú)視算力封鎖、屬于中國(guó)大模型的自我進(jìn)化飛輪已然開(kāi)啟,屬于大模型自我進(jìn)化的復(fù)利時(shí)代,已經(jīng)到來(lái)。

    ForgeTrain開(kāi)源鏈接:https://github.com/OpenBMB/ForgeTrain(5.26晚后上線)雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))

    1B 參數(shù)跑出 2B 性能?面壁 MiniCPM5-1B 用 AI 自進(jìn)化,提速 AGI 進(jìn)程
    1B 參數(shù)跑出 2B 性能?面壁 MiniCPM5-1B 用 AI 自進(jìn)化,提速 AGI 進(jìn)程

    雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知

    1B 參數(shù)跑出 2B 性能?面壁 MiniCPM5-1B 用 AI 自進(jìn)化,提速 AGI 進(jìn)程

    分享:
    相關(guān)文章
    最新文章
    請(qǐng)?zhí)顚?xiě)申請(qǐng)人資料
    姓名
    電話
    郵箱
    微信號(hào)
    作品鏈接
    個(gè)人簡(jiǎn)介
    為了您的賬戶(hù)安全,請(qǐng)驗(yàn)證郵箱
    您的郵箱還未驗(yàn)證,完成可獲20積分喲!
    請(qǐng)驗(yàn)證您的郵箱
    立即驗(yàn)證
    完善賬號(hào)信息
    您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
    立即設(shè)置 以后再說(shuō)
    主站蜘蛛池模板: 人妻少妇av中文字幕乱码| 丁香五月人妻| 特级毛片a级毛片在线播放www| 日韩一卡2卡3卡4卡新区亚洲 | 色噜噜狠狠成人综合| 亚洲成人小说图片| 不卡无码人妻一区二区三区| 日韩放荡少妇无码视频| 中文字幕国产在线精品| 一本色婷婷| 亚洲制服丝袜中文字幕自拍| 久久婷婷综合色丁香五月| 黑人猛精品一区二区三区| 女同国产精品一区二区| 平顶山市| 污视频网址| 极品人妻videosss人妻| 国产精品无码免费播放| 全部av―极品视觉盛宴| 中文字幕天天躁日日躁狠狠| 久久久久青草线综合超碰| 亚洲热妇无码av在线播放| 四虎网址| 狠狠人妻久久久久久综合蜜桃| 国产成人乱色伦区小说| 国产成人高清亚洲一区二区| 欧美日韩国产小视频| 亚洲男人的天堂久久香蕉| 欧美xxxx做受老人国产的| 99精品国产第一福利网站| 四虎国产精品永久入口| 久久天天躁狠狠躁夜夜婷 | 资源在线观看视频一区二区| 视色网| 出国| 精品自拍视频| 美女毛片一区二区三区四区| 亚洲精品二区| 厨房与子乱在线观看| 超碰人人摸| 国产一区av在线|