• <sub id="pqc61"><p id="pqc61"></p></sub><sub id="pqc61"></sub>
    在线精品视频一区二区,亚洲中文字幕无码一久久区,正在播放肥臀熟妇在线视频,国内精品视频一区二区三区八戒 ,国产毛片三区二区一区,国产精品一区中文字幕,丰满少妇被猛烈进出69影院,国产成人无码
    您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
    此為臨時鏈接,僅用于文章預覽,將在時失效
    業(yè)界 正文
    發(fā)私信給小七
    發(fā)送

    0

    螞蟻發(fā)布并開源萬億參數思考模型Ring-1T,綜合能力逼近GPT-5

    本文作者: 小七   2025-10-14 10:45
    導語:螞蟻開源萬億思考模型Ring-1T,數學解題達奧賽銀牌水平。

    10月14日凌晨,螞蟻集團正式推出萬億參數思考模型Ring-1T,并全面開源模型權重、訓練配方。Ring-1T在9月30日開源的預覽版Ring-1T-preview基礎上,持續(xù)擴展大規(guī)模可驗證獎勵強化學習(RLVR)訓練,進一步激發(fā)萬億基座的自然語言推理能力,并通過 RLHF 訓練完善模型通用能力,在各項任務榜單上表現(xiàn)更加均衡。

    為了持續(xù)激發(fā)Ring-1T的數學等復雜推理能力,此次百靈團隊挑戰(zhàn)了難度更高的IMO2025(國際數學奧利匹克)賽題,將Ring-1T接入多智能體框架AWorld,使用純自然語言推理進行解題。實驗結果顯示,Ring-1T僅用一次解出了第1、3、4、5題,相當于IMO銀牌水平,成為首個能拿IMO國際奧數獎的開源系統(tǒng)。Ring-1T在第三次嘗試IMO時對第2題幾何證明也給出了接近滿分的證明過程,在頂流大模型幾乎全軍覆沒的第六題中將答案收斂到與Gemini 2.5 Pro 相同的“4048”(正確答案為2112)。作為一款思考模型,Ring-1T也表現(xiàn)出了極佳的通用能力,在“人類偏好對齊”測試Arena-Hard V2中,Ring-1T以81.59的成功率居于開源模型榜首,逼近GPT-5-Thinking(High)82.91的成績。在面向嚴謹領域的醫(yī)療問答HealthBench測評中,Ring-1T也以最高分取得開源領域最佳。

     螞蟻發(fā)布并開源萬億參數思考模型Ring-1T,綜合能力逼近GPT-5

    (Ring-1T與業(yè)界代表性思考模型的性能橫評)

     

    萬億參數思考模型訓練最大難題是訓推精度差異,即訓練階段與推理階段因實現(xiàn)細節(jié)差異導致的訓練和推理精度不一致,進而導致訓練崩潰。在Ring-1T模型中,螞蟻采用了自研的“棒冰(icepop)”算法來應對這項行業(yè)難題,即用帶掩碼的雙向截斷技術把訓練-推理分布差異凍結在低水位,確保長序列、長周期訓練不崩。此外,應對萬億參數模型強化學習訓練,螞蟻還自研了高性能強化學習系統(tǒng)ASystem(其中包含已開源的高性能強化學習框架AReaL),特別針對萬億參數模型的顯存管理和訓推權重交換問題做了精細的優(yōu)化,實現(xiàn)了單機顯存碎片秒級回收、權重零冗余交換,把大規(guī)模RL訓練穩(wěn)定跑成日常。

    螞蟻發(fā)布并開源萬億參數思考模型Ring-1T,綜合能力逼近GPT-5

    (圖左:GRPO訓推差異隨著訓練成指數上升,icepop較為平穩(wěn);圖右:訓推差異最大值,GRPO隨著訓練上升非常明顯,icepop維持在較低水位)

    此外,本次發(fā)布的Ring-1T模型繼續(xù)采用Ling 2.0架構的1T base模型做后訓練,Ling 2.0采用了包括高度稀疏的MoE架構,1/32的專家激活比、FP8混合精度、MTP等諸多特性實現(xiàn)高效訓練與推理。在后訓練階段,螞蟻百靈團隊通過LongCoT-SFT + RLVR + RLHF多階段訓練,顯著提升了模型的復雜推理能力以及指令跟隨和創(chuàng)意寫作等通用能力。

    據百靈團隊透露,Ring-1T模型是其在萬億思考模型上的首次嘗試,螞蟻百靈團隊會在后續(xù)的版本中繼續(xù)完善模型性能。目前,用戶可通過HuggingFace、魔搭社區(qū)下載模型,并通過螞蟻百寶箱等平臺在線體驗。

    螞蟻發(fā)布并開源萬億參數思考模型Ring-1T,綜合能力逼近GPT-5

    據了解,截止目前螞蟻百靈大模型已經發(fā)布18款模型,已形成從160億總參數到1萬億總參數的大語言模型產品矩陣,其中兩款萬億參數模型—萬億參數通用大語言模型Ling-1T、萬億參數思考模型Ring-1T。隨著兩款萬億參數模型的發(fā)布,百靈大模型也正式步入2.0階段。


    分享:
    最新文章
    請?zhí)顚懮暾埲速Y料
    姓名
    電話
    郵箱
    微信號
    作品鏈接
    個人簡介
    為了您的賬戶安全,請驗證郵箱
    您的郵箱還未驗證,完成可獲20積分喲!
    請驗證您的郵箱
    立即驗證
    完善賬號信息
    您的賬號已經綁定,現(xiàn)在您可以設置密碼以方便用郵箱登錄
    立即設置 以后再說
    主站蜘蛛池模板: 日韩狠狠入| 亚洲成av人最新无码不卡短片| 在线无码免费看黄网站| 四虎在线观看视频高清无码| 精品国产一区二区三区国产馆| 日本欧美大码a在线观看| 欧美顶级metart祼体全部自慰| 天天摸夜夜添| 国产精品免费看香蕉| 亚洲精品国产一区二区三区在线观看| 色二区| 久久se精品一区二区三区| 国产开嫩苞视频在线观看| 精品日韩人妻| 91久久精品国产性色也| 蜜桃av在线| yw尤物av无码国产在线观看| 国产无码性爱一区二区三区| 一道久久爱综合久久爱| 欧洲美熟女乱av在免费| av中文字幕免费| 无码专区人妻系列日韩精品| 欧美亚洲国产第一精品久久| 国产亚洲精品久久久久久小舞| 94人妻少妇偷人精品| 无码人妻斩一区二区三区| 国产黃色A片三区三区三小说| 伊在人香蕉99久久| 亚洲午夜香蕉久久精品| 中文字幕无码免费不卡视频| 91丨国产丨白浆秘?3D动漫| 性做久久久久久久久| 真实国产网爆门事件在线观看| 最近中文字幕国产精选| 亚洲大老师中文字幕久热| 美女91社| 欧美视频亚洲| 国产精品久久亚洲不卡| 精品人妻一区| 亚洲精品香蕉一区二区| 99久久久国产精品免费无卡顿|