0
| 本文作者: nebula | 2023-09-20 17:11 |
9月20日,上海人工智能實驗室等機構發布書生·浦語大模型(InternLM)200億參數版本InternLM-20B,并在阿里云魔搭社區(ModelScope)開源首發、免費商用。書生·浦語大模型體系與魔搭社區建立重磅生態合作,共同推動中國大模型生態建設。

書生·浦語(InternLM)大語言模型由上海人工智能實驗室聯合多家機構共同推出。今年6月,InternLM千億參數(104B)語言大模型首次發布,現已經歷多輪升級;7月,上海人工智能實驗室開源書生·浦語70億參數的輕量級版本InternLM-7B,且在業內率先開源貫穿數據、預訓練、微調、部署和評測的全鏈條工具體系。InternLM-7B也已上線魔搭社區。
本次發布的InternLM-20B是一款中量級大模型,性能先進且應用便捷,模型基于2.3T Tokens預訓練語料從頭訓練,相較于InternLM-7B,其理解能力、推理能力、數學能力、編程能力等都有顯著提升。
相比于此前國內陸續開源的7B和13B規格模型,20B量級模型具備更強大的綜合能力,復雜推理和反思能力尤為突出,能為實際應用場景提供更有力的性能支持;同時,20B量級模型可在單卡上進行推理,經過低比特量化后,可運行在單塊消費級GPU上,因而在實際應用中更為便捷。
相比于此前的開源模型,InternLM-20B擁有幾大優勢:一、優異的綜合性能。不僅全面領先相近量級的開源模型,且以不足1/3的參數量,測評成績達到了Llama2-70B的水平。二、強大的工具調用能力。支持數十類插件,上萬個API功能,還具備代碼解釋和反思修正能力,為智能體(Agent)的構建提供了良好的技術基礎。三、更長的語境。實現了對長文理解、長文生成和超長對話的有效支持,同時支持 16K 語境長度。四、更安全的價值對齊。在研發訓練的過程中,研究團隊進行了基于SFT和RLHF兩階段價值對齊,并通過專家紅隊的對抗訓練大幅提高其安全性。
書生·浦語開源工具鏈也已全新升級,形成更完善的體系,包括預訓練框架InternLM-Train、低成本微調框架XTuner、部署推理框架 LMDeploy、評測框架OpenCompass 以及面向場景應用的智能體框架Lagent。書生·浦語工具鏈將和開源數據平臺OpenDataLab構成強大的開源工具及數據體系,為業界提供全鏈條研發與應用支持。

書生·浦語-20B:
https://modelscope.cn/models/Shanghai_AI_Laboratory/internlm-20b
書生·浦語-對話-20B:
https://modelscope.cn/models/Shanghai_AI_Laboratory/internlm-20b-chat
魔搭社區最佳實踐:
魔搭社區開設了書生·浦語“模型品牌館”專頁,聚合書生·浦語系列所有模型及體驗接口,便于開發者一站式查詢、下載、使用書生模型;魔搭公眾號則推出了最佳實踐教程,提前跑通模型的部署、推理和微調流程,供開發者參考。
阿里云魔搭社區是國內規模最大、開發者最活躍的AI模型社區,擁有200多萬開發者,聚集了20多家頭部人工智能機構貢獻的1000多款優質AI模型,為開發者提供一站式的模型體驗、下載、推理、調優、定制等服務,社區模型累計下載量已突破7500萬次。
“以開源開放促進中國大模型生態繁榮”是書生·浦語大模型體系與魔搭社區攜手共建的初衷。上海人工智能實驗室堅持通過開源開放,全面賦能AI社區生態的繁榮發展,支撐學術研究與產業發展。阿里云則把促進中國大模型生態的繁榮作為首要目標,牽頭建設中國最大的AI模型開源社區魔搭,并為大模型企業和開發者提供全方位云服務。
雷峰網(公眾號:雷峰網)