上海人工智能實驗室等開源書生·浦語20B模型，阿里云魔搭社區全球首發

本文作者： nebula

2023-09-20 17:11

導語：9月20日，上海人工智能實驗室等機構發布書生·浦語大模型（InternLM）200億參數版本InternLM-20B，并在阿里云魔搭社區（ModelScope）

9月20日，上海人工智能實驗室等機構發布書生·浦語大模型（InternLM）200億參數版本InternLM-20B，并在阿里云魔搭社區（ModelScope）開源首發、免費商用。書生·浦語大模型體系與魔搭社區建立重磅生態合作，共同推動中國大模型生態建設。

書生·浦語（InternLM）大語言模型由上海人工智能實驗室聯合多家機構共同推出。今年6月，InternLM千億參數（104B）語言大模型首次發布，現已經歷多輪升級；7月，上海人工智能實驗室開源書生·浦語70億參數的輕量級版本InternLM-7B，且在業內率先開源貫穿數據、預訓練、微調、部署和評測的全鏈條工具體系。InternLM-7B也已上線魔搭社區。

本次發布的InternLM-20B是一款中量級大模型，性能先進且應用便捷，模型基于2.3T Tokens預訓練語料從頭訓練，相較于InternLM-7B，其理解能力、推理能力、數學能力、編程能力等都有顯著提升。

相比于此前國內陸續開源的7B和13B規格模型，20B量級模型具備更強大的綜合能力，復雜推理和反思能力尤為突出，能為實際應用場景提供更有力的性能支持；同時，20B量級模型可在單卡上進行推理，經過低比特量化后，可運行在單塊消費級GPU上，因而在實際應用中更為便捷。

相比于此前的開源模型，InternLM-20B擁有幾大優勢：一、優異的綜合性能。不僅全面領先相近量級的開源模型，且以不足1/3的參數量，測評成績達到了Llama2-70B的水平。二、強大的工具調用能力。支持數十類插件，上萬個API功能，還具備代碼解釋和反思修正能力，為智能體（Agent）的構建提供了良好的技術基礎。三、更長的語境。實現了對長文理解、長文生成和超長對話的有效支持，同時支持 16K 語境長度。四、更安全的價值對齊。在研發訓練的過程中，研究團隊進行了基于SFT和RLHF兩階段價值對齊，并通過專家紅隊的對抗訓練大幅提高其安全性。

書生·浦語開源工具鏈也已全新升級，形成更完善的體系，包括預訓練框架InternLM-Train、低成本微調框架XTuner、部署推理框架 LMDeploy、評測框架OpenCompass 以及面向場景應用的智能體框架Lagent。書生·浦語工具鏈將和開源數據平臺OpenDataLab構成強大的開源工具及數據體系，為業界提供全鏈條研發與應用支持。

上海人工智能實驗室等開源書生·浦語20B模型，阿里云魔搭社區全球首發

書生·浦語-20B：

https://modelscope.cn/models/Shanghai_AI_Laboratory/internlm-20b

書生·浦語-對話-20B：

https://modelscope.cn/models/Shanghai_AI_Laboratory/internlm-20b-chat

魔搭社區最佳實踐：

https://mp.weixin.qq.com/s?__biz=MzkxNTM5NTg2OA==&mid=2247486560&idx=1&sn=28517fb276b9d87b7f75d432a8a3dc2f&chksm=c15e8813f62901053216926c3d9b18d63ee825ea9e28fbeeec2a9e92360b1d3286263a6ae574#rd

魔搭社區開設了書生·浦語“模型品牌館”專頁，聚合書生·浦語系列所有模型及體驗接口，便于開發者一站式查詢、下載、使用書生模型；魔搭公眾號則推出了最佳實踐教程，提前跑通模型的部署、推理和微調流程，供開發者參考。

阿里云魔搭社區是國內規模最大、開發者最活躍的AI模型社區，擁有200多萬開發者，聚集了20多家頭部人工智能機構貢獻的1000多款優質AI模型，為開發者提供一站式的模型體驗、下載、推理、調優、定制等服務，社區模型累計下載量已突破7500萬次。

“以開源開放促進中國大模型生態繁榮”是書生·浦語大模型體系與魔搭社區攜手共建的初衷。上海人工智能實驗室堅持通過開源開放，全面賦能AI社區生態的繁榮發展，支撐學術研究與產業發展。阿里云則把促進中國大模型生態的繁榮作為首要目標，牽頭建設中國最大的AI模型開源社區魔搭，并為大模型企業和開發者提供全方位云服務。

雷峰網(公眾號：雷峰網)

0人收藏

nebula

運營

發私信

當月熱門文章