北京商報(bào)訊(記者 楊月涵)4月1日,瀾舟科技正式宣布Mengzi3-13B開(kāi)源,對(duì)學(xué)術(shù)研究完全開(kāi)放,同時(shí)支持免費(fèi)商用。
今年3月18日,瀾舟科技推出了其“一橫N縱”孟子大模型系列及產(chǎn)品體系。其中,“一橫”的核心——孟子大模型技術(shù),經(jīng)過(guò)高效迭代后,孟子大模型V3版本的Mengzi3-13B也正式與大家見(jiàn)面。
據(jù)介紹,相較于今年1月發(fā)布的孟子大模型GPT V2系列(包括孟子大模型-標(biāo)準(zhǔn)、孟子大模型-輕量、孟子大模型-金融、孟子大模型-編碼),Mengzi3-13B在數(shù)據(jù)集質(zhì)量上有了顯著的提升。其采用的Mengzi-3數(shù)據(jù)集規(guī)模高達(dá)3T tokens,涵蓋了網(wǎng)頁(yè)、代碼、書(shū)籍、論文等多元化、高質(zhì)量的數(shù)據(jù)來(lái)源。
在MMLU、Chinese-MMLU、GSM8K、HUMAN-EVAL等多項(xiàng)公開(kāi)數(shù)據(jù)集進(jìn)行的模型效果評(píng)估中,Mengzi3-13B均展現(xiàn)出了卓越的性能表現(xiàn)。在參數(shù)量20B以內(nèi)的輕量化大模型領(lǐng)域,Mengzi3-13B在中英文語(yǔ)言能力方面的成績(jī)尤為突出,具備了出色的實(shí)用性和高性價(jià)比,能更好的滿足企業(yè)的商業(yè)化需求。
最新評(píng)論