(資料圖)
快科技8月11日消息,近日,小米的大語(yǔ)言模型MiLM-6B首次現(xiàn)身C-Eval、CMMLU兩大AI模型評(píng)測(cè)榜單。
截至本文成稿,MiLM-6B在C-Eval總榜單排名第10、同參數(shù)量級(jí)排名第1,在CMMLU中文向大模型排名第1。
根據(jù)C-Eval給出的信息,MiLM-6B模型在各個(gè)測(cè)試科目中的平均成績(jī)?nèi)缦拢?/p>
具體各科目成績(jī)上,在STEM(科學(xué)、技術(shù)、工程和數(shù)學(xué)教育)全部20個(gè)科目中,計(jì)量師、物理、化學(xué)、生物等多個(gè)項(xiàng)目獲得了較高的準(zhǔn)確率。
而在10個(gè)社會(huì)科學(xué)科目中,該模型在教育學(xué)和地理外的所有科目,都獲得了較為理想的準(zhǔn)確率。
人文科學(xué)的11個(gè)科目中,MiLM-6B則在歷史與法律基礎(chǔ)上有著不錯(cuò)的準(zhǔn)確率表現(xiàn)。
可以看出,MiLM-6B模型目前已經(jīng)在大多數(shù)科目中表現(xiàn)出了相對(duì)良好的準(zhǔn)確度,但在諸如法學(xué)、數(shù)學(xué)、編程、概率論、離散數(shù)學(xué)等科目上的表現(xiàn)依舊有明顯進(jìn)步空間。
快科技延展閱讀:
根據(jù)GitHub項(xiàng)目頁(yè)給出的信息,MiLM-6B是由小米開發(fā)的一個(gè)大規(guī)模預(yù)訓(xùn)練語(yǔ)言模型,參數(shù)規(guī)模為64億。


