1月24日,中國司法人工智能大會在上海舉行。會上,清華大學(xué)互聯(lián)網(wǎng)司法研究院發(fā)布了基于華為云昇騰AI云服務(wù)研發(fā)的開源法律大模型LegalOne-R1。該模型針對中國司法數(shù)據(jù)進(jìn)行訓(xùn)練,包含1.7B、4B和8B三個不同參數(shù)版本,是一款面向法律場景的推理模型。通過"中端訓(xùn)練+后訓(xùn)練"雙階段增強(qiáng),融合指令微調(diào)與強(qiáng)化學(xué)習(xí),高效注入法律知識、模擬專業(yè)工作流,實現(xiàn)法律思維的涌現(xiàn)。在保障通用能力的前提下,LegalOne-R1掌握條文記憶、概念辨析、多跳推理與裁判邏輯,在真實業(yè)務(wù)中更穩(wěn)、更準(zhǔn)、更可用。
LegalOne-R1的訓(xùn)練得到了華為AI百校計劃的算力支持,還得到了互聯(lián)網(wǎng)體系結(jié)構(gòu)全國重點實驗室上海分室、泉城省實驗室和麥伽智能等產(chǎn)業(yè)合作伙伴的支持。在公開評測集合上,LegalOne-R1-8B在法律專業(yè)能力上表現(xiàn)突出。在LexEval、LawBench、JecQA等評測集上,LegalOne-R1-8B的整體表現(xiàn)對標(biāo)參數(shù)規(guī)模顯著更大的通用模型,在法律概念理解、法條記憶性、多跳推理等關(guān)鍵任務(wù)上達(dá)到當(dāng)前開源模型的領(lǐng)先水平。該模型在華為昇騰Atlas910B計算平臺與昇思MindSporeAI框架上完成從數(shù)據(jù)到訓(xùn)練的全流程訓(xùn)練與推理適配。



來源:一電快訊
返回第一電動網(wǎng)首頁 >
以上內(nèi)容由AI創(chuàng)作,如有問題請聯(lián)系admin#d1ev.com(#替換成@)溝通,AI創(chuàng)作內(nèi)容并不代表第一電動網(wǎng)(www.cbbreul.com)立場。
文中圖片源自互聯(lián)網(wǎng)或AI創(chuàng)作,如有侵權(quán)請聯(lián)系郵件刪除。