“SUPERLAWBENCH”中国法研法律大模型评估指标和测评服务正式发布!
183人阅读 | 2024-9-27 14:45

法律大模型测评

      中国司法大数据研究院(以下简称中国法研)长期致力于法律大模型的研发和应用,目前已基本搭建完成精准的数据模型产品库,构建形成智能化法律服务能力和法律模型产业生态。基于中国法研“万法”大模型底座研发的“法观”已成为首个通过中国法考的法律大模型产品;正在筹建的“法律大模型联盟”已收到近100家单位的加入申请。

      中国法研结合深耕司法大数据行业的多年经验,形成了关于法律大模型测评的5大测试维度和35个测试指标,并积累了10W+的法律大模型测试集,能够在记忆、理解、逻辑推理、生成和安全方面对法律大模型的质量进行全方位的评估同时,依托中国合格评定国家认可委员会(CNAS)颁发的检测实验室资质,可出具专业的第三方测评报告,亦可对法律大模型做对比测评,为用户选型提供强有力的支撑。

测评能力

图片

线上介绍

关于“SUPERLAWBENCH”的测评能力介绍详见中国司法大数据服务网(点击下方“阅读原文”即可进入)

图片