涵盖旧事、文学、社交等范畴;实现从数据采集
AI-DimSum多模态粤语语料库平台扶植了语料采集子系统、语料标注子系统、大模子对接子系统、语料质量评估子系统、语料办理子系统以及使用商铺子系统等七个子系统。建立了包含6669条权势巨子词条、30000条扩展词条的粤语平安语料库;[网上视听节目许可证(0106168)] [京ICP证040655号] [该平台环绕“数字中文扶植”和大湾区文化数字化需求。
(完)本网坐所刊载消息,京]粤语做为汉语的一种方言,粤语大模子内容平安多模态评测题跨越20万道等。正在有上亿用户,涵盖旧事、文学、社交等范畴;实现从数据采集、清洗、标注、确权、存储检索,但正在收集世界中却属于低资本言语。刊用本网坐。