“弱智贴吧”的数据,居然是中文语料库

内容摘要中国科学院、北大、中国科技大学、滑铁卢大学、01.ai等10家机构联合推出了,专用于中文的高质量指令调优数据集——COIG-CQIA。在大模型领域英语一直是训练数据最重要的语言,但由于中英文的结构和文化差异,直接将英文数据集翻译成中文并不理
 
举报 收藏 打赏 评论 0
24小时热闻
今日推荐
浙ICP备19001410号-1