亚洲资本网 > 资讯 > 焦点 > 正文
北京发布大模型高质量数据集 新视野
2023-07-06 12:02:06来源: 人民日报海外版


【资料图】

人民日报海外版电 (记者贺勇)首批“北京市人工智能大模型高质量数据集”近日发布,10家单位的18个高质量训练数据集入选,包括人民日报语料数据集、国家法律法规语料数据集、两会参政议政建言数据集、“科情头条”全球科技动态数据集、中国科学引文数据库数据集、科技文献挖掘语义标注数据集等,涵盖经济、政治、文化、社会、生态等不同领域,总规模超过500T,将为通用大模型和行业大模型训练提供有力保障。

为更好把握这次通用人工智能发展的历史性机遇,近期北京市连续出台了《加快建设具有全球影响力的人工智能创新策源地实施方案》《北京市促进通用人工智能创新发展的若干措施》《北京市通用人工智能产业创新伙伴计划》等多项支持政策,释放明确信号、搭建伙伴平台、聚拢行业资源,助力人工智能技术赋能千行百业数智化转型。

目前,针对大模型训练的高质量中文语料占比较少,不利于中文语境表达及产业应用。为此,北京启动实施“通用人工智能产业创新伙伴计划”,其中一个重要领域就是针对大模型训练所需的高质量数据,发挥数据提供方海量数据资源优势,基于数据交易方搭建的流通交易平台和数据服务方的技术支撑,实现训练数据的有效供给及合规高效、安全有序的流动。

关键词:

专题新闻
  • 鲁南制药集团荣登中国医药制造业百强榜、中国医药自主创新先锋企业榜
  • 仰韶酒飘香联合国教科文组织,让世界聆听中国白酒声音!
  • 2023百合婚礼年中盘点丨年轻人婚礼呈现全新审美趋势
  • 主打旗舰品质,江铃福特新款轻客将重塑轻客市场新标杆
  • 蒙牛集团与浙商银行战略合作再升级 首推“奶牛信用卡”助力乡村振兴
  • 本土化战略开新局 赛
最近更新

京ICP备2021034106号-51

Copyright © 2011-2020  亚洲资本网   All Rights Reserved. 联系网站:55 16 53 8 @qq.com