「改革创新」胡坚波:人工智能大模型发展亟需高质量数据集
日期:2025-03-15 18:13:14 / 人气:28
胡坚波(长安街读书会成员、国家数据发展研究院院长)指出,人工智能大模型的发展离不开“数据粮食”,尤其是高质量数据集。

随着DeepSeek R1系列模型的发布,人工智能在国内再次掀起热潮,众多龙头企业纷纷接入DeepSeek,推动人工智能大模型向各行业渗透。而高质量数据集作为人工智能大模型训练、推理和验证的关键,其重要性不言而喻。
一、高质量数据集建设的重大意义
高质量数据集的建设对推进“人工智能+”行动、促进数字经济及经济社会高质量发展具有重大意义。它是人工智能发展的客观需要,也是促进我国行业数字化转型的关键举措。此外,高质量数据集的建设还能助力地方数字经济发展,为招商引资提供重要支撑。
二、高质量数据集建设的目标和策略
人工智能正在从以模型为中心转变为以数据为中心,高质量数据集的重要性日益凸显。为全面打造大规模、多模态、多领域的高质量数据集,应采取以下策略:
坚持场景化推动,从医疗、教育等重点行业入手,优先突破最迫切、最容易产生效果的数据集建设。
坚持体系化牵引,发挥政府作用,组织多方主体打造协调联动生态体系。
坚持多元化促进,加强引导技术能力强、行业影响力高的企业吸纳、聚合相关数据,同时强化中小企业创新优势。
坚持安全合规,确保数据来源的合法性、合规性和产权保护,降低数据使用风险。
三、推动高质量数据集建设的具体举措
为全力打造人工智能高质量数据集,推动大模型应用迈向新高度,建议从以下六个方面着手:
绘制高质量数据集建设图谱,明确建设方向和应用需求。
协同推进政策法规的制定与完善,为高质量数据集建设提供法律保障。
制定高质量数据集建设指引,解决现实问题,优化建设方案和路径。
打造高质量数据集评测体系,推动标准建设,指导数据集质量评估。
建立高质量数据集流通利用新机制,探索跨域合作,促进数据集交易流通。
发挥行业标杆示范引领作用,鼓励资金支持,推广典型案例。
注:本文已择优收录至“长安街读书会”理论学习平台,转载须注明出处和作者。
作者:安信娱乐平台官网
新闻资讯 News
- 刀郎武汉演唱会:一场“去表演化...04-03
- 戚薇一家三口游迪士尼,Lucky...04-03
- 54岁“雪姨”王琳惊艳时装秀,冻...04-03
- 《乘风2025》"双丹"失宠?节目组...04-03