最近,全国数据工作会议宣布了一项新计划,旨在建立国家级的数据标注基地。这一举措的目的是推动数据标注产业的发展,提升数据处理能力,并在实际应用场景中进行创新尝试。此外,国家数据局计划开展一系列试点项目,以深化数字经济和数据要素的创新发展。
随着人工智能(AI)技术的迅猛发展,数据、算法和计算能力已成为AI领域的三大关键要素。在AI的新时代,数据不仅仅是训练算法的“原材料”,其类型、质量和获取难度的差异化对AI模型的性能和研发水平有着决定性影响。特别是对于大型语言模型(LLM)和生成式预训练转换模型(GPT)等先进AI模型,高质量、大规模和多样化的数据集尤为关键。