cn

数据解决方案

请输入姓名

手机号码格式错误

请输入联系电话

请输入公司名称

请输入正确的工作邮箱

请输入数据需求

提交成功!感谢您支持数据堂。

填写格式错误请重新填写

确定

数据需求不能小于5个字且不能为纯数字

https://www.datatang.com

https://www.datatang.ai

m.datatang.ai

2025数博会 | 数据堂携高质量数据集建设方案亮相,董事长齐红威受邀发表主题演讲

作者:数据堂 发布时间:2025-08-29

8月28日至30日,由国家数据局主办、贵州省人民政府承办的2025中国国际大数据产业博览会(以下简称数博会)在贵阳隆重举办。本届大会紧扣“数聚产业动能 智启发展新篇”主题,旨在通过一系列高端论坛、技术展示和行业交流活动,加快数据产业集聚,推动行业深度融合,增强科技创新能力,全面助力数字经济实现高质量发展。

高质量数据筑基,推动AI高效落地

在本次数博会上,数据堂受邀在E1数智基建馆“国家数据基础设施”展区,面向与会领导及广大参会者,全方位、多角度地展示数据堂在人工智能高质量数据集建设方面的深厚技术积淀及专业生产服务方案。

  


随着“人工智能+”行动的深入推进,高质量数据集已成为训练高效人工智能模型的关键支撑。数据堂深耕数据服务十余年,已积累4.5PB版权清晰的高质量数据资源,包括基础语言及千万级多模态大模型训练数据;涵盖通用领域SFT问答对、安全内容及思维链的大模型调教数据;以及各垂直领域的行业大模型增强数据。公司依托全球化采集/采购体系,构建了完整的高质量数据生产体系,为AI模型开发提供全面、合规、优质的数据支撑。


董事长齐红威受邀发表主题演讲


受国家数据局邀请,数据堂创始人、董事长齐红威在数博会“高质量数据集交流活动”上作了题为“大模型下高质量数据集建设方案与案例”的主题演讲。齐总分享了今后大模型下人工智能将会转向以数据集为核心的新发展范式,指出了当前高质量数据集建设面临的主要问题,阐述了高质量数据集的构建体系,为行业发展提供了良好的建议。


数据堂创始人、董事长齐红威作主题报告

AI数据标注,平台智能化是关键

在数博会数智基建馆展区,数据堂也展现了其自研的智能数据标注平台的核心能力和技术优势。随着大模型数据需求的不断增长和标注任务的日益复杂,智能化平台将发挥更加重要的作用。数据堂数加加智能数据标注平台,是国内首创“基于Human-in-the-loop智能辅助标注技术”的智能数据标注平台,为客户提供涵盖语音、图像、文本、3D点云等全类型人工智能数据定制处理服务。平台提供覆盖多种数据类型标注需求的丰富模板、融合AI技术提升效率、支持灵活的组织管理、嵌入严谨的质量控制流程、保障数据安全。我们采用自动化标注与人工校对相结合的方式,并通过训练有素的专业标注团队进行人工校对,并在不同的复杂场景下反复校验,显著提升数据标注效率及数据准确率,确保最终数据符合行业规范,满足客户高标准要求。

数据堂入选国家数据局2025年高质量数据集优秀案例

同时,在数博会高质量数据集交流活动上,“数据堂教育高质量数据集构建及应用”成功入选国家数据局2025年高质量数据集优秀案例。针对教育数据“多模态对齐难、大规模标注慢、高质量评测难”等问题,研发攻关多模态语义表征对齐、高效半自动数据智能标注、多维度数据集质量评测等关键技术体系;建设教育行业分布式自动采集、标注工具及智能化生产平台;数据集构建速度提升80%,标注准确率达到97%以上,整体效率提高60%-80%,降低人工智能数据“卡脖子”风险,有效保障教育行业高质量数据集自主供给能力,显著促进教育大模型开发效率和应用落地,推动教育AI产业化发展。


“数据堂教育高质量数据集构建及应用”成功入选

日前,国务院发布《关于深入实施“人工智能+”行动的意见》,推动人工智能与经济社会各行业各领域广泛深度融合。从国家战略到地方实践,建设高质量数据集对我国发展人工智能具有重大意义,在全球人工智能竞争格局下,数据质量决定模型性能与国家竞争力,国内产业升级更需行业专属、知识密集的数据“燃料”。因此,国家将其纳入重大战略,并作为“人工智能+”行动的核心工程,从制度、产业、场景、标准四个方面出发,打通“采集—标注—训练—落地—反哺”闭环。

数据堂将持续加强高质量数据集建设,紧跟技术发展趋势,不断探索新的标注方法和技术,优化自研的智能数据标注平台,并根据各行业客户的具体需求,量身定制高质量数据集建设方案,帮助企业在人工智能时代实现转型升级。我们将继续秉持创新、专业、服务的理念,为我国智能跨越式发展注入源源不断的数据动能。
口音英语语音识别技术研讨会暨挑战赛-数据堂