
1万组数字图表问答数据

3,000万段高质量视频数据

8,000万张矢量图图像数据

2亿张高质量图像数据

5万组图像编辑数据

500,000张多国自然场景和文档OCR数据

30,000张东南亚小语种自然场景OCR数据

10万组图标图文描述数据

690万道中文多学科试题文本结构化解析处理数据

100万道中文代码试题文本结构化解析处理数据

161小时古吉拉特语朗读语音数据

3200万道理工科试题文本结构化解析处理数据

11.4万道中文竞赛试题文本结构化解析处理数据

1500小时加拿大法语口语化语音数据

5,000张土耳其语自然场景OCR数据

155小时加拿大法语自然对话手机采集语音数据

900小时泰语口语化语音数据

52对双胞胎人脸采集数据

2000小时澳大利亚英语口语化语音数据

20,846组菜谱图文描述数据
. . .