
Interspeech2025-MLC-SLM多语种对话语音竞赛数据集

3000小时全双工普通话自然对话语音数据

500,000张21国自然场景&文档拍照场景&电子场景OCR标注数据

20万组多国地标建筑图文数据

600小时希腊语口语化语音数据

600小时挪威语口语化语音数据

三维场景高保真合成数据集_座舱

日本OKWAVE问答平台文本数据

500小时泰米尔语手机采集朗读语音数据

500小时老挝语手机采集朗读语音数据

中文多情感语气词与自由对话合成库

249,993,1框7,262张人脸肤质缺陷标注数据

古吉拉特语脚本对话语音数据

5小时武汉方言男声合成库

5小时长沙方言女声合成库

100小时缅甸语手机采集朗读语音数据

5小时上海方言女声合成库

10万条英文大模型指令微调文本数据集

19,634段表情视频采集数据

3,000万段高质量视频数据
. . .