购物
- Home
- 数据集商城
-
中文普通话声纹识别数据库(手机)
该识别数据在安静办公室/家居环境中完成录制,共有300位发音人参与,包括133位男性和167位女性,所有参与录音的发音人均经过专业筛选,保证其发音标准,吐字清晰。录音文本覆盖新闻、日常对话、推特等信息。
-
-
中英混男声合成库(自然和播报风格)
该数据库是一个单通道的中英混男声TTS(文本转语音)数据库;该数据库纯录音时长约为28.84小时,包括中文约14.75小时、英文约7.88小时、中英混约6.22小时。
该数据库的风格分为播报风格和自然风格,文本类型多样,包含时事、财经、科技、房产、体育、教育、旅游、娱乐、美食、健康等。
录音语种:中文;英文 -
乌尔都语识别语音库(手机)
所有参与录音的发音人均经过专业筛选,保证其发音标准,吐字清晰。录音文本覆盖日常对话、新闻、命令词等信息。
录音语种:乌尔都语(巴基斯坦)
录音时长:46.6小时
录音平台:手机
录音参数:16KHz;16bit
录音环境:安静办公室环境 -
-
-
-
印尼语多模态语音视频数据集
多模态模型被认为是目前提高人工智能系统能力的最佳途径之一,而本产品库采用最新采集形式,同时采集录制印尼语native发音人的多人对话的音频和视频数据,共计约84小时的有效对话数据,音频和视频数据采集结果会进行对齐处理,误差在30毫秒以内。在稀缺资源语种的基础上具有非常高的信息丰富度,可提供更加全面的信息输入从而高效提升系统的表现和效率。