Shop

Showing 1–12 of 31 results

中文普通话声纹识别数据库（手机）

该识别数据在安静办公室/家居环境中完成录制，共有300位发音人参与，包括133位男性和167位女性，所有参与录音的发音人均经过专业筛选，保证其发音标准，吐字清晰。录音文本覆盖新闻、日常对话、推特等信息。

Read more
中文男声合成库-客服风格

录音语种：ZH-CN汉语(中国大陆)

Read more
中英混男声合成库（自然和播报风格）

该数据库是一个单通道的中英混男声TTS(文本转语音)数据库；该数据库纯录音时长约为28.84小时，包括中文约14.75小时、英文约7.88小时、中英混约6.22小时。
该数据库的风格分为播报风格和自然风格，文本类型多样，包含时事、财经、科技、房产、体育、教育、旅游、娱乐、美食、健康等。
录音语种：中文；英文

Read more
乌尔都语识别语音库(手机)

所有参与录音的发音人均经过专业筛选，保证其发音标准，吐字清晰。录音文本覆盖日常对话、新闻、命令词等信息。
录音语种：乌尔都语(巴基斯坦)
录音时长：46.6小时
录音平台：手机
录音参数：16KHz;16bit
录音环境：安静办公室环境

Read more
人物视频分割

人物视频分割数据，包括对人像视频的采集和标注两个任务。采集6000余个人像视频数据，内容包括自拍直播、电影电视、卡通动漫三个种类，并对视频中截取的227219张图片中的人物进行人像语义分割标注，可用于人脸识别、人脸姿态、目标检测等任务。

Read more
人脸和人体姿态3D建模数据库

被采集者年龄覆盖阶段广，男女比例均衡，能满足不同任务场景的需求。

Read more
人脸姿态成人

产品规模：9.03GB
样品情况：男性1269人、女性1153人
采集环境：室内
拍摄角度：多角度

Read more
俄语女声合成库-多风格

录音语种：俄语(俄国)
录音时长：6
录音参数：48KHz;16bit
标注信息：发音标注；韵律标注

Read more
克罗地亚语识别语音库(手机)

适应领域：IT互联网、智能搜索、智能驾驶、社交软件、教育科研、智能家居、智慧医疗…
录音语种：HR-HR克罗地亚语(克罗地亚)

Read more
南非荷兰语发音词典

本词典共包含70793个日常用语和30935个专有名词。其中日常用语是选自报纸和网站的高频词，专有名词则覆盖了人名、地名等信息。

Read more
卢干达语女声合成库

录音语种：lg-ug卢干达语(乌干达)

Read more
印尼语多模态语音视频数据集

多模态模型被认为是目前提高人工智能系统能力的最佳途径之一，而本产品库采用最新采集形式，同时采集录制印尼语native发音人的多人对话的音频和视频数据，共计约84小时的有效对话数据，音频和视频数据采集结果会进行对齐处理，误差在30毫秒以内。在稀缺资源语种的基础上具有非常高的信息丰富度，可提供更加全面的信息输入从而高效提升系统的表现和效率。

Read more