Tel:03-6256-8911

jp

数据解决方案

请输入姓名

携帯電話番号が無効です

連絡先を入力してください

会社名を入力してください

有効な仕事用電子メールを入力してください。

ご希望のデータについて入力してください

送信完了しました! ご協力ありがとうございました。

填写格式错误请重新填写

確認する

5文字以下、または数字のみでの入力は無効です。

https://www.datatang.co.jp

996

_Data Products_Datatang

155 Hours - Lip Sync Multimodal Video Data_155 Hours - Lip Sync Multimodal Video Data

155 Hours - Lip Sync Multimodal Video Data

  • ライセンス認証を経た製品データセットが、AIプロジェクトのスピーディーな立ち上げをアシストします。

Voice and matching lip language video filmed with 249 people by multi-devices simultaneously, aligned precisely by pulse signal, with high accuracy. It can be used in multi-modal learning algorithms research in speech and image fields.

お問い合わせ サンプルを入手する

データ仕様

Format
Video: mp4 format, 1,280*720, Audio: wav format, 16HZ, 16bit  mono
Recording Environment
Using quiet sunny room to stimulate daytime outdoor driving scenes,Signal to noise ratio 25~20dB
Recording Scenes
divide to big scenes and sub scenes by different intense of sunlight
Recording Content
Short signals and spoken sentences
Speaker
249 Chinese, balance for gender
Recording Device
Camera, HD microphone, Audio board
Recording angle
Recording videos of front face, single side face, looking up, looking down, side face looking down and side face looking up all 6 different angles, and proximal and distant audio at the same time
Language
Mandarin
Application scenario
Lip Language recognization
Accuracy
Accuracy of sentence should not below 95%

サンプル紹介

収集対象者からの明確に許可を得た、高品質の製品トレーニングデータセットはが、AIプロジェクトのスピーディーな立ち上げをアシストします。

さっそく始めてみる

関連データのおすすめ

531 Hours – In-Car Noise Data by Microphone and Mobile Phone
531 Hours – In-Car Noise Data by Microphone and Mobile Phone
245 Hours – Mandarin Speech Data in Cars by Mobile Phone
245 Hours – Mandarin Speech Data in Cars by Mobile Phone

Data Features

155 Hours - Lip Sync Multimodal Video Data

*Name:

*Phone:

*Company:

*E-mail:

*Requirement:

155 Hours - Lip Sync Multimodal Video Data