Datatangはさまざまな音声、画像、動画データの収集に対応。音声認識、オブジェクト検出、セマンティックセグメンテーション、オブジェクトの行動認識タスクにおいて豊富なデータアノテーション経験を持っており、スマートエンターテインメントシーンにおけるさまざまな種類のデータニーズを満たします。
複数の言語、デバイスによる音声データ収集と、テキスト、ノイズ、話者のロールなどのアノテーションをサポートします。
静的、動的ジェスチャデータの収集と、手のキーポイント、属性、タイプなどのアノテーションをサポートします。
音色、スタイル、言語の種類に応じた発声者のカスタマイズをサポートし、デジタルヒューマンのイメージに沿ったリアルな合成音声を構成します。
音色、スタイル、言語の種類に応じた発声者のカスタマイズをサポートし、デジタルヒューマンのイメージに沿ったリアルな合成音声を構成します。
マルチシーンおよびマルチアングルの人体行動画像・動画の収集と、人体の行動・属性情報のアノテーションに対応しています。
画像、映像、点群、テキストのデータアノテーションニーズを全面的に網羅。内蔵の半自動アノテーションと品質検査により、1人あたりのアノテーション効率が30%以上向上しました。
155 Hours - Lip Sync Multimodal Video Data
180,717 Images - Sign Language Gestures Recognition Data
50,356 Images - Human Body Segmentation and 18 Landmarks Data
4,253 Pairs of Human Face Images – Before and After Makeup
12 Hours - Chinese Mandarin Synthesis Corpus-Female, Entertainment anchor Style, Multi-emotional
5,808 People - Human Pose Recognition Data
26,090 images Human Facial Skin Defects Data
200 Hours - English Gaming Real-world Casual Conversation and Monologue speech dataset
お客様は、ソーシャル製品における美顔、メイク向け合成技術と効果のさらなる向上を希望していました。Datatangは、お客様から提供されたデータに対してピクセルレベルのセグメンテーションアノテーションを実施。顔の遮られた部分を合理的な推定によりアライメント、補完し、オブジェクトの輪郭のラインに基づきアノテーションを行う必要がありました。ジェスチャー、体、顔の輪郭は形状に基づき厳密にアノテーションを行い、滑らかなラインを実現しました。プロジェクトはお客様による受入検査に合格しました。
お客様は、バーチャルヒューマンの合成技術と効果の向上を希望していました。バーチャルヒューマンの設定は成人男性で、清潔な室内で顔の表情、体の動き、対応する音声のデータを収集する必要がありました。Datatangは、フェイシャルキャプチャ、モーションキャプチャ設備を使用するとともに、Hi-Fi録音機器を用意。お客様が必要とする人数分のデータ収集を完成させ、受入検査に合格しました。
豊富な製品データセット、パーソナライズされたデータカスタマイズサービス、インテリジェントなデータアノテーション補助ツールにより、AIデータの難題をワンストップで解決します。
インテリジェントなセルフチェック、複数段階の品質検査などのプロセスを経て、より高品質なデータを提供します。また、ISO9001品質マネジメント認証を取得しています。
成熟した30種類のアノテーションツールは、音声、画像、動画、3D点群、テキストデータアノテーションのニーズを網羅しています。
ISO27001/ISO27701情報セキュリティおよびプライバシー保護認証を取得。個人情報保護法およびGDPRなどを遵守しています。
AIによる事前識別補助機能を使用して、ヒューマン・マシン・インタラクティブ半自動アノテーションを実現。1人あたりのアノテーション効率が30%以上向上できます。