Datatangは実際のカスタマーサービスシーンのシミュレーションを通じ、言語、トーン、スタイル、業界に合わせてパーソナライズしたカスタマーサービス音声データ収集、大量の生音声データに対する抽出、分類、アノテーションなどの一連の処理をサポート。雑多な生データを、マシンのディープラーニングに使えるカスタマーサービストレーニングデータに変換します。
中国語共通語と方言、英語に加え、中国語と英語の混合読み上げなどその他言語タイプの音声データの録音をサポートしています。
金融、保険、電子商取引、プロバイダなどのさまざまな業種のリアルなシーンのカスタマーサービス音声データカスタマイズ収集をサポートします。
長いオーディオデータ、ノイズ、有効/無効なオーディオデータの分割アノテーションを行います。
自然な対話の長時間・短時間、継ぎ目あり・継ぎ目なしの複数パラグラフ音声のトランスクリプション、アノテーションをサポートします。
音声に含まれるスピーカーの感情情報に対してポジティブ、ネガティブのアノテーションを行います。
画像、映像、点群、テキストのテータアノテーションニーズを全面的に網羅。内蔵のヒューマン・マシン・インタラクティブ半自動アノテーションと品質検査により、1人あたりのアノテーション効率が30%以上向上します。
10.1 Hours - Chinese Mandarin Synthesis Corpus-Female, Customer Service
26.1 Hours - Chinese Mandarin Synthesis Corpus-Female, Customer Service
20.1 Hours - Chinese Mandarin Synthesis Corpus-Male, Customer Service
12.6 Hours Chinese Mandarin Speech Synthesis Corpus - Male, Audiobook
10.4 Hours - Chinese Mandarin Synthesis Corpus-Female, Customer Service
50 People - Chinese-English Mixed Average Tone Speech Synthesis Corpus-Customer Service
150 People - Chinese Mandarin Average Tone Speech Synthesis Corpus-Customer Service
90,000 sets – Multi-domain Customer Service Dialogue Text Data
お客様は、既存のスマートカスタマーサービス音声認識技術の認識率向上に向けた、広東語音声データのアノテーション実施のご依頼。Datatangは1000時間の広東語カスタマーサービス音声データのアノテーションを実施。文単位の精度95%を達成し、広東語で使われる文字の一致性についての問題を解決するため、統一的な広東語発音辞典を構築しました。このデータを使用して広東省の音声認識機能をスピーディーに構築し、スマートカスタマーサービスを広東語圏に対応できるようにしました。
ゼロベースからのスマートカスタマーサービス音声識別技術の開発をご希望。Datatangはお客様のシーンを整理することにより、5000時間の強い訛り、自然対話などの製品音声データセットと、1000時間の特定シーン音声アノテーションデータからなる体系化されたテータソリューションを提供。お客様が1カ月以内にゼロからスマートカスタマーサービスをオンライン運用できるようサポートしました。
お客様はアプリのカスタマーサービスのナレッジバンクを最適化してサービスの質を向上することをご希望。Datatangはお客様の業務を十分に把握した上で、お客様の新たなナレッジポイントの拡充と最適化を実施するとともに、整理が完了したナレッジに基づいて類似の質問の削除や追加、最適化を行いました。約23万件のナレッジポイントの編集し、各ナレッジポイントについて、少なくとも30件の類似質問を拡充。お客様の受入検査に合格しました。
豊富な製品データセット、パーソナライズされたデータカスタマイズサービス、インテリジェントなデータアノテーション補助ツールにより、AIデータの難題をワンストップで解決します。
インテリジェントなセルフチェック、複数段階の品質検査などのプロセスを経て、より高品質なデータを提供します。また、ISO9001品質マネジメント認証を取得しています。
成熟した30種類のアノテーションツールは、音声、画像、動画、3D点群、テキストデータアノテーションのニーズを網羅しています。
ISO27001/ISO27701情報セキュリティおよびプライバシー保護認証を取得。個人情報保護法およびGDPRなどを遵守しています。
AIによる事前識別補助機能を使用して、ヒューマン・マシン・インタラクティブ半自動アノテーションを実現。1人あたりのアノテーション効率が30%以上向上できます。