SpeechFoundry 音声認識
SpeechFoundry™ はINFERRETの商用音声ソフトウエアのブランドネームです。
お客様が必要とする音声処理のすべてがここにあります。
これは本当のエンドツーエンドのソリューションです。
優れた機能、比べるものがない正確さ、高性能の音声認識で、SpeechFoundry はどんな仕事でもどんな環境でも働きます。
- SpeechFoundryは、高い正確さ、自然言語理解、対話モデリング、wake-upワードを提供し、皆様の製品の話す楽しみを作り、より多くの特徴をサポートします。
- 極小から超速まで、SpeechFoundryは多くの環境で実行します。
Raspberry PiのZero, 2B, 3B,iOS,Androidの組込み型プラットフォーム,Windows Surface
- Linux, iOS, Android,PC Flash用のクライアントSDKを開発
- お客様はハイブリッドを必要としません。
SpeechFoundryは、組込み型とC/S型とも同じ音声認識エンジンの環境で実行します。
この特徴は、世界のなかでも唯一の商用音声ソリューションです。
より速く、より柔軟に、よりスケーラブルに、より安く、ここを見てください!
- お客様が必要とする音声アプリケーションを構築するために、SpeechFoundryのモジュラーコンポーネントを選んでください:
- 音声コントロール: 音声でデバイスやアプリのコントロールをするために
- 音声検索/ 音声アシスタント: 音声によるリクエストでデータベースやオンラインコンテンツから情報を検索するために
- 音声書きおこし: 音声やビデオファイルから簡単に検索できるテキストに変換するために
- SpeechFoundry は、英語、日本語、中国語など現在 世界で主要な9つの言語 をサポートします。
また、お客様が必要とする言語を追加する合理的な開発プランを提供します。
- すべての音声製品は、お客様の要求、環境の限界に適合するため、カスタマイズする必要があります。
ブラウザベースの開発環境で、お客様がカスタマイズすることができます。
また、経験豊かな専門のサービスチームがお客様のために カスタマイズを行います。
私たちはお客様が構築するソリューションを助けることをお約束します。
- 音声に関する 追加コンポーネントとして音声合成 (TTS)、 対話制御、コンテクスト・マネージメント、 個人認証 (NER)、 大規模な固有名詞のリストなどがあります。
ユーザーエクスペリエンス
- 騒音環境での高い認識SpeechFoundryは、雑音が多い環境(例えば自動車またはレストランのようなうるさい環境でも低いSNRレベルのため)においても、高い正確さを実現します。
- 自然言語理解 (NLU)あなたのユーザーとの会話を不自然な人工的機械命令に制限されることなく、相手と人に話すように会話することができます。
- 大規模語彙をサポート1,000,000以上の異なる単語の巨大な言語モデルを、組込型とC/S型の環境で使用できます。
- Wake-up ワード常に聞き取りモードにより、ユーザーがキーワードを発声することでシステムを起動させることができます。
「こんにちは、ハル9000。」のように
- Barge-in
ユーザーは、いつでも話し始めることにより、長々しいダイアログを中断することができます。
- あいまいで部分的なマッチング名前の一部をいうことで、長い名称を識別します。電話帳でのフルネーム、曲名またはお店やレストランの長い名前などにうまく働きます。
- Footprint限られた構造のカスタマイズされたソリューションによって、正確さと速度に関してユーザーエクスペリエンスを最適化します。
- 会話と文脈多段階会話と前の会話の文脈上の知識を保持することにより、人のコミュニケーションをモデル化します。
- 話者適合私たちのモデルは時間とともにメインユーザーのはっきりした音声と発音に慣れます。そして、さらにより高い精度になります。
- 話者認識声は指紋と同じくらいユニークです ― システムで特定のユーザーを識別するために話者IDを使えます。
音声コントロール
あなたの家ですべての機器に対し、ボタンを押したりスクリーンにタッチするのを想像してみてください。
あなたが必要なことは、何を望むか自分の声で執事に話すことです。
「ライト」というと、リビングルームでライトのスイッチが入り、「ここはとても暑い」というとエアコンが運転開始します。
音声コントロールは特定の状況に合わせ、いろいろな表現を理解する必要があります。(自然言語理解)
家や車など特定の音響環境に合わせ、カスタマイズする必要があります。私ども経験豊かなプロに、あなたの声の執事をカスタマイズするのを手伝わせてください。
音声検索/音声アシスタント
音声検索は、文字を入力するかタイプする必要がある時に、声で情報を簡単に検索することができます。
例えば、ニューヨークで現在の天気を知りたい時、東京の新宿でスターバックスのコーヒーハウスの場所を探す時などです。
音声検索は、数千あるはそれ以上の適当な名詞の認識に対し、それらのデータベースの正確な特徴に焦点をあわせます。
音声書きおこし
高速のテキスト変換とオプションの手作業によるチェック、編集により、膨大な量の音声データを高精度に書きおこしできます。
音声またはビデオファイルをアップロードし、電子メールを受け取るのをお待ちください。
書きおこし結果を確認するため、テキストから音声の関連した箇所にジャンプして再生してください。
音響モニタリングツール
どのような音に問題がありますか?
私たちのツールはこの質問に文字通り答えます。
それらが作っている特徴的な音のパターンにより、プロセスまたはプロダクトの問題とバグを識別します。
現場の環境の音を継続して聞くことにより、異常音のパターンを発見するとすぐにあなたに警告を発することができます。
例えば、風力タービンのローターの音をモニタリングして、ローター音のパターンが変化するとき、離れていても不規則な動きを発見します。
また、セキュリティアラームシステムを持ち、自宅の外で変化する音を聞いてみてください。
工場に集められる製品のゆるんだパーツの振動を聞いてみてください。
視覚あるいは触覚によりこれらをモニタリングすることは、しばしば精度が低くほとんどの場合、労働集約型です。
あなたの問題がどのように鳴り響くかについて、突き止めましょう!