音声認識・音声対話・多言語翻訳のフュートレックは、人々のコミュニケーションをより快適にする様々な技術を提供します。

製品ラインナップ

vGate ASR音声認識システム

フュートレックの音声認識システムvGate ASR、vGate ASR2 powered by SpeechRecは、IoTやAIスピーカー、コミュニケーションロボットなど、多様化し拡大する音声認識活用を強力に支援します。
利用環境や用途に応じて、最適な音声認識システムを提供します。


vGate ASR:音声関連技術研究のパイオニアであるATR(株式会社国際電気通信基礎技術研究所)、NICT(国立研究開発法人情報通信研究機構)との、強固なパートナーシップを通じた共同研究及び要素技術を活用しています。

vGate ASR2 powered by SpeechRec:NTTテクノクロス株式会社の高精度音声認識ソフトウェア「SpeechRec」の最新版をベースとして開発した音声認識システムです。
「SpeechRec」には、NTTグループが提供するAI「corevo®」を構成する音声認識技術が搭載されています。

 

corevo

※ corevo®は日本電信電話株式会社の登録商標です。(http://www.ntt.co.jp/corevo/

サーバー型音声認識システム

端末機器とネットワーク接続されたバックエンドサーバーにて音声認識処理を実行することにより、大量の語彙を認識することができる高性能な音声認識システムです。

ローカル型音声認識システム

機器内に搭載可能な音声認識システムです。CPU能力に応じた語彙数のモデルを搭載して認識することができます。一般的にサーバー型音声認識システムより少ない語彙となりますが、通信環境の無いところでも認識可能なこと、ネットワーク遅延がない分レスポンスが早いなどの特徴があります。

サーバー型音声認識システムについて

システム構成


音声認識ミドルウェア  ・・・ 音声認識機能の制御を行うミドルウェア
音声認識エンジン  ・・・ 発話辞書・音響モデル・言語モデルをサーバーに持つ

特長

大量の語彙・モデルをサーバーに持つことが出来、文章の入力など高性能な認識が可能
認識させる語彙の追加などメンテナンスが容易

基本仕様

音声認識ミドルウエア
対応OS Android(4.0以上)、iOS(7以上)、Windows(Windows7以上)、Linux
対応CPU x86、x86_64、ARM(Cortex-A9以降)
必要メモリ RAM:6MB、ROM:7MB
 
音声認識エンジン
対応OS Linux(64bit)
対応CPU Intel Xeon E5 v2 / 2.6GHz 以上推奨
必要メモリ 4〜7GB(50〜100万語彙言語モデルの場合)
対応言語 日本語、英語、中国語(北京語)、韓国語、タイ語、インドネシア語

ローカル型音声認識システムについて

ソフトウェア構成

特長

通信不要で、利用場所の通信環境に依存せず認識が可能
機器内データなど数十〜数万程度の語彙・モデルによる定型文・単語・コマンド入力に最適

基本仕様

音声認識ミドルウエア
対応OS Android(4.0以上)、iOS(7以上)、Windows(Windows7以上)、Linux
対応CPU x86、x86_64、ARM(Cortex-A9以降)
必要メモリ RAM:6MB+α、ROM:7MB+α※1
※1 利用する言語モデルや動作モードによってRAM容量は変動
  認識語彙が100程度のGMMモデルの場合:α=RAM:120MB、ROM:3MB
  認識語彙が2万程度のDNNモデルの場合:α=RAM:200MB、ROM:40MB
製品に関するお問い合わせはこちら