Top
AimeSpeech

AimeSpeech : 音声認識、音声合成、話者認識

 

AimeSpeech (アイメスピーチ)は、Aimenicornソフトウェアエコシステム内のコア音声処理フレームワークです。 AimeSpeechには、音声認識エンジン(Speech to Text、STTエンジン)、音声合成エンジン(Text to Speech、TTSエンジン)、話者識別ライブラリ、およびその他の音声処理ライブラリが含まれています。 AimeSpeechは、英語、日本語、ベトナム語、韓国語の4つの言語に対応しています。 オンプレミスおよびクラウド上で運用が可能です。 AimeSpeechは、AimeHotel、AimeReception、Aime AIShopなど、AimesoftのさまざまなマルチモーダルAI製品に適用されます。

 

下記のデモは、Webでの音声合成、音声認識のデモです。PC におけるGoogle Chromeで動作します(それ以外のブラウザでは動かないです)。AimeSpeech API/SDKはブラウザ・OSに依存なく、稼働できます。

 

音声合成デモ       音声認識デモ

coverproduct

AimeSpeechの優れた機能

  • content
    音声認識 (Speech-to-Text, STT)
  • content
    感情分析
  • content
    音声合成 (Text-to-Speech, TTS)
  • content
    話者識別
  • content
    音声特徴量からの評判分析
  • content
    英語、日本語、ベトナム語に対応
cover

AimeSpeechに搭載されたテクノロジー

AimeSpeechを実現するための技術

  • product
    音声認識技術
    DNN (Deep Neural Networks)、 LSTM、 GMM、 HMM、 音響モデリング, 言語モデル
  • product
    自然言語処理技術
    形態素解析、キーワード抽出、同義語・対義語検出、情報抽出、関係抽出、セマンティックサーチ、自然言語理解
  • product
    音声合成技術
    HMM, Festival, Kaldi, Tacotron2, DNN, Vocoder
  • product
    話者識別技術
    GMM, VGG network

AimeSpeechが選ばれる理由

我々AIMESOFTはマルチモーダルAIを導入したソリューションを提供しております

Onsei gōsei demo

Demo tổng hợp giọng nói

Copyright © 2024 Aimesoft. All Rights Reserved.