言語国際学会(PACLIC 2023)で自動プレゼンシステム「AimeTalk」の研究成果を発表
投稿日 : 2024/01/26
第37回アジア太平洋言語情報処理に関する国際会議(PACLIC 2023) が2023年12月2〜5日に香港で開催され、弊社のマルチモーダルAIラボのトップであるDr.ファム・クアン・ニャット・ミンが、自動プレゼンテーションシステム「AimeTalk」の研究成果の発表を行いました。
アイメソフトのマルチモーダルAIラボのトップを務めるDr.ファム・クアン・ニャット・ミンは、『プレゼンテーションスライドからの自動文章生成(スライドの内容から自動でスピーカーノートを生成)』の研究成果について発表を行い、弊社が開発したバーチャルプレゼンターソフトウェアの「AimeTalk」(アイメトーク)を使ったデモを実施しました。
AimesoftマルチモーダルAIラボ トップ : Dr.ファム・クアン・ニャット・ミン @ PACLIC2023
AimeTalk(アイメトーク)は、マルチモーダルAIを基盤とした自動スライドプレゼンテーションソフトウェアです。このソフトウェアは、スライドプレゼンテーションのタスクを自動化します。
オフライン会議、オンラインミーティング、またはセミナーであなたの代わりにスライドプレゼンテーションを行うことができます。
労働コストを削減し、スライドショーでのエラーを減少させることができます。
また、写真一枚から自分の好きなバーチャルアバター(顔のアニメーション)を作成しプレゼンさせることができます。
AimeTalkは、人工知能(AI)とロボティックプロセスオートメーション(RPA)技術をスライドプレゼンテーションに取り入れています。
バーチャルアバターが、スピーカーノートを読み上げ、スライドを遷移させ、動画を再生するなど、スライドプレゼンテーションプロセスを自動化します。
スピーカーノートはテキスト読み上げ技術によって読み上げられ、一方で顔のアニメーションは高度な画像処理とコンピュータビジョン技術によって合成されます。さらに、スライドページはRPA技術によって自動的にめくられます。
ただし、AimeTalkを使用してスライドを表示する前に、ユーザーは各スライドページの説明用の読み上げテキストを手動で入力する必要があります。
この作業は、時に非常に時間がかかることがあり、重複するコンテンツが数ページにわたる長いプレゼンテーションが必要となります。
Aimesoftの研究チームは、これらのスピーカーノートを大規模言語モデル(LLM)を基にスライドの内容から自動的に生成する方法を提案しました。
これにより、手動プロセスにかかる時間が短縮され、AimeTalkの自動化が向上します。
チームの研究は、自然言語処理の分野でスライドコンテンツからスピーカーノートを生成する方法に関する初めてのものとなります。この研究により、スライドプレゼンテーションの完全な自動化の可能性が開かれました。
言語生成モデルは、ページ上に簡潔なコンテンツやタイトル/見出しだけがある場合でも、現在のスライドページのコンテキストに基づいて完全な文章を自動的に合成および認識します。
Aimesoftの研究チームは、継続してこの研究を続け、将来的にプレゼンスライドコンテンツからの自動スピーカーノートの生成を実現し、弊社の自動プレゼンテーションシステム、AimeTalk(アイメトーク)に実装いたします。
現時点では、ユーザーが自らスピーカーノートに読み上げる内容を入力する必要がありますが、ぜひ一度、AimeTalkをお使いいただき自動プレゼンテーションを体感してみてください。無料トライアル実施中です。
無料トライアルは、こちらのAimeTalkのページよりお申し込みいただけます。
Copyright © 2024 Aimesoft. All Rights Reserved.