セミナー 印刷

AIを活用した音声認識技術と関連技術の展開

音声認識の基礎と要素技術から音声合成・声質変換・対話システムなど音声情報処理の応用を解説

受講可能な形式:【Live配信(アーカイブ配信付)】のみ
★アーカイブ配信のみでも受講可能です 

スマホや家電などに搭載され、日々の生活に活用されている音声認識技術
近年では
人工知能(AI)の導入による音声情報処理技術が進歩しています。

本セミナーは、
音声の基礎から、音声認識の要素技術AI活用による音声情報処理の最新技術や展開までも学べる内容です。

音声認識の高機能化へ向けて、改めて音声やAI技術、ディープラーニングについて理解を深めることができ、
音声合成・声質変換・歌声合成・感情認識・VR空間での対話システムなどの音声情報処理技術の応用に役立つ内容です。
ぜひこの機会にお役立てください。

【キーワード】AI,ディープラーニング,音声認識,音声情報処理,音声対話システム

このセミナーの受付は終了致しました。
日時 2024年12月6日(金)  13:00~16:30
受講料(税込)
各種割引特典
49,500円 ( E-Mail案内登録価格 46,970円 ) S&T会員登録とE-Mail案内登録特典について
定価:本体45,000円+税4,500円
E-Mail案内登録価格:本体42,700円+税4,270円
E-Mail案内登録なら、2名同時申込みで1名分無料 1名分無料適用条件
2名で49,500円 (2名ともE-Mail案内登録必須​/1名あたり定価半額の24,750円)
テレワーク応援キャンペーン(1名受講)【オンライン配信セミナー受講限定】
1名申込みの場合:受講料( 定価:37,400円/E-Mail案内登録価格 35,640円 )
 定価:本体34,000円+税3,400円
 E-Mail案内登録価格:本体32,400円+税3,240円
 ※1名様でオンライン配信セミナーを受講する場合、上記特別価格になります。
 ※お申込みフォームで【テレワーク応援キャンペーン】を選択のうえお申込みください。
 ※他の割引は併用できません。
配布資料製本テキスト(開催日の4、5日前に発送予定)
※開催まで4営業日~前日にお申込みの場合、
 セミナー資料の到着が開講日に間に合わない可能性がありますこと、ご了承下さい。
 Zoom上ではスライド資料は表示されますので、セミナー視聴には差し支えございません。
オンライン配信ZoomによるLive配信 ►受講方法・接続確認(申込み前に必ずご確認ください)

アーカイブ(見逃し)配信について
 視聴期間:終了翌営業日から7日間[12/9~12/15]
 ※開催直後のアーカイブ配信は、開催終了後にマイページでご案内する
  Zoomの録画視聴用リンクからご視聴いただきます、原則として編集は行いません。
備考※講義中の録音・撮影はご遠慮ください。
※開催日の概ね1週間前を目安に、最少催行人数に達していない場合、セミナーを中止することがございます。
得られる知識・音声に関する基礎知識                                                
・AI技術の概要                                                      
・AI技術を利用した音声認識やその他音声情報処理                             
・音声情報処理技術の応用
対象音声情報処理技術に基づく技術や製品を開発している方など。
細かな技術に対する専門知識は必要ないが、AIやディープラーニングについて多少の知識があるほうが理解しやすい。

セミナー講師

山形大学大学院 理工学研究科 教授 博士(情報科学) 小坂 哲夫 氏
【略歴】
 1986 東北大学大学院 工学研究科 情報工学専攻修了
 1986 キヤノン(株)中央研究所
 1991 (株)ATR自動翻訳電話研究所
 1994 マサチューセッツ工科大学 コンピュータサイエンス研究所
 1994 (株)ATR音声翻訳通信研究所
 1995 キヤノン(株)情報メディア研究所
 2002 山形大学工学部 情報科学科 助教授
 2012 山形大学大学院 理工学研究科 教授

【所属学会】IEEE/日本音響学会/電子情報通信学会/情報処理学会

【ご専門】音声情報処理/音楽情報処理/機械学習応用
【WebSite】https://speech-lab.yz.yamagata-u.ac.jp/

セミナー趣旨

 人間の音声をデータとして扱い、コンピュータで処理する技術を総称して音声情報処理と呼びます。人間の言葉を文字へ変換する音声認識、逆に文字を人間の音声に変換する音声合成など様々な技術が含まれます。以前は音声認識や合成は技術的に困難で、実用に十分耐えうるシステムの実現は困難でした。しかし、AI技術の進展で近年は様々な分野で使われるようになってきました。AIに基づく技術は2011年頃から盛んに検討されるようになりましたが、特に最近の技術の進展は目覚ましく、数年前と現在では一口にAIといっても、その中身には大きな違いがあります。
 本セミナーでは音声認識を中心に各種音声に関連する技術の紹介と、その応用について研究事例を紹介します。

セミナー講演内容

1.イントロダクション
 1.1 コンピュータと音声
 1.2 暮らしの中の音声情報処理技術

2.音声の基礎
 2.1 音声の性質
 2.2 音声の生成機構
 2.3 フォルマント
 2.4 音素の種類
 2.5 音声の特徴
 2.6 音声の知覚

3.音声認識の要素技術
 3.1 音声認識研究の歴史
 3.2 音声コーパス
 3.3 音声信号処理の基本
 3.4 音声認識の枠組み
 3.5 音響モデルと言語モデルによる音声認識
 3.6 ディープラーニング
 3.7 ハイブリッド型音響モデル
 3.8 大規模事前学習モデルによる音声認識

4.AIを利用した音声情報処理
 4.1 音声合成・声質変換
  4.1.1 音声合成
  4.1.2 声質変換
  4.1.3 感情音声合成
  4.1.4 歌声合成
 4.2 音声による感情認識
 4.3 音声対話システム
  4.3.1 音声対話システムの概要
  4.3.2 VR空間内エージェントとの対話システム
  4.3.3 マルチモーダル対話システム

(ただし,セミナーで取り上げる順序はこの限りではありません)
 
□質疑応答□