セミナー 印刷

スモールデータ解析の方法と実問題解決への応用

~スモールデータの解析の実態とその方法論、データ収集の考え方~

受講可能な形式:【ライブ配信】or【アーカイブ配信】のみ
不特定多数の多量のデータでではなく、
 特定の専門データである「スモールデータ」の活用で生産現場などの実務・現実問題の解決を

少量のデータから統計モデルを構築したい方、現場でのデータ解析、データ収集についてお困りの方は是非
スモールデータの収集方法とその留意点、解析の実態とその手法選択、方法論
必要となるデータの質、データ収集の留意点、スモールデータ解析の手法選択
スモールなデータからいかにして知識を抽出するのか
機械学習の基礎知識、入力変数選択・異常検知手法などスモールデータに適したデータ解析手法、、、
このセミナーの受付は終了致しました。
日時 【ライブ配信】 2024年11月8日(金)  10:30~16:30
【アーカイブ配信】 2024年11月22日(金)  まで受付(視聴期間:11/22~12/5)
受講料(税込)
各種割引特典
55,000円 ( E-Mail案内登録価格 52,250円 ) S&T会員登録とE-Mail案内登録特典について
定価:本体50,000円+税5,000円
E-Mail案内登録価格:本体47,500円+税4,750円
E-Mail案内登録なら、2名同時申込みで1名分無料 1名分無料適用条件
2名で55,000円 (2名ともE-Mail案内登録必須​/1名あたり定価半額の27,500円)

 
テレワーク応援キャンペーン(1名受講)【オンライン配信セミナー受講限定】
1名申込みの場合:受講料( 定価:41,800円/E-mail案内登録価格 39,820円 )

 定価:本体38,000円+税3,800円
 E-Mail案内登録価格:本体36,200円+税3,620円
  ※1名様でオンライン配信セミナーを受講する場合、上記特別価格になります。
  ※お申込みフォームで【テレワーク応援キャンペーン】を選択のうえお申込みください。
  ※他の割引は併用できません。
配布資料PDFデータ(印刷可・編集不可)
※ライブ配信受講は開催2日前を目安にS&T会員のマイページよりダウンロード可となります。
※アーカイブ配信受講は配信開始日からダウンロード可となります。
オンライン配信ライブ配信(Zoom) ►受講方法・接続確認申込み前に必ずご確認ください
アーカイブ配信 ►受講方法・視聴環境確認申込み前に必ずご確認ください
備考※講義中の録音・撮影はご遠慮ください。
※開催日の概ね1週間前を目安に、最少催行人数に達していない場合、セミナーを中止することがございます。
得られる知識・機械学習の基礎知識
・入力変数選択・異常検知手法などスモールデータに適したデータ解析手法の習得
・スモールデータにおけるデータ収集の心構えの習得
対象・現実のデータの解析に興味のある技術者・研究者(線形代数・微積.統計などの初歩の知識を前提とする)
・少量のデータから統計モデルを構築したいと考えられている方
・現場でのデータ解析に従事されている方
・現場におけるデータ収集についてお困りの方
キーワード:スモールデータ解析、機械学習、不均衡データ解析、異常検出

セミナー講師

名古屋大学 工学研究科 物質プロセス工学専攻 准教授 博士(工学) 藤原 幸一 氏
【講師紹介】

セミナー趣旨

 生産現場の操業データや医療データにおいては、測定されている変数の数と比較して統計モデリングに使用可能なデータ量が限られることが多い。通常のモデリングでは正例・負例双方のサンプルが必要となるが、装置故障など稀な事象のデータはなかなか収集が困難であり、医療データにおいては、倫理的な問題から多くの患者から臨床データを収集するのは大きな壁が存在する。このように実世界ではしばしば必要なデータが十分に収集できず、スモールなデータからいかに知識を抽出するのかが重要となる。
 本セミナーでは、実例を通じ、スモールデータの解析の実態と、その方法論、データ収集の考え方を講義する。

セミナー講演内容

1.スモールデータとは
 1.1 スモールデータの特徴
 1.2 スモールデータ解析の現状

2.スモールデータ解析の方法論:次元削減と回帰分析
 2,1 主成分分析(PCA)
  2.1.1 PCAとは
  2.1.2 直交展開
  2.1.3 PCAの導出
  2.1.4 PCAと特異値分解
 2,2 最小二乗法
  2.2.1 回帰分析とは
  2.2.2 相関係数の意味
  2.2.3 最小二乗法の導出
  2.2.4 最小二乗法の幾何学的意味
  2.2.5 多重共線性の問題
 2.3 部分的最小二乗法(PLS)
  2.3.1 PLSとは
  2.3.2 潜在変数モデル
  2.3.3 PLSモデルの導出
  2.3.4 NIPALSアルゴリズム
  2.3.5 PLSから重回帰モデルへの変換
  2.3.6 クロスバリデーションによるパラメータチューニング

3.スモールデータ解析の方法論:入力変数選択
 3.1 入力変数選択とは
 3.2 スパースモデリング
  3.2.1 スパースとは
  3.2.2 リッジ回帰
  3.2.3 Lasso回帰
  3.2.4 エラスティックネットモデル
  3.2.5 Group Lasso
 3.3 変数クラスタリングによる入力変数選択
  3.3.1 スペクトラルクラスタリング
  3.3.2 NC法のコンセプト
  3.3.3 NCSCアルゴリズムの導出
  3.3.4 NCSCを用いた変数クラスタリングと入力変数選択
  3.3.5 製薬プロセスへの応用例

4.スモールデータ解析の方法論:不均衡データ解析
 4.1 サンプリング手法
  4.1.1 サンプリング手法とは
  4.1.2 アンダーサンプリングとオーバーサンプリング
 4.2 ブースティング
  4.2.1 ブースティングとは
  4.2.2 AdaBoost
  4.2.3 RandomForest
 4.3 ブースティングとサンプリング手法を組み合わせた不均衡データ解析
  4.3.1 何故,ブースティングとサンプリング手法を組み合わせるか
  4.3.2 RUSBoost
  4.3.3 HUSDOS-Boost
 4.4 不均衡データ解析の大規模検診データへの適用例

5.スモールデータ解析の方法論:異常検出
 5.1 異常検出とは
 5.2 多変量統計的プロセス管理(MSPC)
  5.2.1 MPSCとは
  5.2.2 T2統計量とQ統計量の幾何学的意味
 5.3 自己符号化器(オートエンコーダー)
 5.4 異常検出問題の医療データ解析への応用例

6.スモールデータの収集・解析の考え方
 6.1 必要となるデータの質の問題
 6.2 データ収集の際の留意点
 6.3 スモールデータ解析の手法選択

質疑応答