〈2日間開催〉【AIデータエンジニアリング実務・基礎編】 KaggleMasterによるPython機械学習・アルゴリズム・ワークショップ

受講区分 会場
開催日時 1日目 2020-02-03(月) 9:15~16:15
2日目 2020-02-17(月) 9:15~16:15
講師 佐野 遼太郎 氏
Kaggle Master

2015年4月よりコンサルタントとして金融機関を中心としたデータ分析・モデル構築業務に従事 18年2月にKaggler枠で株式会社ディー・エヌ・エーに入社、現在に至る また、16年から社外データ分析講座講師として300人を超えるデータ分析技術者の人材育成に関わっている
※この講座は所属企業や所属団体とは一切関係ありません

開催地 カンファレンスルーム(株式会社セミナーインフォ内)
概要 この講座では短時間で知識を詰め込むのでなく、実際に業務で使うデータ分析技術について四苦八苦しながら学びます。第1回と第2回の間には各自プライベートの時間を削って宿題を行うことを想定としています
さらに第2回の終了後もプライベートの時間を削って復習することを想定しています。手を動かしてデータ分析を学びたい方、数式にアレルギーがない方、必見です。

この講座で得られること
・データを見る力(泥臭いデータ分析力)
・決定木、ロジスティック回帰の得手不得手の理解と、実装
・過学習を防いでのパラメータチューニング
・リークについて
・予測モデルのビジネス応用時の注意点
・特徴量作成
・データの可視化
詳細 【第1日目】
株式会社SIGNATE様(国内コンペサイト)の練習問題を用いて、実際にコンペに取り組みながら予測モデルの作成と改良、リークとビジネス応用時の注意点について学んでいきます。
扱う問題は2値分類です。
※株式会社SIGNATE様には、営利目的でのコンペ利用許可を得ています

1.モデルの精度評価
(1)ROC曲線とAUC

2.データを眺める
(1)Pandas、Seabornによるデータの眺め方
(2)演習

3.決定木
(1)決定木の概要
(2)決定木の得手不得手
(3)演習
(4)初サブミット(投稿)

4.過学習
(1)過学習について
(2)ホールドアウト法
(3)クロスバリデーション法
(4)演習

5.質疑応答 
※ 録音、ビデオ・写真撮影はご遠慮ください
※ 質疑応答は適宜設けます

【第2日目】
株式会社SIGNATE様(国内コンペサイト)の練習問題を用いて、実際にコンペに取り組みながら予測モデルの作成と改良、リークとビジネス応用時の注意点について学んでいきます。
扱う問題は2値分類です。
※株式会社SIGNATE様には、営利目的でのコンペ利用許可を得ています

1.ロジスティック回帰
(1)ロジスティック回帰の概要
(2)線形モデルに対する変数加工
(3)ロジスティック回帰の得手不得手
(4)演習
(5)サブミット(投稿)

2.アンサンブル学習(平均のみ)
(1)平均によるアンサンブル学習
(2)サブミット(投稿)

3.まとめ
(1)演習(精度向上への取り組み)
(2)講座参加者が、各自の取り組みについて発表

4.リークとビジネス応用での注意点
(1)リークについて
(2)ビジネス応用での注意点
(3)ROC曲線の使い方

5.復習
(1)疑問点の解消と演習(総復習と精度向上)

6.質疑応答
※ 録音、ビデオ・写真撮影はご遠慮ください
※ 質疑応答は適宜設けます
お問合わせ 株式会社セミナーインフォ  セミナー運営事務局
TEL : 03-3239-6544   FAX : 03-3239-6545   E-mail : customer@seminar-info.jp