【会場受講】第1回【データサイエンス実務入門】Python導入からはじめる!ビジネスデータ分析・スクレイピング・テキストマイニング

~可視化で体感しながら統計処理、WEBデータの自動収集技術を学ぶ~
受講区分 会場
開催日時 2020-07-16(木) 9:30~16:30
講師 セカンドサイト株式会社
高山 博和 氏 代表取締役CEO 兼 CAO
奥澤 創一郎 氏 マネジャー

【高山 博和 氏】
京都大学大学院卒業後、大手コンサルティングファームに入社し、2012年株式会社グリフィン・ストラテジック・パートナーズに参画、2016年セカンドサイト株式会社を設立し、取締役COO(最高執行責任者)/CAO(最高分析責任者)を経て現職に就任 経営計画策定、事業企画、営業改革等のコンサルティング案件や金融のリスク管理やマーケティング等のアナリティクス案件に従事し、当社では、主にアナリティクス技術を活用したクライアントの課題解決支援や機械学習モデルの構築・導入支援業務を推進

【奥澤 創一郎 氏】
外資系コンサルティング会社にて約10年間、金融業・流通業を中心として、データ活用のコンサルティング、BI/DWHに関するシステム構築の案件を多数経験 セカンドサイト入社後は、アナリティクス案件でデータ分析・モデル構築に従事

開催地 カンファレンスルーム(株式会社セミナーインフォ内)
概要 本セミナーはデータサイエンス実務の基礎スキルである、Pythonプログラミングを中心に取り扱い、データ分析の実務者を担うための第1ステップとなることを目的とします。

機械学習やデータ分析、統計処理やWEBデータの自動収集技術など、データサイエンス実務を習得するには、まずはPython導入から始めるのが効果的かつ効率的です。特別な環境構築が不要なGoogle Colaboratory(※)を利用し、いきなりデータサイエンス実務の入門トレーニングに入れます。(※Google Colaboratoryは機械学習・データ分析の自動化とその効率化を主目的に開発されたツールです。本セミナーでは主にJupyter Notebook環境を使います。)
担当講師はこれまでアナリティクス技術を活用した金融のマーケティング、リスク管理等の案件に従事し、機械学習モデルの構築・導入支援業務を推進しています。

本セミナーでは各種ライブラリを使ったデータ操作方法の他、WEBデータの自動収集技術であるスクレイピングや、テキストマイニング等、データ分析における定番作業を題材に、統計処理含めデモ・演習を交えて体験しながら学んでいただきます。
特別な環境構築が不要なGoogle Colaboratoryを利用し、AI/機械学習、データサイエンスの分野において主流となりつつあるPythonについて、ゼロから学ぶことができるため、Pythonにとりあえず触れてみたいと思っている方や、ビジネスで利用されるデータ分析技術の基礎を学びたい方におすすめです。
どの問題設定に取り組む際にもまず、Pythonを用いてのデータの可視化を行い、データを理解することから始めます。「視覚化デモ→演習→基礎理論学習」のサイクルを繰り返すことにより、「体感できた」「使えた」だけで終わることなく「腹落ち」して理解するレベルまでもっていくことができます。この中に「どのようにアプローチすべきか」という観点が入るため、技術だけでなくデータ分析実務上の問題に対する思考プロセスも理解することができます。
また、本セミナーで修得した技術・知識は更に高度な機械学習やディープラーニング技術修得の際の最重要な基礎になります。

初学者でも安心して、データ分析やAIの基礎からディープラーニング・プログラミングまで実務で活きるポイントをレベル順に体系的に学べます。このような様々な演習ドリブンな学習スタイルを取り入れることで、自力で多くの試行錯誤を重ねることができ受講後の自走力が身につきます。
全3回の本コースでは最初の一歩がなかなか踏み出せない方に有効な手助けになるよう配慮をしていきます。各種実データ、実事例等を使って、可能な限り有益な事例紹介・問題演習を提供しますので、ぜひご受講をご検討ください!

■-------------------------------------------------------------■
このセミナーで得られること
・Google Colaboratory(Jupyter Notebook)、Pythonの導入
・Python文法基礎とデータ処理ライブラリの導入
・ハンドリング・クレンジング・スクレイピング・テキストマイニングの基礎
・データサイエンス実務に必要な最低限の統計処理入門
・データ可視化によるデータサイエンスの基礎的理解
■-------------------------------------------------------------■
本講座の受講に必要な前提知識
本セミナーを受講するにあたり、データ分析やWEBデータ処理、統計処理やPythonについての事前知識は不要ですが、ExcelやBIツール等での基本的なデータ処理操作(表計算や図を挿入してのデータ処理・グラフ化程度)の経験がある方を対象としています。
■-------------------------------------------------------------■
セミナー難易度チャート *以下のような方を対象としています*
データ分析:★★☆☆☆(学習経験あり)
統計処理・プログラミング:★☆☆☆☆(未経験者OK)
機械学習:★☆☆☆☆(未経験者OK)
ビジネス力:★☆☆☆☆(実務未経験者OK)
※必ずしもチャートに該当せずともご受講いただけます。目安としてご参照ください。
詳細 1.Python入門
(1)Google Colaboratory(Jupyter Notebook)の基本操作
(2)Pythonプログラミング入門
(3)Pythonライブラリ導入
   Numpy、pandas、Matplotlib、scikit-learnなど
(4)デモ:単回帰分析

2.定番作業で事例演習しながら学ぶPythonプログラミング基礎
(1)データハンドリング・グラフ描画
 (a)Numpyで数値計算
 (b)Pandasによるデータベース操作
 (c)Matplotlibでグラフ描画
(2)スクレイピング
(3)テキストマイニング

3.定番作業で事例演習しながら学ぶデータ分析・統計処理入門
(1)背景にある統計処理の考え方・使い方
 (a)「モデル」を決める
 (b)「損失関数」を決める
 (c)損失関数を「最小化」する
(2)単回帰分析の実装
 (a)実データに対する分析の実装
(3)重回帰分析の実装
 (a)パラメータの導出
 (b)実データで演習
(4)統計処理
 (a)主な統計量
 (b)正規分布と3σ法
 (c)スケーリング
(5)外れ値を考慮した実装 ・外れ値除去
 (a)モデル構築
 (b)スケーリングとパラメータの確認

4.機械学習超入門デモ(次回の予習)
(1)事例でデータ可視化/データ理解
(2)事例で決定木デモ
(3)事例でロジスティック回帰デモ

5.質疑応答 ※ 録音、ビデオ・写真撮影等はご遠慮ください
お問合わせ 株式会社セミナーインフォ  セミナー運営事務局
TEL : 03-3239-6544   FAX : 03-3239-6545   E-mail : customer@seminar-info.jp