こんにちは、おかてんです。
今回は僕がUdemyで受講した講座についてご紹介します。受講した講座は「ビジネスケースで学ぶPythonデータサイエンス入門」で、ビジネスで使えるデータ分析の基礎を学ぼうという講座です。
上記の目的以外にもこの講座をオススメするのはこのような人です。
- データの可視化や分析をしたいが、何していいかわからない人
- Pythonの基礎を学んだが、次に何していいかわからない人
- データサイエンスのコンペを体験してみたい人
超初心者というよりは初心者向けですね。
一応、環境構築とかは説明してくれますが、プログラミング(Pythonではなくても)に触れたことのある方が良いかなと思いました。
まずは概要から説明します。
概要
全体の流れとしてはこんな感じです。
- 環境構築
- データの可視化・分析の基本を学ぶ
- データの可視化・分析の応用を学ぶ
実際の講座ではもう少し細かくセクションが分かれていますが大きく分けたらこんな感じですね。
3. の応用を学ぶ時はデータサイエンスのコンペを題材として実習します。題材が2つ用意されているので、違うパターンのデータを分析することでより実践的に学ぶことができます。
この講座ではデータ分析する前に「データ」をどのように扱うのか?を大事にしていると感じました。
最近流行りの機械学習やディープラーニングの使い方を覚えれば、良い分析なんか簡単にできるんじゃないのかと思っていましたが、大きな間違いでした。
まずは「データ」の基礎分析から入ることが何より重要だということですね。世の中にあるリアルデータって全然整備されていません。その状態で、どんな高精度な機械学習のアルゴリズムを使っても目的に近づくことは難しいでしょう。この講座ではそうならないようにデータの基礎分析を重視しています。
また、データの取り扱い方は難しい数学などは出てきません。基本的には「データから何を読み取りたいか?」という計画を立て、それに対してPythonの分析コマンドを覚え、それらを組み合わせることでできます。
データサイエンスというと数学の強い理系しかできないというイメージがありますが、実は難しい知識は必要ないので、あまり構えずに学んだ方が良いですね。
良かった点
続いては実際にこの講座を受けてみて良かったなと思った点をご紹介します。
講座の流れがわかりやすい
この講座は動画の流れがわかりやすく、内容がすんなり入ってきました。
各セクションでは以下のような流れで学習を進めます。
スライドによる概念の説明
↓
講師が解説しながら実習
↓
自分だけで取り組む実習
まずはスライドで今から何をしようとしているのか?について大まかな流れを説明してくれます。
スライドも図を交えながらの説明なので見やすかったですね。
次にそれに対して、講師の方の解説とともにプログラミング実習を進めていきます。
スライドで流れを説明しているので、自分は何を作っているのか?ということがわかりやすいです。なので、データ分析のスキルを身につけていることを実感しやすいので、勉強中に挫折することも少ないかと思います。
最後は自分だけでプログラミング実習に取り組みます。一通り学んだことに+αで自分の考えを付け加えることで実習を進めます。
「自分で考えて書く」というプログラミングスキルを身につける上で一番大事なことを実践することができます。
データサイエンスのコンペに触れることができる
この講座ではSignateというデータサイエンスのコンペを教材として扱っています。
なので、実習とはいえ自分でプログラミングした結果を実際にコンペに投稿してどのくらいのレベルなのかを体験することができます。
これは結構大きいですね。
自分の手で何かを作るということはプログラミングを習得する上で非常に大切です。プログラミングはどれだけ勉強しても手を動かして実際に書かないと身につきません。ただ、それをわかっていてもいざ作ろうとなると何を作ったらいいかわからないことも多々あります。
その点、コンペなら与えられた題材に対して、良い結果を出力するという明確な目標があります。さらに結果を投稿することで、結果に対してランクなどのフィードバックもあるのでモチベーションも保ちやすいですね。
こんな感じで実行した結果の評価が見れて、ランキングなどもアップされます。
プログラミングで何かを作るというのにうってつけの教材だと思います。
さらにデータコンペで世界的に有名な者としてKaggleがありますがこれは全て英語なので、慣れていない人には取り組みにくいです。それに対してSIgnateは日本語なので、初心者でもすぐに取り組めるようになっています。
とりあえずプログラミングを書くことを大事にしている
セクションごとでスライドの説明が終われば、プログラミングを書いていることがほとんどです。プログラミングは習うより慣れろとよく言われていますが、まさにそれを体現している講座でした。
意味がよくわかってなくても、プログラミングを書き進めることをオススメします。書き進めるとデータが可視化されたり、結果が出てくることで、自然に理解できるようになります。
意味を理解してからしっかり書きたいという人もいるかもしれませんが、まずは書いて覚えることがいちばんの近道です。
さらに、同じ内容を反復する場面もあるので、覚えやすいですね。
講座では用意された実習用のプログラミングファイルがいくつか用意されています。
それらのファイルで共通して使用する書き方がいくつかあるので、何度も書くことでその書き方覚えることができます。
最後に
この講座はPythonを使ったデータ分析を身につけるには最適だと感じました。
特に以下の3つがポイントです。
- プログラミングを書くことでスキルが身につきやすい
- より実践的な題材で「作る」ことを体験できる
- 自分で考える時間もあるのでよりスキルが身につく
Pythonでデータ分析をしたい!Pythonで何か作って見たい!という人にはオススメの教材となっているので受けてみることをオススメします。