
はじめに
データ分析を始めてみたい人、データサイエンティストになりたい人、それらを独学でやろうと考えている方、必見です。
また、学習方法について、何から又どこから始めればよいのか、さらに、どのくらいやればよいか、悩んでいる方も是非ご覧ください。
その悩みを解決すべく、簡単3ステップのロードマップを作成しました。
私もこのステップで学んできましたので、是非参考になれば幸いです。
学習方法
まずは、データ分析の基本をつかむ学習方法としては、この3つがあります。
・動画で学ぶ
・書籍/ネット上のテキストで学ぶ
・データサイエンティストコンペに参加する
独学で学ぶ方法やデータ分析に関係する資格等について詳しく知りたい方は、以下のブログ記事をご覧ください。
>>【独学】初心者・初学者にデータ分析・プログラミングの勉強法としてオススメの3選!!
それぞれのメリットや学習方法等について詳しく知りたい方は、ステップとあわせてこの記事の中で紹介していきます。
それでは、これらの学習方法をもとにロードマップをみてみましょう!
ステップ1 まずは、動画から!
【何から】
はじめは、動画をオススメします!
理由は、動画が一番わかりやすいからです。そして、何よりも動画はとっつきやすいです。
実際に画面でコードを動かす場面をみたり、データ分析の基本を動画で学ぶことで、理解がほかの学習方法に比べて早く感じます。
しかも、動画のよいところは、わからない又やる気がないときでも、動画をぼーとみているだけでも勉強になります。
【どこから】
まずは、pythonのプログラミングを学びましょう!
プログラミングを学んだ次は、pythonのライブラリーを学びましょう。それ用いて、どのようにデータ分析に生かせるかを学びましょう。
誰でも最初はチンプンカンプンです。
でもそれでいいです!気にせず、ひたすら動画をみながら写経しましょう。繰り返しやることでコードを覚えることができます。
この写経ですが、最初はなんだかわからなくてもとりあえず手を動かすことで、確実に身に付きます。
【どれくらい】
1か月~2か月の学習期間を想定しましょう。
最初の1か月はpythonのプログラミングの基本を学び、その後の1か月でデータ分析の問題を動画をみながら一緒に解いていきましょう。
動画で学ぶ方法について詳しく知りたい方は、以下のブログ記事をご覧ください。
【オススメ】データサイエンス・データ分析の基本を学べる動画をまとめました(Python)
ステップ2 書籍やネット上の練習問題を解こう!
【何から】
動画のあとの次のステップは、書籍やネット上の練習問題でプログラミングやデータ分析を学んでいきましょう。
ここでやることは、動画で学んだことの復習と練習です。
書籍やネット上の練習問題のいいところは数が多いところです。豊富にあるので、自分にあったものを見つけて、解いていきましょう。
動画の時と同じことになりますが、繰り返し解くことで、基礎的な力が着実に身につきます。
【どこから】
pythonのライブラリーを用いたデータ前処理のやり方を徹底的に学びましょう。
データの前処理を学んだあとは、モデルを作成して、予測するところまで進みましょう。
回帰分析や二値・多値分類の問題は、初学者でもイメージがわきやすいので、そこからはじめましょう!
ここでも、まだまだわからないことはたくさんあるかと思います。
それでも気にせず、ひたすら練習問題を解いていきましょう。
続けていくことが大事です。
【どれくらい】
2か月~4か月の学習期間を想定しましょう。
pythonのプログラミングについては1か月~2か月、回帰分析やニ値・多値分類の問題のデータ分析は2か月ぐらいやってみましょう。
どの本から勉強してよいか悩んでいる方は、オススメの本をまとめている以下のブログ記事をご覧ください。
>>【レベル別オススメ】データサイエンス・データ分析の本まとめ(Python)
無料公開されているデータ分析の練習テキストは以下のブログ記事を参考にしてください。
>>【Google Colabはじめ方】データサイエンス100本ノックーデータサイエンティスト協会
ステップ3 データサイエンティストコンペに参加しよう!
【何から】
ステップ2まで終了すると、もっとデータに触りたくなるかと思います。また、より実務に近いデータがどんなものだろうかと気になってもきます。
そうなったら、実践的な問題に挑戦してみましょう!
データサイエンティストのコンペティションには、実務にいきるようなデータやモデルがたくさんあります。
コンペに参加することで、実際のデータ分析とはどのようなものかを疑似的に体験できます。
【どこから】
データサイエンティストのコンペは、Kaggle(アメリカ)、Nishika(日本)、SIGNATE(日本)というプラットフォームで実施されています。
その中から、まずは、入門のコンペに参加してみましょう!
世界最大規模のコンペであるKaggleには、入門用のコンペがたくさんあるので、さっそく参加してみてください。
【どれくらい】
2か月~3か月ぐらいの期間、コンペに参加してみましょう。
データ分析のコンペティションで実践しながら学びたい方は以下のブログ記事を参考にしてください。
>>【始め方】Kaggleデータサイエンス(データ分析)コンペ入門~選んだ理由や日本語対応等
>>【Kaggle入門】 Titanicの次に何をやるか!?House Prices
まとめ
早い人は半年でここまでこれます。時間がかかったとしても1年あればステップ3まで十分これます。
その後は、ステップ3を中心に、ステップ1とステップ2をもう1週やってみましょう。
最初は写経だけしていたのが、自然とコードを覚えてきたり、モデルの理解もさらに進んできます。
画像認識や自然言語処理のコンペにも挑戦してみてみましょう。
以上、簡単3ステップでデータ分析の基本をつかむ学習方法です。