
はじめに
「データ分析を始めてみたい!」「データサイエンティストになりたい!」と思った方、本でいろいろと勉強したいと思った方、こちらの本を片手に勉強することはかなりオススメです!
以下では、「東京大学のデータサイエンティスト育成講座ーPythonで手を動かして学ぶデータ分析」に興味がある方に向けて、誰もが気になる「対象読者は誰?」「どんな内容なの?」ということに対して、的確に答えています。
購入の参考になれば幸いです。
総評
本書籍は、2017年と2018年に東京大学で実施された「グローバル消費インテリジェンス寄付講座」の学生向けのオフライン講義と、社会人向けのオンライン講座で使われた教材がベースになっています。
・対象読者はPython初学者やデータ分析の初任者・初級者です。
・Pythonの基礎やライブラリー(Numpy、Pandas、Matplotlib)の基礎を丁寧に解説
・データサイエンティストとして必要な知識である統計や確率の基礎知識もわかりやすく説明
・データの前処理・データの加工を行うためのPandasの使用方法も多くの事例をもとに解説。さらに、データの可視化のためのMatplotlibの利用方法も説明。
・機械学習の基礎も学べる。教師あり学習では、重回帰分析、ロジスティク回帰、ラッソ回帰、リッジ回帰、決定木、K近傍法、SVMを紹介。教師なし学習では、クラスタリング・K-means、主成分分析、マーケットバスケット分析等多くの方法をわかりやすく学べる。
・モデルの検証方法としてホールドアウト法や交差検証法、モデルのハイパーパラメータのチューニング方法、モデルの評価指標やアンサンブル学習も一つの章を設けて説明
・サンプルコードもあるので、好きな時間に自分の感覚とスピードでデータ分析が学べる
・練習問題もあり。そのほかに、総合演習問題が6問ある。
なお、本書は実行環境としてAnacondaを紹介し、サンプルファイルはJupyterNotebook形式です。google colaboratoryで動かしたい方はこちらのブログ記事を参考にしてください。
本書の使い方
実は、GCIデータサイエンティスト育成講座演習コンテンツの公開ページでコンテンツを無償公開しているとのことで、ダウンロードしたいと思っておりましたが、ずっと準備中のまま変わらないので、本書を購入しました。
この本は索引がすばらしいので、私は辞書として使用しています。
Kaggleをやるときに、コードがわからなくなったときとか、公開されているコードの中身でこれってなんだっけかなと忘れたときとか、評価関数やモデルでわからないものがあるときに索引で検索して、学んでいます。
以上のように、本書は、Python初学者やデータ分析の初任者・初級者に必要な要素がフルに入っています。
初心者・初学者に必要な基礎や要素を一気に手に入れたい方は、是非ご購読ください。
Pythonでデータ分析を学びたい方へ
Pythonでデータ分析を学びたい方向けのブログ記事をまとめていますので、ご興味ありましたらご覧ください。
データサイエンスに興味がある人、データサイエンティストになりたい人、データ分析をはじめてみたい人向けに、学習レベル別にオススメの書籍を紹介しています。
>>【レベル別】データサイエンス・データ分析の本まとめ(Python)
自信をもってオススメできる厳選動画をまとめてみました!!
>>【オススメ】データサイエンス・データ分析を学べる動画をまとめました(Python)
独学でデータ分析を学ぶにはどうしたらいいかについてもまとめていますのでこちらもご覧ください。
>>【独学】プログラミングとデータ分析(勉強法・資格・本・動画・テキスト)