【書評】東京大学のデータサイエンティスト育成講座ーPythonで手を動かして学ぶデータ分析

※アフィリエイト広告を利用しています。

本

はじめに

「データ分析を始めてみたい!」「データサイエンティストになりたい!」と思った方、本でいろいろと勉強したいと思った方、こちらの本を片手に勉強することはかなりオススメです!

以下では、「東京大学のデータサイエンティスト育成講座ーPythonで手を動かして学ぶデータ分析」に興味がある方に向けて、誰もが気になる「対象読者は誰?」「どんな内容なの?」ということに対して、的確に答えています。

購入の参考になれば幸いです。

総評

本書籍は、2017年と2018年に東京大学で実施された「グローバル消費インテリジェンス寄付講座」の学生向けのオフライン講義と、社会人向けのオンライン講座で使われた教材がベースになっています。

対象読者Python初学者データ分析初任者・初級者です。

Pythonの基礎ライブラリー(Numpy、Pandas、Matplotlib)の基礎を丁寧に解説

・データサイエンティストとして必要な知識である統計確率基礎知識もわかりやすく説明

・データの前処理・データの加工を行うためのPandasの使用方法も多くの事例をもとに解説。さらに、データの可視化のためのMatplotlibの利用方法も説明。

機械学習の基礎も学べる。教師あり学習では、重回帰分析ロジスティク回帰ラッソ回帰リッジ回帰決定木K近傍法SVMを紹介。教師なし学習では、クラスタリングK-means主成分分析マーケットバスケット分析等多くの方法をわかりやすく学べる。

・モデルの検証方法としてホールドアウト法交差検証法、モデルのハイパーパラメータのチューニング方法、モデルの評価指標アンサンブル学習も一つの章を設けて説明

サンプルコードもあるので、好きな時間自分の感覚スピードでデータ分析が学べる

練習問題もあり。そのほかに、総合演習問題が6問ある。

なお、本書は実行環境としてAnacondaを紹介し、サンプルファイルはJupyterNotebook形式です。google colaboratoryで動かしたい方はこちらのブログ記事を参考にしてください。

本書の使い方

実は、GCIデータサイエンティスト育成講座演習コンテンツの公開ページでコンテンツを無償公開しているとのことで、ダウンロードしたいと思っておりましたが、ずっと準備中のまま変わらないので、本書を購入しました。

この本は索引がすばらしいので、私は辞書として使用しています。

Kaggleをやるときに、コードがわからなくなったときとか、公開されているコードの中身でこれってなんだっけかなと忘れたときとか、評価関数モデルでわからないものがあるときに索引で検索して、学んでいます。

以上のように、本書は、Python初学者データ分析初任者・初級者に必要な要素がフルに入っています。

初心者・初学者必要な基礎や要素一気に手に入れたい方は、是非ご購読ください。

Pythonでデータ分析を学びたい方へ

Pythonでデータ分析を学びたい方向けのブログ記事をまとめていますので、ご興味ありましたらご覧ください。

データサイエンス興味がある人、データサイエンティストなりたい人、データ分析をはじめてみたい人向けに、学習レベル別にオススメの書籍を紹介しています。
>>【レベル別】データサイエンス・データ分析の本まとめ(Python)

自信をもってオススメできる厳選動画をまとめてみました!!
>>【オススメ】データサイエンス・データ分析を学べる動画をまとめました(Python)

独学データ分析を学ぶにはどうしたらいいかについてもまとめていますのでこちらもご覧ください。
>>【独学】プログラミングとデータ分析(勉強法・資格・本・動画・テキスト)