
はじめに
はやたす / Pythonチャンネルの「Python × データサイエンス入門」はデータ分析・データサイエンティストを目指す初学者や初心者にオススメの動画です。
気になる方は、是非ご覧ください。
はやたす / Pythonチャンネル「Python × データサイエンス入門」
「Python × データサイエンス入門」
① データサイエンスとは?必要なスキルと7つの流れを解説【超初心者向け】
10分30秒
データサイエンスに必要なスキルと7つの流れについての座学
② KaggleとGoogle Colabolatoryを使って無料でデータ分析を始めよう!
10分28秒
ソースコードのダウンロード、Kaggleの無料登録とデータダウンロード、Pythonの環境構築とGoogle Colaboratoryでデータを読み込む方法を学ぶ
*動画では、YouTube動画のソースコードはGithubとしているが、現在はLINEに登録者がもらえるので、そこは注意。
③ Python・Pandasを使ったデータの読み込み
11分23秒
numpy,pandas,matplotlib,seabornのライブラリーインポート後、データの読み込み
④ データの可視化と欠損値の確認【Matplotlib, Pandas, Seaborn】
15分24秒
データの連結、可視化、データの欠損値を確認する
⑤ 必須項目「欠損値の補完」を10分で習得!
13分19秒
データ前処理で重要な欠損値の補完を行う
⑥ カテゴリカル変数の数値変換(one-hot encoding)を10分でマスターしよう!
12分57秒
one-hot encodingでカテゴリカル変数の数値を交換。もう一つの方法としてラベルエンコーディングも学ぶ。
⑦ 機械学習の必修科目!学習データとテストデータに分割しよう!
8分54秒
機械学習前に学習用データとテストデータに分割する
⑧ 機械学習モデル「決定木」で予測してみよう!
10分21秒
複数あるアルゴリズム・モデルの中から、Scikit-learn(サイキットラーン)の決定木モデルを使って予測してみる。
⑨ 決定木モデルの予測結果(精度)を確認しよう!
9分8秒
結果をCSVファイルにはきだし、Kaggleで指定されているフォーマットでデータを提出して、モデルの精度を判定する
チャンネルの感想
良かった点
・動画はわかりやすく丁寧に説明しながら進めてくれるので、初心者必見の内容
・動画でやると実際に正しい画面の動作がみえる
・本では、視覚と触覚の2つしか刺激できませんが、動画でやると、視覚、聴覚、触覚の3つの感覚を刺激しながら学べるので、記憶に残りやすい
動画を観ながら、Google Colaboratoryを操作し、ひたすらコードを写経しているだけですが、初心者にはこれが大事と思っています。
Google Colaboratoryについてさらに知りたい方は以下のブログ記事をご覧ください。
Google Colaboratoryとは? いつできた? mount、ファイルの読み込み等の使い方についてはこちらのブログ記事をご覧ください。
>>その他のGoogle Colaboratoryについてはこちらのブログ記事をご覧ください。
コードを打ったことがほとんどない初心者は、エラーがよく出ます。
しかし、そのうちのほとんどが、単なる打ち間違えです(最初は結構打ち間違えます)。
そのエラーも疑問に思ったら、ネットで調べながら、続けるのがよいです。
ネット→コード打ち直し→動画みたいなものを反復してやると、より学習効果も高いです。
エラーの中身がネットで調べずとも何かわかるようになると、もっとコードの修正も早くなると思いますが、それは日々の訓練で身につきます。
この動画では、KaggleのTitanicのコンペを参考にデータサイエンスの入門を学びましたが、この作業を経て思ったことは、データサイエンティストの作業はかなり地味な作業だということです。
データの前処理が大事で、その前処理に時間が多く取れられる。それこそが”実務”なのかと今は感じています。
データ分析入門・データサイエンス初心者・初学者向けにデータ分析でよく使うPythonをまとめました。
>>【データ分析初心者】Python構文~if文、format記法とf文字列~
>>【データ分析初心者】Python構文~for文、range関数、zip関数、enumerate関数~
>>【データ分析初心者】Python構文~無名関数lambda式、内包表記、map関数~
>>【データ分析初心者】Pandas~loc[]、iloc[]、スライス、drop()、isin()~
>>【データ分析初心者】Matplotlib、Seabornーscatter、hist、countplot 、barplot
最短距離で学習したい方や転職活動もしたい方には
効率的に機械学習・データサイエンスを学びたい方は、スクールの無料のオンライン説明会等に参加してみることもオススメです。
