【YouTube】Pythonで学ぶプログラミングとデータサイエンス

※アフィリエイト広告を利用しています。

動画

はじめに

はやたす / Pythonチャンネル「Python × データサイエンス入門」はデータ分析・データサイエンティストを目指す初学者や初心者にオススメの動画です。

気になる方は、是非ご覧ください。

はやたす / Pythonチャンネル「Python × データサイエンス入門」

「Python × データサイエンス入門」

① データサイエンスとは?必要なスキルと7つの流れを解説【超初心者向け】
10分30秒
 データサイエンスに必要なスキルと7つの流れについての座学

② KaggleとGoogle Colabolatoryを使って無料でデータ分析を始めよう!
10分28秒
 ソースコードのダウンロード、Kaggleの無料登録とデータダウンロード、Pythonの環境構築とGoogle Colaboratoryでデータを読み込む方法を学ぶ

*動画では、YouTube動画のソースコードはGithubとしているが、現在はLINEに登録者がもらえるので、そこは注意。

③ Python・Pandasを使ったデータの読み込み
11分23秒
 numpy,pandas,matplotlib,seabornのライブラリーインポート後、データの読み込み

④ データの可視化と欠損値の確認【Matplotlib, Pandas, Seaborn】
15分24秒
 データの連結、可視化、データの欠損値を確認する

⑤ 必須項目「欠損値の補完」を10分で習得!
13分19秒
 データ前処理で重要な欠損値の補完を行う

⑥ カテゴリカル変数の数値変換(one-hot encoding)を10分でマスターしよう!
12分57秒
 one-hot encodingでカテゴリカル変数の数値を交換。もう一つの方法としてラベルエンコーディングも学ぶ。

⑦ 機械学習の必修科目!学習データとテストデータに分割しよう!
8分54秒
 機械学習前に学習用データとテストデータに分割する

⑧ 機械学習モデル「決定木」で予測してみよう!
10分21秒
 複数あるアルゴリズム・モデルの中から、Scikit-learn(サイキットラーン)の決定木モデルを使って予測してみる。

⑨ 決定木モデルの予測結果(精度)を確認しよう!
9分8秒
 結果をCSVファイルにはきだし、Kaggleで指定されているフォーマットでデータを提出して、モデルの精度を判定する

チャンネルの感想

良かった点

・動画はわかりやすく丁寧に説明しながら進めてくれるので、初心者必見の内容

・動画でやると実際に正しい画面の動作がみえる

・本では、視覚触覚の2つしか刺激できませんが、動画でやると、視覚聴覚触覚3つの感覚を刺激しながら学べるので、記憶に残りやすい

動画を観ながら、Google Colaboratoryを操作し、ひたすらコードを写経しているだけですが、初心者にはこれが大事と思っています。

コードを打ったことがほとんどない初心者は、エラーがよく出ます。

しかし、そのうちのほとんどが、単なる打ち間違えです(最初は結構打ち間違えます)。

そのエラーも疑問に思ったら、ネットで調べながら、続けるのがよいです。

ネット→コード打ち直し→動画みたいなものを反復してやると、より学習効果も高いです。

エラーの中身がネットで調べずとも何かわかるようになると、もっとコードの修正も早くなると思いますが、それは日々の訓練で身につきます。

この動画では、KaggleTitanicのコンペを参考にデータサイエンスの入門を学びましたが、この作業を経て思ったことは、データサイエンティストの作業はかなり地味な作業だということです。

データの前処理が大事で、その前処理に時間が多く取れられる。それこそが”実務”なのかと今は感じています。

最短距離で学習したい方や転職活動もしたい方には

効率的機械学習・データサイエンス学びたい方は、スクールの無料オンライン説明会等に参加してみることもオススメです。