
はじめに
データ分析・データサイエンスの初心者・初学者に最初に覚えて欲しいPythonを使った便利な変換がいくつかあります。
今回はその中の一つである、データ分析でよく使う和暦から西暦に変換する方法を紹介します。
読み終えたあとには、しっかりとその方法が身についていると思います。
和暦西暦変換関数
import re
def wareki2seireki(wareki_s, def_value=0):
era_dic = {"M": 1868, "T": 1912, "S": 1926, "H": 1989, "R": 2019}
s = re.match(r'(M|T|S|H|R)([0-9]+|元)', str(wareki_s))
if s is None: return def_value
y = int(s.group(2)) if s.group(2) != '元' else 1
return era_dic[s.group(1)] + y - 1
上記関数については、https://qiita.com/kujirahand/items/2fe0eafdb9647be42cacより引用
こちらを用いて、和暦ものを西暦に変換したいと思います。
和暦から西暦に変換
Google Colaboratoryで動かしてみます。
Google Colaboratoryについては知りたい方は、以下のブログ記事を参考にしてください。
>>Google Colaboratoryとは? いつできた? mount、ファイルの読み込み等の使い方
>>Google Colaboratoryよく使う便利なショートカットキー

明治10年、大正25年、昭和45年、平成31年、令和5年を西暦に変換したいと思います。
import re
def wareki2seireki(wareki_s, def_value=0):
era_dic = {"M": 1868, "T": 1912, "S": 1926, "H": 1989, "R": 2019}
s = re.match(r'(M|T|S|H|R)([0-9]+|元)', str(wareki_s))
if s is None: return def_value
y = int(s.group(2)) if s.group(2) != '元' else 1
return era_dic[s.group(1)] + y - 1
上記関数を用いて、for文でwaを一つ一つ取り出しながら、変換していき、それをseに格納します。
se = []
for i in wa:
se.append(wareki2seireki(i))

このように西暦に変換されました。
データ分析入門・データサイエンス初心者・初学者向けにデータ分析でよく使うPythonの基本と実例をまとめましたので、あわせてご覧ください。
>>【データ分析初心者】Python構文~if文、format記法とf文字列
>>【データ分析初心者】Python構文~for文、range関数、zip関数、enumerate関数~
>>【データ分析初心者】Python構文~無名関数lambda式、内包表記、map関数~
>>【データ分析初心者】Pandas~loc[]、iloc[]、スライス、drop()、isin()~
>>【データ分析初心者】Matplotlib、Seabornーscatter()、hist()、countplot() 、barplot()
書籍や動画でデータ分析を学びたい方へ
機械学習やデータサイエンスを独学で学びたい方のために、ブログ記事をまとめてみました。
書籍、動画などなど、厳選したオススメの方法をまとめています。
興味がある方はご覧ください。