【データ分析初心者】Pythonを使って、和暦から西暦への変換を行う

※アフィリエイト広告を利用しています。

はじめに

データ分析データサイエンスの初心者初学者に最初に覚えて欲しいPythonを使った便利な変換がいくつかあります。

今回はその中の一つである、データ分析でよく使う和暦から西暦に変換する方法を紹介します。

読み終えたあとには、しっかりとその方法が身についていると思います。

和暦西暦変換関数

import re
def wareki2seireki(wareki_s, def_value=0):
    era_dic = {"M": 1868, "T": 1912, "S": 1926, "H": 1989, "R": 2019}
    s = re.match(r'(M|T|S|H|R)([0-9]+|元)', str(wareki_s))
    if s is None: return def_value
    y = int(s.group(2)) if s.group(2) != '元' else 1
    return era_dic[s.group(1)] + y - 1

上記関数については、https://qiita.com/kujirahand/items/2fe0eafdb9647be42cacより引用

こちらを用いて、和暦ものを西暦に変換したいと思います。

和暦から西暦に変換

Google Colaboratoryで動かしてみます。

明治10年、大正25年、昭和45年、平成31年、令和5年を西暦に変換したいと思います。

import re
def wareki2seireki(wareki_s, def_value=0):
    era_dic = {"M": 1868, "T": 1912, "S": 1926, "H": 1989, "R": 2019}
    s = re.match(r'(M|T|S|H|R)([0-9]+|元)', str(wareki_s))
    if s is None: return def_value
    y = int(s.group(2)) if s.group(2) != '元' else 1
    return era_dic[s.group(1)] + y - 1

上記関数を用いて、for文でwaを一つ一つ取り出しながら、変換していき、それをseに格納します。

se = []
for i in wa:
    se.append(wareki2seireki(i))

このように西暦に変換されました。

書籍や動画でデータ分析を学びたい方へ

機械学習データサイエンス独学で学びたい方のために、ブログ記事まとめてみました。

書籍、動画などなど、厳選したオススメの方法をまとめています。

興味がある方はご覧ください。