【Pandas】datetypeに変換、月次ごとにグループ化してデータの集計をする方法

pandas 日付をdatetime型に変換の巻

マーケティングをはじめとして、pandasで顧客データを月次ごとに集計したいことも多いと思います。

今回、そんな作業が業務で発生したので、備忘録も兼ねて記録しておきます。

目次

データの確認

まずはデータの確認。

今回は、以下のようなデータを使っていきます。

Create Date がデータ作成日にあたります。

pandas 集計 月次ごと

続いて、カラムのtypeの確認をします。

Create Date をみると、object と記載されています。

これは日付の情報ではないため、変更していく必要があります。

年月のカラムを作成

datetime型への変更

まずはCreate Dateのカラムを日付の型であるdatetime型に変更をします。

コードは以下を参考にしてください。

df['Create Date'] = pd.to_datetime(df['Create Date'] )

改めて、typeを確認します。

object → datetime に変更されていることが確認できました。

datetimeは日付や時間の情報をもつタイプです。

月次の情報を作成

このままだと情報量が多く、月次ごとの情報集計が難しいため、年月までの日付データを作成します。

コードは以下を参考にしてください。

df['create_month'] = df['Create Date'].dt.strftime('%Y%m')

はい、確認してみると、年月の情報をもつカラム、create_monthが確認できました。

グループ化して、月次の集計

では、月次ごとの集計をしてみます。

groupbyを使うことによって、月ごとにグループ化ができます。

df.groupby('create_month').count()

こんな感じで無事にできました。

まとめ

データを月次ごとに集計する方法をご紹介しました。

ポイントは2つです。

①カラムのタイプをdatetime型にする

②情報を年月までに変更する

簡単にできるので、ぜひ参考にしてみてください。

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

この記事を書いた人

節約に励むマーケターです!30歳を機に別職種から、マーケターにキャリアチェンジ。IT企業で専任のマーケターをしています。0からプログラミングを学びはじめました! ★データサイエンティストの勉強中です!お問合せはこちら!

コメント

コメントする

CAPTCHA


目次