マーケティングをはじめとして、pandasで顧客データを月次ごとに集計したいことも多いと思います。
今回、そんな作業が業務で発生したので、備忘録も兼ねて記録しておきます。
目次
データの確認
まずはデータの確認。
今回は、以下のようなデータを使っていきます。
Create Date がデータ作成日にあたります。
続いて、カラムのtypeの確認をします。
Create Date をみると、object と記載されています。
これは日付の情報ではないため、変更していく必要があります。
年月のカラムを作成
datetime型への変更
まずはCreate Dateのカラムを日付の型であるdatetime型に変更をします。
コードは以下を参考にしてください。
df['Create Date'] = pd.to_datetime(df['Create Date'] )
改めて、typeを確認します。
object → datetime に変更されていることが確認できました。
datetimeは日付や時間の情報をもつタイプです。
月次の情報を作成
このままだと情報量が多く、月次ごとの情報集計が難しいため、年月までの日付データを作成します。
コードは以下を参考にしてください。
df['create_month'] = df['Create Date'].dt.strftime('%Y%m')
はい、確認してみると、年月の情報をもつカラム、create_monthが確認できました。
グループ化して、月次の集計
では、月次ごとの集計をしてみます。
groupbyを使うことによって、月ごとにグループ化ができます。
df.groupby('create_month').count()
こんな感じで無事にできました。
まとめ
データを月次ごとに集計する方法をご紹介しました。
ポイントは2つです。
①カラムのタイプをdatetime型にする
②情報を年月までに変更する
簡単にできるので、ぜひ参考にしてみてください。
コメント