【pandas】CSVの文字化けをencodingで解消する方法|WindowsのファイルをMacで読み込み

pandas CSVの文字コード変換の巻

Pythonを使うことで、CSVの文字化けを簡単に解消することができます。

JupiterNotebook、もしくはGoogle colaboratoryを使うのがおすすめです。

目次

pandasのインポート

まずは、pandasのimport。

ローカルファイルを扱う場合は、import os などが必要ですが今回は割愛しています。

import pandas as pd

csvの読み込みとエンコーディング

csvファイルをpythonで読み込みます。

今回はwindowsで作成したファイルをmacで読み込む方法です。

file = pd.read_csv('xxxxxx.csv', encoding="cp932")

Microsoftでデータを作成した場合、ページコード 932という文字コードが使われているケースがあるようです。

上記はその文字コードのエラーを解消しています。

別の文字コードに変換したい場合などは、encoding=’xxxx’の部分を変更してください。

シフトJISに変換:encoding=’shift_jis

UTF-8に変換:ncoding=’utf-8

excelファイルで書き出し

最後にファイルの書き出しをします。

file.to_excel('xxxxxx.exlx')

ちなみに、csvに書き出したいときはこちらです。

file.to_csv('xxxxxx.csv')

まとめ

本記事では、CSVの文字化けの解消方法をお伝えしました。

よくでてくるようなテキストエディットでは解消する方法でやっても解消しないときは、Pythonを使ってみるのが絶対的におすすめです。

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

この記事を書いた人

節約に励むマーケターです!30歳を機に別職種から、マーケターにキャリアチェンジ。IT企業で専任のマーケターをしています。0からプログラミングを学びはじめました! ★データサイエンティストの勉強中です!お問合せはこちら!

コメント

コメントする

CAPTCHA


目次