Pythonを使うことで、CSVの文字化けを簡単に解消することができます。
JupiterNotebook、もしくはGoogle colaboratoryを使うのがおすすめです。
目次
pandasのインポート
まずは、pandasのimport。
ローカルファイルを扱う場合は、import os などが必要ですが今回は割愛しています。
import pandas as pd
csvの読み込みとエンコーディング
csvファイルをpythonで読み込みます。
今回はwindowsで作成したファイルをmacで読み込む方法です。
file = pd.read_csv('xxxxxx.csv', encoding="cp932")
Microsoftでデータを作成した場合、ページコード 932という文字コードが使われているケースがあるようです。
上記はその文字コードのエラーを解消しています。
別の文字コードに変換したい場合などは、encoding=’xxxx’の部分を変更してください。
シフトJISに変換:encoding=’shift_jis
UTF-8に変換:ncoding=’utf-8
excelファイルで書き出し
最後にファイルの書き出しをします。
file.to_excel('xxxxxx.exlx')
ちなみに、csvに書き出したいときはこちらです。
file.to_csv('xxxxxx.csv')
まとめ
本記事では、CSVの文字化けの解消方法をお伝えしました。
よくでてくるようなテキストエディットでは解消する方法でやっても解消しないときは、Pythonを使ってみるのが絶対的におすすめです。
コメント