ファイルの文字コードの選びかた
ユーザーや組織などのデータをファイルに書き出す場合、文字コードを選択する必要があります。
次の点を考慮して適切な文字コードを選択してください。
- ファイルに含まれるデータの文字種
- 書き出したファイルを編集する場合は、使用するソフトウェアで利用できる文字コード
- 書き出したファイルを他のシステムに読み込ませる場合は、そのシステムで利用できる文字コード
文字コード
UTF-8
UTF-8は、主要な言語の文字種を表現できる文字コードです。
書き出すデータに繁体字中国語や次の文字を含む場合、「UTF-8」を選択してください。
- 「髙」や「會」といった異体字
- 著作権マーク(©)や登録商標マーク(®)などの特殊文字
- 絵文字
Shift-JIS
Shift-JISは、日本語を表現できる文字コードです。
Latin1
Latin1は、西ヨーロッパ言語(英語、フランス語、ドイツ語など)を表現できる文字コードです。
GBK/GB2312
GBK/GB2312は、簡体字中国語を表現できる文字コードです。
書き出したファイルの内容が文字化けする
適切な文字コードを選択して、再度ファイルを書き出してください。
Excelで開いた場合の文字化け
書き出したファイルをダブルクリックしてExcelで開くと、ファイルの内容が文字化けすることがあります。
文字化けした場合は、次の手順で対処します。
- 「UTF-8」を選択して、再度ファイルを書き出します。
- Excelのデータソースからデータをインポートする機能を使って、書き出したファイルを開きます。
Microsoft社のヘルプ:Excel で CSV UTF-8 ファイルを正しく開く