Power Queryで外部データを読み込む際、日本語のヘッダーが文字化けすることがあります。特にCSVファイルなどで発生しやすく、データの見出しが正しく表示されないため、その後の分析や集計作業に支障をきたします。この文字化けは、Excelのエンコード自動判定機能が原因で発生することが多いです。この記事では、Power Queryでの日本語ヘッダー文字化けの原因と、Excelのエンコード自動判定を修正して文字化けを解消する具体的な手順を解説します。
Power Queryは、様々なデータソースからデータを取得・加工できる強力なツールです。しかし、データソースのエンコード形式が正しく認識されないと、日本語が文字化けする問題が発生します。この問題を解決することで、Power Queryをより快適に利用できるようになります。
ADVERTISEMENT
目次
Power Queryで日本語ヘッダーが文字化けする原因
Power Queryで日本語のヘッダーが文字化けする主な原因は、読み込もうとしているファイル(特にCSVファイル)の文字コードが、Power Queryの自動判定によって正しく認識されていないことです。CSVファイルは、UTF-8、Shift_JIS、EUC-JPなど、複数の文字コードで保存されている可能性があります。
ExcelのPower Query機能は、ファイルを開く際に自動的に文字コードを判定しようとしますが、この自動判定がうまくいかない場合に文字化けが発生します。特に、Shift_JISで保存された日本語のCSVファイルなどを、UTF-8として誤認識してしまうケースが多いです。ヘッダー行だけでなく、データ本体の日本語も文字化けすることがあります。
Power Queryのエンコード自動判定を修正する手順
Power Queryで日本語ヘッダーの文字化けを解消するには、データソースの読み込み時に文字コードを明示的に指定する必要があります。以下の手順で、エンコード設定を修正します。
- Power Queryエディターを開く
Excelのリボンメニューから「データ」タブを選択し、「データの取得」>「ファイルから」>「テキスト/CSVから」をクリックして、文字化けが発生するCSVファイルを選択します。 - ファイルの内容を確認する
ファイルを選択すると、プレビューウィンドウが表示されます。ここで既に日本語が文字化けしている場合は、この後の手順で修正します。 - 「データの変換」をクリックする
プレビューウィンドウの下部にある「データの変換」ボタンをクリックして、Power Queryエディターを開きます。 - 「ソースの変更」を特定する
Power Queryエディターの「適用したステップ」ペインで、一番上に表示されている「ソース」ステップを探します。 - ソースステップのコードを編集する
「ソース」ステップの数式バーに表示されているコードを確認します。通常、CSVファイルを指定した場合、以下のようなコードが表示されています。= Csv.Document(File.Contents("ファイルパス"),[Delimiter=",", Columns=10, Encoding=65001, QuoteStyle=QuoteStyle.None])
このコードの `Encoding=65001` の部分が、文字コードの設定です。`65001` はUTF-8を意味します。 - エンコード値を変更する
日本語のCSVファイルで文字化けが発生している場合、このエンコード値が正しくない可能性が高いです。一般的に、日本語のWindows環境で作成されたCSVファイルはShift_JISで保存されていることが多いです。Shift_JISを指定するには、エンコード値を `65001` から `932` に変更します。
数式バーのコードを以下のように修正します。= Csv.Document(File.Contents("ファイルパス"),[Delimiter=",", Columns=10, Encoding=932, QuoteStyle=QuoteStyle.None])
もし、ファイルがUTF-8であるにも関わらず文字化けしている場合は、他の原因も考えられますが、まずはShift_JIS(932)を試してみてください。 - 変更を適用する
数式バーでコードを修正したら、数式バーのチェックマークをクリックするか、Enterキーを押して変更を確定します。 - 結果を確認する
Power Queryエディターのプレビュー画面で、日本語ヘッダーが正しく表示されているか確認してください。文字化けが解消されていれば、右上の「閉じて読み込む」をクリックしてExcelシートにデータを読み込みます。
エンコード値の確認方法と注意点
Power Queryで指定できるエンコード値は、国際標準やWindowsのコードページに基づいています。主なエンコード値とその意味は以下の通りです。
主なエンコード値
- 65001: UTF-8
- 932: Shift_JIS (日本語Windows環境で一般的)
- 1200: UTF-16 (Little Endian)
- 12000: UTF-32 (Little Endian)
- 20127: US-ASCII
これらの値は、Excelの「ファイル」>「オプション」>「詳細設定」>「全般」セクションにある「Webオプション」から確認できる「ファイル」タブでも参照できます。ただし、Power Queryで直接設定するのは、上記の手順で行います。
注意点
- ファイルの保存形式を確認する: 可能であれば、元のCSVファイルをテキストエディタ(メモ帳など)で開き、保存する際に使用されている文字コードを確認することが最も確実です。メモ帳でファイルを開き、「ファイル」>「名前を付けて保存」を選択すると、「文字コード」のドロップダウンで現在のエンコードを確認できます。
- UTF-8への統一を推奨: 可能な限り、データソース(CSVファイルなど)はUTF-8形式で保存・管理することを推奨します。UTF-8は多くの言語に対応しており、文字化けのリスクを低減できます。
- 「ソース」ステップの編集: エンコード値の変更は、「ソース」ステップで行う必要があります。他のステップで変更しても反映されません。
- ファイルパスの確認: 数式バーでファイルパスが正しく指定されているかも確認してください。パスが間違っていると、ファイル自体が読み込めません。
ADVERTISEMENT
Power Queryのエンコード設定に関するQ&A
Q1: CSVファイルを開いたときに、エンコードの選択肢が表示されるのはなぜですか?
Excelの「テキスト/CSVから」機能でファイルを選択した際、エンコードの選択肢が表示されることがあります。これは、Excelがファイルのエンコードを自動判定しようとするものの、確信が持てない場合にユーザーに確認を促すためです。しかし、この自動判定が常に正しいとは限らず、意図しないエンコードが選択されてしまうことがあります。
Q2: CSVファイルではなく、Excelファイル(.xlsx)をPower Queryで読み込む場合でも文字化けは発生しますか?
Excelファイル(.xlsx)は、標準でUnicode(UTF-16)形式で保存されるため、Power Queryで読み込む際にCSVファイルのようなエンコードによる文字化けは発生しにくいです。文字化けが発生する場合は、Excelファイル自体が破損しているか、Power Queryの他の設定に問題がある可能性が考えられます。
Q3: 別のデータソース(Webページやデータベース)からのデータでも同様の文字化けは起こりますか?
Webページやデータベースからのデータの場合、文字化けの原因はエンコードだけでなく、サーバー側の設定やデータ取得方法に起因することがあります。Webページの場合は、HTMLのmetaタグで指定されている文字コードを確認したり、Power QueryのWebコネクタでエンコードを指定したりするオプションがある場合があります。データベースの場合は、データベース自体の文字コード設定や、接続文字列の設定を確認する必要があります。
Q4: Shift_JIS(932)にしても文字化けが直りません。他に試すべきことはありますか?
Shift_JIS(932)でも文字化けが直らない場合、以下の可能性が考えられます。
- 別のエンコード形式を試す
ファイルがUTF-8(65001)やUTF-16(1200)などの別の形式で保存されている可能性があります。可能であれば、元のファイルの作成者に確認するか、異なるエンコード値で試してみてください。 - テキストエディタで変換する
一度、メモ帳などのテキストエディタでファイルを開き、目的のエンコード形式(例: UTF-8)で再保存してからPower Queryで読み込んでみてください。 - Power Queryの「テキスト/CSVから」オプションを確認する
ファイルを選択する際に表示されるオプションで、「ファイルオリジナル」のエンコードを選択する項目があれば、そこで手動で指定してみます。
まとめ
Power Queryで日本語ヘッダーが文字化けする問題は、CSVファイルのエンコード設定を正しく指定することで解決できます。本記事では、Power Queryエディターで「ソース」ステップのエンコード値を `65001`(UTF-8)から `932`(Shift_JIS)などに変更する具体的な手順を解説しました。この修正により、日本語のヘッダーが正しく表示され、Power Queryでのデータ分析がスムーズに進められるようになります。今後、同様の問題に直面した際は、エンコード設定の見直しを試みてください。
【要点】Power Queryの日本語ヘッダー文字化け解消
- ソースステップのエンコード値変更: Power Queryエディターの「ソース」ステップで、ファイルのエンコード値を明示的に指定します。
- Shift_JIS(932)の指定: 日本語Windows環境で作成されたCSVファイルはShift_JISの可能性が高いため、エンコード値を932に変更することで文字化けが解消されることがあります。
- UTF-8(65001)の確認: ファイルがUTF-8形式で保存されている場合は、エンコード値65001が正しく設定されているか確認します。
ADVERTISEMENT
超解決 Excel・Word研究班
企業のDX支援や業務効率化を専門とする技術者チーム。20年以上のExcel・Word運用改善実績に基づき、不具合の根本原因と最短の解決策を監修しています。ExcelとWordを使った「やりたいこと」「困っていること」「より便利な使い方」をクライアントの視点で丁寧に提供します。
Office・仕事術の人気記事ランキング
- 【Word】差し込み印刷で数字の桁を整える!金額にカンマ(桁区切り)を入れる設定
- 【Teams】メッセージを「保存済み」にして後で読む!重要なチャットをブックマークして整理する技
- 【Outlook】宛先が「オートコンプリート」に出ない・間違っている時の修正手順|履歴の削除と再構築
- 【Excel】矢印キーで「セルが動かず画面がスクロールする」!ScrollLockの解除方法(ノートPC対応)
- 【Outlook】メールの受信が数分遅れる!リアルタイムで届かない時の同期設定と送受信グループ設定
- 【Outlook】予定表の「祝日」が表示されない!最新カレンダーの追加と二重表示の修正手順
- 【Outlook】「メール送信を5分遅らせる」設定!誤送信を防ぐ最強のディレイ機能
- 【Word】校閲機能の基本!赤字(変更履歴)とコメントで修正を見える化する
- 【神技】保存せずに閉じたExcel・Wordファイルを復元する!消えたデータを復活させる4つの救出法
- 【Excel】文字がセルの枠からはみ出す・隠れる!「折り返して表示」と「縮小して全体を表示」の使い分け
