【Googleスプレッドシート】データ→クリーンアップの候補で表記揺れを統一!便利な機能の使い方

【Googleスプレッドシート】データ→クリーンアップの候補で表記揺れを統一!便利な機能の使い方
🛡️ 超解決

取引先や商品名の表記が「株式会社」「(株)」「カブシキガイシャ」とバラバラで、集計に困ったことはありませんか。スプレッドシートのクリーンアップ機能を使えば、こうした表記揺れを自動で検出し、ワンクリックで統一できます。この記事では、データメニュー内のクリーンアップ候補を活用して表記揺れを解消する手順を、初心者の方でも迷わないように解説します。手動で一つ一つ直す手間から解放され、データの品質が大幅に向上します。

【要点】クリーンアップ候補で表記揺れを一括変換

  • 「データ」→「データクリーンアップ」→「表記揺れを統一」: このメニューで自動的に表記揺れの候補が一覧表示されます。
  • 候補リストから変換ルールを選択: 「株式会社」と「(株)」など、どの表記に統一するかを選びます。
  • 「すべて変換」ボタンで一括適用: 選択したルールに従って、シート全体の該当セルを一気に変換します。

ADVERTISEMENT

クリーンアップ機能で表記揺れがなぜ統一できるのか

クリーンアップ機能は、スプレッドシートが内部で持つ辞書とパターン認識を利用して、似た表記の文字列をグループ化します。たとえば「東京都」「東京」「東京都新宿区」のような住所のゆれや、「1,000」「1000」「1,000.00」といった数字のゆれも検出対象です。この機能は、データメニュー内の「データクリーンアップ」サブメニューに集約されており、「表記揺れを統一」の項目を選ぶと、検出された候補が画面右側のパネルに表示されます。候補は完全一致ではなく、類義語や部分一致に基づいて提案されるため、人間が見落としがちなパターンも拾い上げます。ただし、完全に自動で変換されるわけではなく、ユーザーが各候補の変換ルールを確認・承認する必要があります。

表記揺れを統一する具体的な手順

ここからは、実際にクリーンアップ候補を使って表記揺れを直す手順を説明します。サンプルデータとして、列Aに「株式会社ABC」「(株)ABC」「カブシキガイシャABC」が混在しているケースを想定します。

  1. データ範囲を選択する
    表記揺れを統一したいセル範囲をドラッグで選択します。列全体でも行全体でも構いません。選択範囲が複数シートにまたがることはできませんので、対象シートを事前に開いてください。
  2. メニューから「表記揺れを統一」を開く
    画面上部の「データ」メニューをクリックし、「データクリーンアップ」→「表記揺れを統一」を選択します。画面右側に「表記揺れの候補」パネルが表示されます。
  3. 候補リストを確認する
    パネルには、検出された表記揺れのグループが一覧で表示されます。各グループには「よく使われる形式」が提案されています。例では「株式会社ABC」と「(株)ABC」が同じグループとしてまとめられ、「株式会社」への変換が推奨されています。
  4. 変換ルールを設定する
    各グループのドロップダウンメニューから、どの表記に統一するかを選択します。複数グループがある場合は、グループごとに設定できます。また、グループをスキップしたい場合は「無視」を選ぶことも可能です。
  5. 一括変換を実行する
    設定が完了したら、パネル下部の「すべて変換」ボタンをクリックします。確認ダイアログが表示されたら「変換」を押して確定します。変換後、元のデータは上書きされます。元に戻したい場合はCtrl+Z(またはCmd+Z)で即座に取り消しできます。

変換が完了すると、パネルに「◯個のセルが更新されました」と表示されます。必要に応じて、他のグループも同様に処理を続けてください。すべての候補を処理し終えたら、パネルの右上の「×」ボタンで閉じます。

注意点とよくある失敗

候補がまったく表示されない場合

選択範囲に十分な量のデータがないと、候補が生成されないことがあります。目安として、同じような文字列が少なくとも2〜3行以上ある必要があります。また、言語設定が日本語以外になっていると、日本語の表記揺れが検出されにくいため、スプレッドシートの言語設定を日本語に切り替えてみてください。

変換結果が意図と異なる場合

クリーンアップ機能はAIによる推定のため、必ずしもユーザーの意図どおりにグループ化されるとは限りません。たとえば「有限会社」と「株式会社」が誤って同じグループにまとめられることがあります。その場合は、該当グループのドロップダウンで「無視」を選ぶか、手動で検索置換を使って修正してください。変換前に「プレビュー」機能で影響範囲を確認することをおすすめします。

変換後に元のデータを残したい場合

「すべて変換」は元のセルを直接書き換えます。元データを残しておきたい場合は、事前にシート全体をコピーしてバックアップを取ってから実行してください。また、変換前に候補パネル内の「各グループの変換数を確認する」ことで、影響を受けるセル数がわかります。

大量のデータで処理が重くなる場合

数万行を超えるデータでは、候補の生成に時間がかかったり、ブラウザが応答しなくなることがあります。その場合は、範囲を分割して処理するか、不要な列をあらかじめ非表示にしてください。それでも改善しない場合は、Googleスプレッドシートの負荷を減らすために、別のシートにコピーしてから試すことも検討しましょう。

ADVERTISEMENT

クリーンアップ機能と手動検索置換の比較

項目 クリーンアップ候補 手動の検索と置換
検出方法 AIが自動でパターンを検出 ユーザーがキーワードを指定
対応範囲 複数のゆれを一度に提案 1パターンずつしか置換できない
変換の精度 推定に依存、誤検出あり 完全一致で確実
作業時間 数クリックで完了 ゆれの数だけ繰り返し必要
初心者向け 操作は直感的で簡単 正規表現を使うと難しい
元に戻す 直後のCtrl+Zのみ 置換後は手動で戻す必要あり

表からわかるように、クリーンアップ候補はスピードと手軽さで優れています。一方、意図しない変換を防ぎたい場合は、従来の検索と置換を併用するとよいでしょう。

まとめ

「データ」→「データクリーンアップ」→「表記揺れを統一」の手順で、面倒な表記揺れの修正が数クリックで完了します。この機能を使えば、データの統一性が高まり、集計や分析の精度も向上します。次のステップとしては、クリーンアップ内の「重複の削除」や「空白の削除」も試してみてください。スプレッドシートのデータ整備が格段に効率的になります。


ADVERTISEMENT

この記事の監修者
✍️

超解決 第一編集部

疑問解決ポータル「超解決」の編集チーム。正確な検証と、現場視点での伝わりやすい解説を心がけています。