ADVERTISEMENT

【Googleスプレッドシート】データ検証でメールアドレス形式チェック!正規表現の活用

【Googleスプレッドシート】データ検証でメールアドレス形式チェック!正規表現の活用
🛡️ 超解決

メールアドレスの入力ミスは、データベースの品質を大きく低下させる原因の一つです。特に、複数のユーザーが入力するシートでは、正しい形式で入力されているかどうかを確認するのが難しいでしょう。そこで役立つのが、Googleスプレッドシートのデータ検証機能と正規表現です。この記事では、データ検証を使ってメールアドレスの形式を自動チェックする方法を、具体的な正規表現の活用例とともに詳しく解説します。

【要点】データ検証のカスタム数式でメールアドレス形式をチェックする方法

  • データ検証の「カスタム数式」: 正規表現を使ってセルの値を検証し、誤った形式の入力を防ぎます。
  • 正規表現パターン「^.+@.+\\.[a-zA-Z]{2,}$」: 簡易的なメールアドレス形式をチェックし、@とドメインの存在を確認します。
  • 正規表現関数「REGEXMATCH」: データ検証のカスタム数式内で使用し、特定のパターンに一致するかどうかを判定します。

ADVERTISEMENT

データ検証と正規表現の基礎知識

データ検証は、セルに入力できる値を制限する機能です。事前にルールを設定しておけば、ユーザーが誤った形式で入力しようとしたときに警告や入力を拒否できます。正規表現は、文字列のパターンを指定するための強力な記法です。スプレッドシートでは、REGEXMATCH、REGEXEXTRACT、REGEXREPLACEの3つの正規表現関数が用意されています。データ検証の「カスタム数式」オプションでREGEXMATCHを使うと、入力値が指定した正規表現パターンに一致するかどうかをチェックできます。これにより、メールアドレスのような特定の形式だけを許可する設定が簡単に実現できます。

メールアドレス形式をチェックする手順

ここでは、Googleスプレッドシートのデータ検証を使って、メールアドレス形式をチェックする具体的な手順を説明します。まず、簡易的な正規表現パターンを使用します。

  1. チェック対象のセル範囲を選択する
    メールアドレスを入力する予定のセル範囲(例:A2:A100)を選択します。複数の列や行にまたがる場合は、その範囲をまとめて選択してください。
  2. データ検証ダイアログを開く
    メニューバーから「データ」→「データの入力規則」をクリックします。画面右側にデータ検証の設定パネルが表示されます。
  3. カスタム数式を選択する
    「セルの値」ドロップダウンから「カスタム数式」を選びます。これにより、任意の数式をルールとして設定できるようになります。
  4. 正規表現パターンを入力する
    「値または数式」欄に以下の数式を入力します:
    =REGEXMATCH(A2, "^.+@.+\\.[a-zA-Z]{2,}$")
    ここで、A2は選択範囲の最初のセルを指します。データ検証は自動的に範囲全体に適用されます。
  5. 拒否オプションを設定する
    「無効なデータだった場合」で「入力を拒否する」を選択します。警告メッセージを表示したい場合は「警告を表示」も選べますが、確実にチェックするには拒否がおすすめです。
  6. 完了してテストする
    「保存」ボタンをクリックします。その後、範囲内のセルに「test@example.com」のように正しい形式と、「test」「test@」などの不正な形式を入力して動作を確認してください。

より厳密な正規表現パターンを使う場合

簡易パターンでは、「a@b.c」のような短いドメインも許可されます。より厳密にチェックするには、以下のようなパターンが考えられます。

=REGEXMATCH(A2, "^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\\.[a-zA-Z]{2,6}$")

このパターンでは、ローカル部分に許可する文字を限定し、ドメイン部分のハイフンやドットに対応しています。ただし、完全なメールアドレス仕様(RFC5322)に準拠するのは非常に複雑なため、ほとんどの実務では簡易パターンで十分です。

注意点とよくある失敗

バックスラッシュのエスケープを忘れてしまう

正規表現では、ドット「.」は任意の1文字を表す特殊文字です。リテラルのドットとして扱うには「\\.」と記述する必要があります。スプレッドシートの数式内では、バックスラッシュ自体もエスケープが必要なため、「\\」と書くことになります。よくある間違いは、バックスラッシュが1つしかないパターンです。正しくは「\\.」にします。

大文字小文字の区別に注意する

REGEXMATCHはデフォルトで大文字小文字を区別します。メールアドレスは通常大文字小文字を区別しないため、パターン内で「[a-zA-Z]」のように両方の範囲を含める必要があります。また、パターン末尾に「(?i)」フラグを付けると、そのパターン全体で大文字小文字を無視できます。ただし、データ検証のカスタム数式ではフラグが使えないバージョンもあるため、文字クラスで対応する方が確実です。

メールアドレスのドメイン部分にアンダースコアが入るケース

先ほどの厳密パターンではドメイン部分にアンダースコアを許可していませんでした。実際のメールドメインではアンダースコアは使えませんが、サブドメインなどで使われることがあります。必要に応じてパターンを調整してください。例えば、「[a-zA-Z0-9.-_]」のようにアンダースコアを追加することもできますが、一般的ではありません。

データ検証の動作範囲を間違える

データ検証を設定する際、選択した範囲の左上のセルを基準に数式を書きます。例えば範囲がB2:B100なら、数式内では「B2」を対象とします。範囲が複数列にまたがる場合も同様で、最初のセルを指定します。これを間違えると、正しく検証されないので注意してください。

ADVERTISEMENT

正規表現パターンの比較

パターン 特徴 チェック内容
^.+@.+\\.[a-zA-Z]{2,}$ 簡易版、最低限の確認 @とドットが存在し、トップレベルドメインが2文字以上
^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\\.[a-zA-Z]{2,6}$ やや厳密、ドメイン最大6文字 ローカル部分の文字制限、ドメイン部分の文字制限、TLD長さ制限
RFC準拠の複雑なパターン 非常に厳密、実務では過剰 引用符付きローカル部分なども許可、ただしメンテナンス困難

表の通り、簡易パターンでほとんどの実務ニーズに対応できます。あまりに厳密なパターンは、逆に正しいメールアドレスを拒否するリスクがあるため注意してください。

まとめ

この記事では、Googleスプレッドシートのデータ検証と正規表現を使って、メールアドレスの形式チェックを自動化する方法を解説しました。カスタム数式でREGEXMATCHを利用すれば、入力ミスを未然に防げます。まずは簡易パターン「^.+@.+\\. [a-zA-Z]{2,}$」から試してみてください。必要に応じて文字クラスや長さ制限を調整すれば、より精度の高いチェックが可能です。データ検証はメールアドレス以外にも、電話番号や郵便番号など様々な形式のチェックに応用できます。ぜひ、業務効率化に役立ててください。


ADVERTISEMENT

この記事の監修者
✍️

超解決 第一編集部

疑問解決ポータル「超解決」の編集チーム。正確な検証と、現場視点での伝わりやすい解説を心がけています。