正規表現(せいきひょうげん)とは、文字列のパターンを指定する方法です。たとえば、メールアドレスや電話番号、特定の文字列を見つけるのに使われます。これを理解すれば、データの処理がずっと楽になります!
まずは正規表現の基本的な記号について見てみましょう。
特定の文字をそのまま指定することで、その文字が含まれている部分を見つけることができます。例えば、以下のように書きます。
/abc/
この場合、「abc」という文字列にマッチします。
中括弧「[]」を使うことで、指定した文字の中からどれか一つにマッチさせることができます。
/[abc]/
上の例では、「a」「b」「c」のいずれかにマッチします。
次に、複雑なパターンを作るための方法を紹介します。
アスタリスク「*」やプラス「+」を使うと、特定の文字が繰り返される場合にマッチできます。
/a*/
これは「a」が0回以上続く部分にマッチします。もし「a」が1回以上続く場合は、プラス「+」を使います。
/a+/
波括弧「{}」を使って、特定の回数だけ繰り返される場合を指定できます。例えば、次のように記述します。
/a{2,4}/
この場合、「a」が2回から4回続く部分にマッチします。
では、実際に正規表現を使ってみましょう。たとえば、次の文から「メールアドレス」を見つける場合です。
/[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}/
この正規表現は、一般的なメールアドレスの形式にマッチします。さまざまなケースに対応できるので便利です。
正規表現を使うことで、複雑なパターンを簡単にマッチさせることができます。最初は難しいかもしれませんが、何度も使っていくうちに必ず慣れていきます。