正規表現(せいきひょうげん)は、文字列のパターンを表現するための方法です。プログラミングやデータ分析など、さまざまな場面で使われています。特に、テキストの検索や置換を簡単に行えるのが特徴です。
正規表現では、特定の部分をグループにまとめることができます。これを「グループ化」といいます。グループ化を行うことで、部分文字列を一緒に扱うことができます。
グループ化をするには、丸括弧「()」を使います。例えば、次のような正規表現を考えてみましょう。
/(foo|bar)/
この正規表現は、「foo」または「bar」という文字列にマッチします。このように、グループ化することで、複数の選択肢を簡単に指定できます。
キャプチャリングは、正規表現でマッチした部分を記録することを指します。これにより、後でその部分を再利用することができます。たとえば、特定の形式の日付から、年・月・日を取り出すといったことが可能です。
以下の正規表現を見てみましょう。
/(\d{4})-(\d{2})-(\d{2})/
この正規表現は、「2023-10-05」のような形式の日付にマッチします。ここで、各部分は次のようにキャプチャされます:
では、実際にグループ化とキャプチャリングを使ってみましょう。以下の例は、電子メールアドレスからユーザー名とドメインを抽出する方法です。
/([^@]+)@([^\.]+)/
この正規表現では、ユーザー名とドメイン名をそれぞれキャプチャします。たとえば、「user@example.com」というメールアドレスの場合、次のようにキャプチャされます:
正規表現のグループ化とキャプチャリングは、テキスト処理を行う上で非常に便利な機能です。少しずつ使い方を学んで、実際のプロジェクトに応用してみてください。