正規表現でのグループ化とキャプチャリングの使い方

2024/08/07
x-logoline-logo

正規表現でのグループ化とキャプチャリングの使い方

2024/08/07
x-logoline-logo
PR

正規表現とは?

正規表現(せいきひょうげん)は、文字列のパターンを表現するための方法です。プログラミングやデータ分析など、さまざまな場面で使われています。特に、テキストの検索や置換を簡単に行えるのが特徴です。

グループ化とは?

正規表現では、特定の部分をグループにまとめることができます。これを「グループ化」といいます。グループ化を行うことで、部分文字列を一緒に扱うことができます。

グループ化の基本的な書き方

グループ化をするには、丸括弧「()」を使います。例えば、次のような正規表現を考えてみましょう。

/(foo|bar)/

この正規表現は、「foo」または「bar」という文字列にマッチします。このように、グループ化することで、複数の選択肢を簡単に指定できます。

キャプチャリングとは?

キャプチャリングは、正規表現でマッチした部分を記録することを指します。これにより、後でその部分を再利用することができます。たとえば、特定の形式の日付から、年・月・日を取り出すといったことが可能です。

キャプチャリングの例

以下の正規表現を見てみましょう。

/(\d{4})-(\d{2})-(\d{2})/

この正規表現は、「2023-10-05」のような形式の日付にマッチします。ここで、各部分は次のようにキャプチャされます:

  • 1つ目のグループ(\d{4}):年(例:「2023」)
  • 2つ目のグループ(\d{2}):月(例:「10」)
  • 3つ目のグループ(\d{2}):日(例:「05」)

実際の使用例

では、実際にグループ化とキャプチャリングを使ってみましょう。以下の例は、電子メールアドレスからユーザー名とドメインを抽出する方法です。

/([^@]+)@([^\.]+)/

この正規表現では、ユーザー名とドメイン名をそれぞれキャプチャします。たとえば、「user@example.com」というメールアドレスの場合、次のようにキャプチャされます:

  • ユーザー名:user
  • ドメイン名:example

まとめ

正規表現のグループ化とキャプチャリングは、テキスト処理を行う上で非常に便利な機能です。少しずつ使い方を学んで、実際のプロジェクトに応用してみてください。

この記事はAIを使用して作成されています。
PR