正規表現(せいきひょうげん)は、文字列のパターンを表現するための強力なツールです。今回は、「選択」と「繰り返し」の表現方法について紹介します。
正規表現は、特定のパターンを持つ文字列を検索したり、置換したりするための式です。プログラミングやデータ処理の現場では非常に役立ちます。
選択は、複数のパターンの中からいずれかを選ぶために使います。正規表現では、選択をするために「|」(パイプ)記号を使用します。
例えば、次のような正規表現を考えてみましょう。
apple|orange|banana
この正規表現は、「apple」または「orange」または「banana」のいずれかにマッチします。どれか1つの単語が見つかれば、正規表現は成功です。
繰り返しは、特定の文字やパターンが連続している場合に使います。正規表現では、アスタリスク(*)やプラス(+)、中括弧({})を使用して表現します。
アスタリスクを使った繰り返しは、直前の文字やパターンが0回以上繰り返されることを意味します。例えば、次のようになります。
ab*
この正規表現は、「a」の後に「b」が0回以上続く文字列にマッチします。「a」だけでも、また「ab」、「abb」なども見つかります。
プラスは、直前の文字やパターンが1回以上繰り返されることを意味します。次の例を見てみましょう。
ab+
これは「a」の後に「b」が1回以上続く文字列にマッチします。「a」単体ではマッチせず、「ab」や「abb」などにはマッチします。
繰り返しの回数を指定するには、中括弧を使います。例えば、次のように書きます。
a{2,4}
この正規表現は、「a」が2回から4回続く文字列にマッチします。「aa」、「aaa」、「aaaa」はOKですが、「a」や「aaaaa」にはマッチしません。
正規表現の「選択」と「繰り返し」は、文字列を柔軟に扱うためにとても重要な機能です。これらの基本を理解することで、さらに複雑なパターンも扱うことができるようになります。