正規表現でのアンカー（開始・終了位置）の使い方

2024/08/07

2024/08/07

正規表現とは？

正規表現（せいきひょうげん）とは、文字列のパターンを表現するための特別な記法です。特定の文字列を探したり、置き換えたりするのにとても便利です。正規表現を使いこなせるようになると、データの処理がグッと楽になります。

アンカーは、正規表現の中で文字列の位置を示す記号です。具体的には、開始位置と終了位置を指定できます。これを使うことで、文字列の先頭や末尾を対象にした検索が可能になります。

正規表現における「^」は、文字列の始まりを示します。たとえば、次のように使用します。

^abc

この正規表現は、「abc」で始まる文字列にマッチします。例えば、「abcdef」や「abc123」はマッチしますが、「123abc」や「xyzabc」にはマッチしません。

次に、「$」は文字列の終わりを示します。以下の例を見てみましょう。

xyz$

この正規表現は、「xyz」で終わる文字列にマッチします。たとえば、「abcxyz」や「123xyz」はマッチしますが、「xyzabc」や「xyz123」にはマッチしません。

例えば、名前のリストがある場合、その中から「山田」で始まる人の名前を見つけたいときは次のように書きます。

^山田

これで、「山田太郎」や「山田花子」などがマッチします。

また、特定の拡張子（例：.txt）で終わるファイル名を探したいときは、次のように書きます。

\.txt$

これで、たとえば「document.txt」や「notes.txt」がマッチし、「image.png」や「archive.zip」にはマッチしません。

正規表現のアンカーは、文字列の開始や終了位置を簡単に指定できる強力なツールです。これを使うことで、特定のパターンの文字列を見つけることができます。ぜひ練習して、自分のプログラムやデータ処理に役立ててみてください！

この記事はAIを使用して作成されています。