正規表現(せいきひょうげん)とは、文字列のパターンを表現するための特別な記法です。特定の文字列を探したり、置き換えたりするのにとても便利です。正規表現を使いこなせるようになると、データの処理がグッと楽になります。
アンカーは、正規表現の中で文字列の位置を示す記号です。具体的には、開始位置と終了位置を指定できます。これを使うことで、文字列の先頭や末尾を対象にした検索が可能になります。
正規表現における「^」は、文字列の始まりを示します。たとえば、次のように使用します。
^abc
この正規表現は、「abc」で始まる文字列にマッチします。例えば、「abcdef」や「abc123」はマッチしますが、「123abc」や「xyzabc」にはマッチしません。
次に、「$」は文字列の終わりを示します。以下の例を見てみましょう。
xyz$
この正規表現は、「xyz」で終わる文字列にマッチします。たとえば、「abcxyz」や「123xyz」はマッチしますが、「xyzabc」や「xyz123」にはマッチしません。
例えば、名前のリストがある場合、その中から「山田」で始まる人の名前を見つけたいときは次のように書きます。
^山田
これで、「山田太郎」や「山田花子」などがマッチします。
また、特定の拡張子(例:.txt)で終わるファイル名を探したいときは、次のように書きます。
\.txt$
これで、たとえば「document.txt」や「notes.txt」がマッチし、「image.png」や「archive.zip」にはマッチしません。
正規表現のアンカーは、文字列の開始や終了位置を簡単に指定できる強力なツールです。これを使うことで、特定のパターンの文字列を見つけることができます。ぜひ練習して、自分のプログラムやデータ処理に役立ててみてください!