正規表現の基礎
正規表現とは、文字列のパターンを特殊な記号で表現したものです。
文字列の中に特定のパターンの文字列があるかどうか検索したり、文字列が特定の
フォーマットに合致しているかどうかを調べるとき使います。
正規表現で使われる特殊な文字(メタ文字):
. | 任意の一文字 |
^ | 先頭 |
$ | 末尾 |
[] | []の中のどれか。[abc]と書くと、aかbかcのどれか。 |
* | 直前の文字が0回以上 |
+ | 直前の文字が1回以上 |
? | 直前の文字が0回または1回 |
| | または |
() | 括弧内が一つの正規表現のグループになる |
{j,k} | j文字以上、k文字以下。{k,}は、k文字以上、{k}は、k文字を示す。 |
\(半角) | メタ文字を特殊な文字として扱わないようにする(例:\$と書くと末尾の意味が無くなり、文字列$として扱う) |
正規表現の例:
- [0-9] : 数字
- [^0-9] : 数字以外
- [a-zA-Z] : 小文字、大文字のアルファベット
- ^[0-9]{3}\-[0-9]{4}$ : 郵便番号