正規表現パターンとテスト文字列を入力すると、リアルタイムでマッチハイライト、キャプチャグループ、マッチ詳細が表示されます。JavaScriptの正規表現構文をサポートしています。
正規表現(regex または regexp)は、ほぼすべてのプログラミング言語、テキストエディタ、コマンドラインツールで使用される強力なパターンマッチングシーケンスです。基本的には、文字列がどのような形であるべきかを指定し、正確な文字を列挙するのではなく記述できます。単一の正規表現パターンは数千もの異なる文字列にマッチします。例えば、パターン \d{3}-\d{3}-\d{4} は、実際の数字に関係なく 555-123-4567 のような米国電話番号形式にマッチします。これにより、データ検証、テキスト解析、検索置換、ウェブスクレイピングなどに正規表現は不可欠です。
正規表現の構文は複雑になることがありますが、主要なコアパターンをいくつか覚えておけば、実務上のほとんどのニーズに対応できます。メールアドレスの検証には通常 [a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,} が使用されますが、本番環境では完全な RFC 準拠のためにライブラリを使用すべきです。URL のマッチングは一般に https?://[^\s]+ で始まります。テキストから数値を抽出するには \d+(\.\d+)? が整数と小数の両方を捕捉します。文字クラス(\d, \w, \s)、量指定子(+, *, ?, {n,m})、アンカー(^, $, \b)を学べば、テキスト処理タスクの大部分に対応できる十分な構成要素が手に入ります。
正規表現で最も一般的なミスは、貪欲量指定子による過剰マッチや不足マッチです。デフォルトでは .* は貪欲で、可能な限り多くのテキストを消費します。? を付けると非貪欲になり(.*?)、最短の文字列にマッチします。常にエッジケース(空文字列、特殊文字を含む文字列、パターンがマッチすべきでない文字列)でパターンをテストしてください。このオンラインテスターは完全にブラウザ上で動作するため、データはサーバーに送信されず、機密テキストのテストにも安全です。global フラグを使用してすべてのマッチを取得し、キャプチャグループに注意して必要なデータだけを抽出できるようにしましょう。