GONKURABE

だら科日記

C# 正規表現暗記メモ

よく使われるメタ文字。下記を参考にさせていただきました。

ありがとうございます。

正規表現の基本: .NET Tips: C#, VB.NET


25個。覚えよう…

12のパターン

  1. .   (ピリオド)
    改行文字以外の任意の一文字
  2. ¥s
    空白文字。改行、タブ、半角、全角スペース
  3. ¥d
    0 - 9までの数字。全角を含む。
  4. ¥w
    単語に使用される文字。アルファベット、数字、アンダーバー、ひらがな、カタカナ、漢字など。
  5. ¥r
    キャリッジリターン
  6. ¥n
    ラインフィード
  7. ¥t
    タブ
  8. ¥ほにゃらら
    ほにゃらら

  9. 内のどれか1文字。[abc]ならばaかbかc。
  10. [^]
    [^]内の文字 以外 の1文字。
  11. ¥u000
    4桁の16進数で会えラワされるUnicode文字
  12. ¥x00
    2桁の16進数で表されるASCII文字

文字列内で正規表現をあてる位置を表現する方法4つ

  1. ^ :文字列の先頭
  2. $ :文字列の末尾。末尾が改行文字の時はその前の文字と一致。
  3. ¥z  :文字列の末尾。末尾が改行文字の時でも一致させる。
  4. ¥b  :単語の境界と一致。ただし[]内で用いた時はバックスペース文字。

文字の繰り返しを表す文字(量指定子)5つ

  1. * :直前の文字が0回以上繰り返す
  2. + :直前の文字が1回以上繰り返す
  3. ? :直前の文字が0回または1回繰り返す
  4. {n,m}:直前の文字がn回以上m回以下繰り返す
  5. {n}  :直前の文字がn回繰り返す

テクニック:選択、グループ化など 2つ

  1. | :論理和
  2. ()  :グループ化する箇所

オプション 2つ

  1. IgnoreCase :大文字小文字を区別しない
  2. Singleline  :ピリオドの意味を変更し、¥nを含めたすべての文字と一致するようにする

その他:

  1. 最短マッチ:?を使う。パターンに一致する最短の文字列にヒットする
  2. 最長マッチ:デフォルト。

 

自分の暗記用メモでした。