Einige Zeichen, die in regulären Ausdrücken spezielle Bedeutungen haben (wie *, +, ?), müssen in der Regel mit einem Escape-Zeichen (\) versehen werden, um ihre wörtliche Bedeutung zu erhalten. Zum Beispiel würde \., \\ usw. in einem regulären Ausdruck verwendet, um die Zeichen . und \ wörtlich zu interpretieren. Ein . bedeutet eigentlich "beliebiges Zeichen", ein ? wäre ein Lookaround und \ würde die Interpretation des nächsten Zeichen aufheben. =====Pseudo Overview===== Zeichenauswahl * . -> beliebiges Zeichen * .* -> beliebiges Zeichen, mehrmals * [a, b, c] -> a, b oder c * [0-9a-zA-Z] -> Beliebiges Zeichen von 0 bis 9, a bis z oder A - Z * [^a] -> Ein a am Anfang Zeichenklassen * \d -> Ziffer * \D -> Keine Ziffer * \w -> Buchstabe, Ziffer oder Unterstrich * \W -> Zeichen, das weder Buchstabe noch Ziffer noch Unterstrich ist * \s -> Leerzeichen * \S -> kein Leerzeichen Quantoren * ? -> Der voranstehende Ausdruck ist optional, er kann einmal vorkommen, braucht es aber nicht, das heißt, der Ausdruck kommt null- oder einmal vor. * + -> Der voranstehende Ausdruck muss mindestens einmal vorkommen, darf aber auch mehrfach vorkommen. * * -> Der voranstehende Ausdruck darf beliebig oft (auch keinmal) vorkommen. * {n} -> Der voranstehende Ausdruck muss exakt n-mal vorkommen. * {min,} -> Der voranstehende Ausdruck muss mindestens min-mal vorkommen. * {min, max} -> Der voranstehende Ausdruck muss mindestens min-mal und darf maximal max-mal vorkommen. * {0, max} -> Der voranstehende Ausdruck darf maximal max-mal vorkommen. Sonstige Steuerzeichen * ^ -> steht für den Zeilenanfang (nicht zu verwechseln mit ^ bei der Zeichenauswahl mittels [ und ]). * $ -> kann je nach Kontext für das Zeilen- oder Zeichenketten-Ende stehen, wobei bei manchen Implementierungen noch ein „\n“ folgen darf. Das tatsächliche Ende passt zu \z. * \ -> hebt gegebenenfalls die Metabedeutung des nächsten Zeichens auf (siehe Maskierungszeichen). Beispielsweise lässt der Ausdruck (A\*)+ die Zeichenketten „A*“, „A*A*“ usw. zu. Auf diese Weise lässt sich auch ein Punkt „.“ mit \. suchen, während nach \ mit \\ gesucht wird. * \b -> leere Zeichenkette am Wortanfang oder am Wortende * \B -> leere Zeichenkette, die nicht den Anfang oder das Ende eines Wortes bildet * \< -> leere Zeichenkette am Wortanfang * \> -> leere Zeichenkette am Wortende * \n -> ein Zeilenumbruch im Unix-Format * \r -> ein Zeilenumbruch im (alten, d. h. vor dem Jahr 1999) Mac-Format * \r\n -> ein Zeilenumbruch im DOS- und Windows-Format * \t -> ein Horizontal-Tabulatorzeichen