Wie können Computer effizient bestimmte Muster in riesigen Textmengen finden? Diese klassische Arbeit beschreibt eine Methode zum Auffinden von Zeichenketten, die in Text eingebettet sind, mithilfe regulärer Ausdrücke und diskutiert eine Implementierung dieser Methode in Form eines Compilers. Sie geht die grundlegende Herausforderung der Mustererkennung in der Informatik an. Der Compiler akzeptiert einen regulären Ausdruck als Quellsprache und erzeugt ein IBM 7094-Programm als Objektsprache. Das resultierende Objektprogramm akzeptiert dann den zu durchsuchenden Text als Eingabe und generiert jedes Mal ein Signal, wenn eine eingebettete Zeichenkette im Text mit dem regulären Ausdruck übereinstimmt. Die Arbeit präsentiert Beispiele, Probleme und Lösungen und ist somit eine grundlegende Ressource für das Verständnis von Suchalgorithmen für reguläre Ausdrücke. Diese Arbeit hat einen bleibenden Einfluss auf die Informatik und beeinflusst die Entwicklung zahlreicher Tools und Techniken für die Textverarbeitung und Datenanalyse.
Dieser Artikel, der in Communications of the ACM veröffentlicht wurde, steht in direktem Einklang mit dem Auftrag der Zeitschrift, innovative Techniken und Algorithmen für die Computerprogrammierung vorzustellen. Die Beschreibung eines Suchalgorithmus für reguläre Ausdrücke und seine Implementierung als Compiler ist für das Publikum der Zeitschrift, bestehend aus Informatikern und Softwareentwicklern, relevant.