Können Computer Sprache wirklich verstehen? Diese Studie befasst sich mit dem Problem der lexikalischen Mehrdeutigkeit, bei dem Wörter mehrere Bedeutungen haben können, im Kontext der Informationsbeschaffung (IR). Das Ausmaß der lexikalischen Mehrdeutigkeit in IR-Testsammlungen wurde analysiert und ihre Auswirkungen auf IR-Systeme wurden untersucht. Die Analyse wurde durchgeführt, um den Nutzen von Wortbedeutungen für die Trennung relevanter von nicht relevanten Dokumenten zu bestimmen. Es wurden Experimente durchgeführt, um den Nutzen von Wortbedeutungen für die Trennung relevanter von nicht relevanten Dokumenten zu bestimmen. Die Experimente zeigen, dass selbst in einer spezialisierten Datenbank eine beträchtliche Mehrdeutigkeit besteht. Wortbedeutungen bieten eine signifikante Trennung zwischen relevanten und nicht relevanten Dokumenten. Die Auflösung lexikalischer Mehrdeutigkeit hat wenig Auswirkungen auf die Abrufeffektivität für Dokumente, die viele Wörter mit der Abfrage gemeinsam haben. Andere Verwendungen der Wortsinndisambiguierung in einem Informationsabrufkontext werden diskutiert. Die Forschung trägt zu den laufenden Bemühungen bei, die Relevanz und Genauigkeit von Informationsabrufsystemen zu verbessern, indem sie eine grundlegende Herausforderung in der Verarbeitung natürlicher Sprache angeht.
Diese Arbeit steht im Einklang mit den Zielen von ACM Transactions on Information Systems, da sie die Herausforderung der lexikalischen Mehrdeutigkeit beim Informationsabruf angeht. Durch die Bewertung der Auswirkungen von Wortbedeutungen auf die Leistung von IR-Systemen trägt die Studie zum Fokus der Zeitschrift auf das Design, die Entwicklung und die Bewertung von Informationssystemen bei, wobei der Schwerpunkt auf der Verbesserung des Informationszugangs und -abrufs liegt.