Automated learning of decision rules for text categorization

Artikeleigenschaften
  • Sprache
    English
  • Veröffentlichungsdatum
    1994/07/01
  • Indian UGC (Zeitschrift)
  • Auffrischen
    24
  • Zitate
    211
  • Chidanand Apté IBM T. J. Watson Research Center, Yorktown Heights, NY
  • Fred Damerau IBM T. J. Watson Research Center, Yorktown Heights, NY
  • Sholom M. Weiss Rutgers Univ., New Brunswick, NJ
Abstrakt
Zitieren
Apté, Chidanand, et al. “Automated Learning of Decision Rules for Text Categorization”. ACM Transactions on Information Systems, vol. 12, no. 3, 1994, pp. 233-51, https://doi.org/10.1145/183422.183423.
Apté, C., Damerau, F., & Weiss, S. M. (1994). Automated learning of decision rules for text categorization. ACM Transactions on Information Systems, 12(3), 233-251. https://doi.org/10.1145/183422.183423
Apté C, Damerau F, Weiss SM. Automated learning of decision rules for text categorization. ACM Transactions on Information Systems. 1994;12(3):233-51.
Journalkategorien
Science
Mathematics
Instruments and machines
Electronic computers
Computer science
Science
Science (General)
Cybernetics
Information theory
Technology
Electrical engineering
Electronics
Nuclear engineering
Telecommunication
Technology
Technology (General)
Industrial engineering
Management engineering
Information technology
Beschreibung

Können Maschinen lernen, Texte so gut wie Menschen zu kategorisieren? Diese Studie präsentiert umfangreiche Experimente zu automatisierten, regelbasierten Induktionsmethoden für große Dokumentsammlungen, mit dem Ziel, Klassifizierungsmuster für die Dokumentenkategorisierung und personalisierte Filterung zu entdecken. Die Forschung zeigt, dass maschinell erzeugte Entscheidungsregeln eine Leistung erzielen können, die mit von Menschen entwickelten Systemen vergleichbar ist, wobei dieselbe regelbasierte Darstellung verwendet wird. Die Ergebnisse auf dem Reuters Collection Benchmark zeigen einen signifikanten Leistungszuwachs im Vergleich zu anderen Techniken des maschinellen Lernens und erreichen einen Recall/Precision-Breakeven-Punkt von 80,5 %, eine deutliche Verbesserung gegenüber den zuvor berichteten 67 %. Die Studie untersucht auch methodische Alternativen, einschließlich universeller versus lokaler Wörterbücher und binärer versus frequenzbezogener Merkmale, im Kontext hochdimensionaler Merkmalsräume. Diese Arbeit unterstreicht das Potenzial des maschinellen Lernens zur Automatisierung von Textkategorisierungsaufgaben, wodurch der Bedarf an umfangreicher menschlicher Beteiligung reduziert wird. Diese Ergebnisse haben Auswirkungen auf die Informationsbeschaffung, das Dokumentenmanagement und die Entwicklung intelligenter Systeme.

Diese Forschung wurde in den ACM Transactions on Information Systems veröffentlicht und steht im Einklang mit dem Fokus der Zeitschrift auf Informationsbeschaffung, Textverarbeitung und intelligente Systeme. Durch die Vorstellung eines automatisierten Ansatzes zur Textkategorisierung trägt die Studie zur Weiterentwicklung von Informationstechnologien und deren Anwendungen bei, was für den Umfang der Zeitschrift von zentraler Bedeutung ist.

Auffrischen
Zitate
Zitationsanalyse
Die erste Studie, die diesen Artikel zitiert hat, trug den Titel Optimized rule induction und wurde in 1993. veröffentlicht. Die aktuellste Zitierung stammt aus einer 2024 Studie mit dem Titel Optimized rule induction Seinen Höhepunkt an Zitierungen erreichte dieser Artikel in 2022 mit 13 Zitierungen.Es wurde in 127 verschiedenen Zeitschriften zitiert., 7% davon sind Open Access. Unter den verwandten Fachzeitschriften wurde diese Forschung am häufigsten von Expert Systems with Applications zitiert, mit 12 Zitierungen. Die folgende Grafik veranschaulicht die jährlichen Zitationstrends für diesen Artikel.
Zitate verwendeten diesen Artikel für Jahr