A vector space model for automatic indexing

Artikeleigenschaften
  • Sprache
    English
  • Veröffentlichungsdatum
    1975/11/01
  • Indian UGC (Zeitschrift)
  • Auffrischen
    7
  • Zitate
    1,990
  • G. Salton Cornell Univ., Ithaca, NY
  • A. Wong Cornell Univ., Ithaca, NY
  • C. S. Yang Cornell Univ., Ithaca, NY
Abstrakt
Zitieren
Salton, G., et al. “A Vector Space Model for Automatic Indexing”. Communications of the ACM, vol. 18, no. 11, 1975, pp. 613-20, https://doi.org/10.1145/361219.361220.
Salton, G., Wong, A., & Yang, C. S. (1975). A vector space model for automatic indexing. Communications of the ACM, 18(11), 613-620. https://doi.org/10.1145/361219.361220
Salton G, Wong A, Yang CS. A vector space model for automatic indexing. Communications of the ACM. 1975;18(11):613-20.
Journalkategorien
Science
Mathematics
Instruments and machines
Electronic computers
Computer science
Science
Mathematics
Instruments and machines
Electronic computers
Computer science
Computer software
Technology
Electrical engineering
Electronics
Nuclear engineering
Electronics
Computer engineering
Computer hardware
Beschreibung

Können Raumdichteberechnungen die Dokumentenindizierung optimieren? Diese Forschung schlägt einen neuen Ansatz zur automatischen Indizierung für die Dokumentenabfrage und das Mustervergleich vor, der sich auf Raumdichteberechnungen konzentriert, um das Indizierungsvokabular zu verbessern. Das Modell postuliert, dass eine optimale Indizierung erfolgt, wenn Entitäten im Indizierungsraum maximal getrennt sind, was impliziert, dass der Wert des Indizierungssystems umgekehrt mit der Objektdichter variiert. Ein Algorithmus, der auf Raumdichteberechnungen basiert, wird dann verwendet, um ein optimales Indizierungsvokabular für eine Sammlung von Dokumenten auszuwählen. Es werden Ergebnisse präsentiert, die den Nutzen des Modells demonstrieren. Diese Ergebnisse haben Auswirkungen auf die Informationsabfrage, das Design von Suchmaschinen und Text-Mining-Anwendungen. Die Studie bietet wertvolle Einblicke zur Optimierung von Indizierungssystemen, indem die räumliche Verteilung von Dokumenten und Suchanfragen im Indizierungsraum berücksichtigt wird.

Dieses in Communications of the ACM veröffentlichte Paper ist relevant für den Fokus des Journals auf Informatik, Informationssysteme und Kommunikationstechnologien. Das Journal betont eine effektive Kommunikation. Durch die Behandlung der automatischen Indizierung und der Auswahl des Vokabulars stimmt der Artikel mit den Themen des Journals bezüglich der effizienten Informationsverwaltung und -abfrage überein. Die Analyse der Zitate und Referenzen könnte seine Verbindungen zu anderen verwandten Arbeiten aufdecken, die in der ACM-Community veröffentlicht wurden.

Auffrischen
Zitate
Zitationsanalyse
Die erste Studie, die diesen Artikel zitiert hat, trug den Titel A distance measure for automatic document classification by sequential analysis und wurde in 1978. veröffentlicht. Die aktuellste Zitierung stammt aus einer 2024 Studie mit dem Titel A distance measure for automatic document classification by sequential analysis Seinen Höhepunkt an Zitierungen erreichte dieser Artikel in 2019 mit 150 Zitierungen.Es wurde in 685 verschiedenen Zeitschriften zitiert., 14% davon sind Open Access. Unter den verwandten Fachzeitschriften wurde diese Forschung am häufigsten von Expert Systems with Applications zitiert, mit 64 Zitierungen. Die folgende Grafik veranschaulicht die jährlichen Zitationstrends für diesen Artikel.
Zitate verwendeten diesen Artikel für Jahr