Können Datenbanksysteme im Zeitalter von Big Data die ständig wachsenden Informationsmengen effizient verarbeiten? Diese Studie untersucht Algorithmen zur Berechnung des Equijoins von zwei Relationen in Systemen mit großen Hauptspeichern mit dem Ziel, die Leistung in datenintensiven Umgebungen zu optimieren. Die Forschung schlägt neue Algorithmen vor und bewertet sie, die darauf ausgelegt sind, die Vorteile erhöhter Speicherkapazität für eine schnellere Datenverarbeitung zu nutzen. Die Arbeit stellt einen hybriden Algorithmus vor, der Hash-basierte Ansätze kombiniert und traditionelle Methoden wie Sort-Merge übertrifft, insbesondere wenn der verfügbare Speicher einen erheblichen Bruchteil der Datengröße ausmacht. Selbst in virtuellen Speicherumgebungen zeigt der hybride Algorithmus eine überlegene Leistung. Die Forscher beschreiben auch, wie Filter, Babb-Arrays und Semijoins - beliebte Werkzeuge zur Verbesserung der Join-Effizienz - in ihre Algorithmen integriert werden können, was Flexibilität für verschiedene Anwendungen bietet. Diese Fortschritte tragen zu den laufenden Bemühungen bei, Datenbanksysteme für die Bewältigung der Herausforderungen des modernen Datenmanagements zu optimieren.
Veröffentlicht in ACM Transactions on Database Systems, entspricht diese Studie direkt dem Fokus der Zeitschrift auf Datenbankmanagement und -optimierung. Durch die Untersuchung von Algorithmen für die Join-Verarbeitung in Systemen mit großem Speicher adressiert die Arbeit eine grundlegende Herausforderung in der Datenbankleistung und trägt zur laufenden Entwicklung effizienter Datenverarbeitungstechniken bei, einem wichtigen Interessengebiet für das Publikum der Zeitschrift.