Temporal difference learning and TD-Gammon

Artikeleigenschaften
  • Sprache
    English
  • Veröffentlichungsdatum
    1995/03/01
  • Indian UGC (Zeitschrift)
  • Auffrischen
    16
  • Zitate
    416
  • Gerald Tesauro IBM Thomas J. Watson Research Center, P.O. Box 704, Yorktown Heights, NY
Abstrakt
Zitieren
Tesauro, Gerald. “Temporal Difference Learning and TD-Gammon”. Communications of the ACM, vol. 38, no. 3, 1995, pp. 58-68, https://doi.org/10.1145/203330.203343.
Tesauro, G. (1995). Temporal difference learning and TD-Gammon. Communications of the ACM, 38(3), 58-68. https://doi.org/10.1145/203330.203343
Tesauro G. Temporal difference learning and TD-Gammon. Communications of the ACM. 1995;38(3):58-6.
Journalkategorien
Science
Mathematics
Instruments and machines
Electronic computers
Computer science
Science
Mathematics
Instruments and machines
Electronic computers
Computer science
Computer software
Technology
Electrical engineering
Electronics
Nuclear engineering
Electronics
Computer engineering
Computer hardware
Beschreibung

Kann ein Computer lernen, Backgammon auf Weltklasseniveau zu spielen? Diese Arbeit untersucht die Anwendung von Temporal Difference (TD)-Lernen auf das Spiel Backgammon, was zur Entwicklung von TD-Gammon führt. Die Autoren diskutieren das Potenzial komplexer Brettspiele wie Schach und Backgammon als ideale Testfelder für künstliche Intelligenz und maschinelles Lernen. TD-Gammon wird als Pionierleistung in diesem Bereich vorgestellt. Der Erfolg von TD-Gammon demonstriert die Leistungsfähigkeit des Temporal Difference-Lernens bei der Bewältigung komplexer Aufgaben. Dieser Ansatz trägt zur Weiterentwicklung von Algorithmen für maschinelles Lernen bei, die in der Lage sind, in anspruchsvollen Bereichen Expertenleistungen zu erzielen. Die aus TD-Gammon gewonnenen Techniken und Erkenntnisse haben nachfolgende Forschungen im Bereich des Reinforcement Learning und des Spielens beeinflusst.

Die in Communications of the ACM veröffentlichte Arbeit untersucht das Temporal Difference-Lernen und seine Anwendung auf Backgammon und passt gut zu dem Fokus der Zeitschrift auf Fortschritte in der Informatik und künstlichen Intelligenz. Der Artikel fand wahrscheinlich Anklang bei den ACM-Lesern, die sich für Spielalgorithmen und Techniken des maschinellen Lernens interessieren.

Auffrischen
Zitate
Zitationsanalyse
Die erste Studie, die diesen Artikel zitiert hat, trug den Titel Strategic directions in artificial intelligence und wurde in 1996. veröffentlicht. Die aktuellste Zitierung stammt aus einer 2024 Studie mit dem Titel Strategic directions in artificial intelligence Seinen Höhepunkt an Zitierungen erreichte dieser Artikel in 2022 mit 57 Zitierungen.Es wurde in 262 verschiedenen Zeitschriften zitiert., 14% davon sind Open Access. Unter den verwandten Fachzeitschriften wurde diese Forschung am häufigsten von IEEE Access zitiert, mit 13 Zitierungen. Die folgende Grafik veranschaulicht die jährlichen Zitationstrends für diesen Artikel.
Zitate verwendeten diesen Artikel für Jahr