Separating Style and Content with Bilinear Models

Artikeleigenschaften
  • Sprache
    English
  • Veröffentlichungsdatum
    2000/06/01
  • Zeitschrift
  • Indian UGC (Zeitschrift)
  • Auffrischen
    25
  • Zitate
    286
  • Joshua B. Tenenbaum Department of Brain and Cognitive Sciences, Massachusetts Institute of Technology, Cambridge, MA 02139, U.S.A.
  • William T. Freeman MERL, a Mitsubishi Electric Research Lab, 201 Broadway, Cambridge, MA 02139, U.S.A.
Abstrakt
Zitieren
Tenenbaum, Joshua B., and William T. Freeman. “Separating Style and Content With Bilinear Models”. Neural Computation, vol. 12, no. 6, 2000, pp. 1247-83, https://doi.org/10.1162/089976600300015349.
Tenenbaum, J. B., & Freeman, W. T. (2000). Separating Style and Content with Bilinear Models. Neural Computation, 12(6), 1247-1283. https://doi.org/10.1162/089976600300015349
Tenenbaum JB, Freeman WT. Separating Style and Content with Bilinear Models. Neural Computation. 2000;12(6):1247-83.
Journalkategorien
Medicine
Internal medicine
Neurosciences
Biological psychiatry
Neuropsychiatry
Science
Mathematics
Instruments and machines
Electronic computers
Computer science
Technology
Electrical engineering
Electronics
Nuclear engineering
Electronics
Technology
Mechanical engineering and machinery
Beschreibung

Können Computer lernen, Stil von Inhalt zu unterscheiden, wie es Menschen tun? Diese Forschung stellt ein Rechenmodell zur Trennung von 'Inhalt' von 'Stil' in Wahrnehmungssystemen unter Verwendung bilinearer Modelle vor. Wahrnehmungssysteme trennen routinemäßig 'Inhalt' von 'Stil', klassifizieren vertraute Wörter, die in einem ungewohnten Akzent gesprochen werden, identifizieren eine Schriftart oder einen Handschriftstil über Buchstaben hinweg oder erkennen ein vertrautes Gesicht oder Objekt unter ungewohnten Betrachtungsbedingungen. Der allgemeine Rahmen löst Zwei-Faktor-Aufgaben mithilfe bilinearer Modelle und kann mithilfe effizienter Algorithmen basierend auf Singularwertzerlegung und Erwartungsmaximierung an Daten angepasst werden. Er bietet ausdrucksstarke Darstellungen von Faktorinteraktionen unter Beibehaltung der rechnerischen Handhabbarkeit. Bestehende Faktormodelle (Mardia, Kent & Bibby, 1979; Hinton & Zemel, 1994; Ghahramani, 1995; Bell & Sejnowski, 1995; Hinton, Dayan, Frey & Neal, 1995; Dayan, Hinton, Neal & Zemel, 1995; Hinton & Ghahramani, 1997) sind entweder nicht ausreichend reichhaltig, um die komplexen Wechselwirkungen von perzeptuell bedeutsamen Faktoren wie Phonem und Sprecherakzent oder Buchstabe und Schriftart zu erfassen, oder lassen keine effizienten Lernalgorithmen zu. Das Modell wird in drei Wahrnehmungsbereichen getestet: Klassifizierung gesprochener Vokale, Schriftextrapolation und Gesichtsbeleuchtungstranslation. Das Modell bietet ein leistungsstarkes Werkzeug für maschinelles Lernen und künstliche Intelligenz mit potenziellen Anwendungen von der Spracherkennung bis zur Bildverarbeitung.

Diese in Neural Computation veröffentlichte Arbeit steht im Einklang mit dem Fokus der Zeitschrift auf theoretische und rechnerische Ansätze zum Verständnis neuronaler und kognitiver Prozesse. Die Entwicklung und Anwendung bilinearer Modelle zur Trennung von Stil und Inhalt trägt zum Verständnis des perzeptuellen Lernens und der Repräsentation bei.

Auffrischen
Zitate
Zitationsanalyse
Die erste Studie, die diesen Artikel zitiert hat, trug den Titel Parametric hidden Markov models for gesture recognition und wurde in 1999. veröffentlicht. Die aktuellste Zitierung stammt aus einer 2024 Studie mit dem Titel Parametric hidden Markov models for gesture recognition Seinen Höhepunkt an Zitierungen erreichte dieser Artikel in 2021 mit 29 Zitierungen.Es wurde in 120 verschiedenen Zeitschriften zitiert., 18% davon sind Open Access. Unter den verwandten Fachzeitschriften wurde diese Forschung am häufigsten von IEEE Transactions on Pattern Analysis and Machine Intelligence zitiert, mit 18 Zitierungen. Die folgende Grafik veranschaulicht die jährlichen Zitationstrends für diesen Artikel.
Zitate verwendeten diesen Artikel für Jahr