Lexikon der Mathematik: Oja-Lernregel
eine spezielle Lernregel im Bereich Neuronale Netze, die von Erkki Oja zu Beginn der achtziger Jahre publik gemacht wurde.
Die Oja-Lernregel läßt sich grob als ein Spezialfall der Kohonen-Lernregel deuten, wobei lediglich ein Klassifizierungsvektor, nämlich der sogenannte erste Hauptkomponentenvektor, zu bestimmen ist, und zusätzlich eine auf dem Gradientenverfahren beruhende Strategie zum Einsatz kommt.
Im folgenden wird das Prinzip der Oja-Lernregel an einem einfachen Beispiel (diskrete Variante) erläutert: Für eine endliche Menge von t Vektoren x(s) ∈ ℝn\{0}, 1 ≤ s ≤ t, soll ein Vektor w ∈ ℝn\{0} gefunden werden, der von allen gegebenen Vektoren im Mittel den geringsten Abstand hat, wobei hier der Abstand über die nichtorientierten Winkel zwischen den durch w und den Vektoren x(s) gegebenen Geraden durch den Ursprung bestimmt werden soll.
Diese Forderung bedeutet, daß der Vektor w ∈ ℝn \ {0} so gewählt werden sollte, daß für alle s ∈ {1, …, t} die Quotienten
Die sukzessive Anwendung des obigen Verfahrens auf alle vorhandenen Quotientenfunktionen Q(s), 1 ≤ s ≤ t, und anschließende Iteration bezeichnet man nun als Oja-Lernregel. Normiert man ferner den Vektor w nach jedem Iterationsschritt auf Länge 1 (Konsequenz: (w·w) = 1), und denkt sich den Faktor
Würde man schlißslich bei der Herleitung der Oja-Lernregel anstelle der sukzessiven Betrachtung der t Quotientenfunktionen Q(s), 1 ≤ s ≤ t, direkt die Summe über alle t zu maximierenden Quotienten heranziehen,
Die On-Line-Variante hat den Vorteil, daß keine w-Vektor-Korrekturen zwischengespeichert werden müssen sowie eine zufällige, nichtdeterministische Reihenfolge der zu klassifizierenden Trainingswerte erlaubt ist (stochastisches Lernen). Sie hat jedoch den Nachteil, daß nach einem Lernzyklus, d. h. nach Präsentation aller t zu klassifizierenden Trainingswerte, die Funktion Q auch für beliebig kleines λ > 0 nicht unbedingt zugenommen haben muß bei jedem Teilschritt wird zwar Q(s) im allgemeinen größer, die übrigen Quotientenfunktionen Q(r), r ≠ s, können jedoch abnehmen.
Trotz dieser Problematik hat sich die On-Line-Variante in der Praxis bewährt und wird i. allg. der rechen- und speicherintensiveren Off-Line-Variante vorgezogen.
Wenn Sie inhaltliche Anmerkungen zu diesem Artikel haben, können Sie die Redaktion per E-Mail informieren. Wir lesen Ihre Zuschrift, bitten jedoch um Verständnis, dass wir nicht jede beantworten können.