Matrix-Kettenmultiplikation

Matrix-Kettenmultiplikation bezeichnet die Multiplikation von mehreren Matrizen. Da die Matrizenmultiplikation assoziativ ist, kann man dabei beliebig klammern. Dadurch wächst die Anzahl der möglichen Berechnungswege überpolynomial mit der Länge der Matrizenkette an. Mit der Methode der dynamischen Programmierung kann die Klammerung der Matrix-Kette optimiert werden, so dass die Gesamtanzahl arithmetischer Operationen minimiert wird. Der Algorithmus hat eine Laufzeit von O {\displaystyle O} ( n 3 ) {\displaystyle (n^{3})} .

Die Anzahl der möglichen Klammerungen für n {\displaystyle n} Matrizen lässt sich mit der Catalan-Zahl Cn-1 bestimmen.

Beispiel: Sei A {\displaystyle A} eine 10×30 Matrix, B {\displaystyle B} eine 30×5 Matrix und C {\displaystyle C} eine 5×60 Matrix. Dann gibt es zwei verschiedene Arten, das Matrizenprodukt A B C {\displaystyle ABC} zu klammern:

( A B ) C {\displaystyle (AB)C}
A ( B C ) {\displaystyle A(BC)}

Die Anzahl der grundlegenden Operationen berechnet sich wie folgt:

( A B ) C ( 10 30 5 ) + ( 10 5 60 ) = 1500 + 3000 = 4500 {\displaystyle (AB)C\rightarrow (10\cdot 30\cdot 5)+(10\cdot 5\cdot 60)=1500+3000=4500}
A ( B C ) ( 30 5 60 ) + ( 10 30 60 ) = 9000 + 18000 = 27000 {\displaystyle A(BC)\rightarrow (30\cdot 5\cdot 60)+(10\cdot 30\cdot 60)=9000+18000=27000}

Algorithmus

Der Algorithmus berechnet mittels dynamischer Programmierung eine Ergebnis-Matrix. Bei einer Kette A 0 A 1 A 2 A n 1 {\displaystyle A_{0}A_{1}A_{2}\ldots A_{n-1}} von n {\displaystyle n} Matrizen ist die Eingabe des Algorithmus die Sequenz s {\displaystyle s} der Dimensionspaare s = [ ( f i r s t d i m ( A i ) , s e c o n d d i m ( A i ) ) | 0 i < n ] {\displaystyle s=[({\mathit {firstdim}}(A_{i}),{\mathit {seconddim}}(A_{i}))|0\leq i<n]} , wobei die Funktion firstdim bzw. seconddim angewendet auf eine m × n {\displaystyle m\times n} -Matrix m {\displaystyle m} bzw. n {\displaystyle n} zurückgibt.

s [ 0..2 ] {\displaystyle s[0..2]} bezeichnet die Teilsequenz von s, die die ersten beiden Dimensionspaare enthält. Also ist s [ 0.. l e n g t h ( s ) ] = s {\displaystyle s[0..{\mathit {length}}(s)]=s} .

Der Algorithmus wird durch eine Matrix-Rekurrenz spezifiziert.

Initialisierung

M [ i , i + 2 ] = f i r s t d i m ( i ) s e c o n d d i m ( i + 1 ) f i r s t d i m ( i + 1 ) ,   0 i < l e n g t h ( s ) 1 {\displaystyle M[i,i+2]={\mathit {firstdim}}(i)\cdot {\mathit {seconddim}}(i+1)\cdot {\mathit {firstdim}}(i+1),~0\leq i<{\mathit {length}}(s)-1}

Für alle zwei Matrizen lange Ketten gibt es nur eine Möglichkeit der Klammerung.

Rekursion

M [ i , j ] = min i < k < j { M [ i , k ] + M [ k + 1 , j ] + f i r s t d i m ( i ) s e c o n d d i m ( j 1 ) f i r s t d i m ( k ) } {\displaystyle M[i,j]=\min _{i<k<j}{\big \{}M[i,k]+M[k+1,j]+{\mathit {firstdim}}(i)\cdot {\mathit {seconddim}}(j-1)\cdot {\mathit {firstdim}}(k){\big \}}} ,

wobei i + 2 < j , 0 i l e n g t h ( s ) , 0 j l e n g t h ( s ) {\displaystyle i+2<j,0\leq i\leq {\mathit {length}}(s),0\leq j\leq {\mathit {length}}(s)} .

In der Zelle M [ i , j ] {\displaystyle M[i,j]} steht die minimale Anzahl von grundlegenden arithmetischen Operationen, um die Teilsequenz s [ i . . j ] {\displaystyle s[i..j]} der Matrizenkette zu multiplizieren. Also ist die minimale Anzahl der Operationen bei der Multiplikation der gesamten Kette in der Zelle M [ 0 , l e n g t h ( s ) ] {\displaystyle M[0,{\mathit {length}}(s)]} gespeichert.

Um die optimale Klammerung zu konstruieren, die zu dem optimalen Ergebnis in M [ 0 , l e n g t h ( s ) ] {\displaystyle M[0,{\mathit {length}}(s)]} geführt hat, muss der Pfad in der DP-Matrix M {\displaystyle M} mittels Backtracking von M [ 0 , l e n g t h ( s ) ] {\displaystyle M[0,{\mathit {length}}(s)]} aus zurückverfolgt werden.

Effizienz

Die Länge der Eingabesequenz wird mit n {\displaystyle n} bezeichnet. Der Algorithmus benötigt zum Speichern der Zwischenergebnisse für alle Teilsequenzen eine quadratische n × n {\displaystyle n\times n} -Matrix. Also liegt der Speicherbedarf in O ( n 2 ) {\displaystyle O(n^{2})} .

Für jede Zelle muss über O ( n ) {\displaystyle O(n)} Aufteilungen optimiert werden. Also ist die Gesamtlaufzeit in O ( n 3 ) {\displaystyle O(n^{3})}

Varianten

Der Optimierungsalgorithmus ist für beliebige Sequenzen von Objekten verwendbar, welche durch eine assoziative Operation verkettet sind, wenn eine Kostenfunktion für die Ausführung der Operation existiert.

Durch eine einfache Modifikation der Rekurrenz kann die Anzahl der Klammerungen in O ( n 3 ) {\displaystyle O(n^{3})} berechnet werden.

Abgrenzung

Cormen, 2001 (S. 369), verweist auf einen Algorithmus von Hu und Shing[1] zur Optimierung der Klammerung bei der Matrix-Kettenmultiplikation, der eine Laufzeit von O ( n log n ) {\displaystyle O(n\log n)} hat.

Literatur

  • Thomas H. Cormen, Charles E. Leiserson, Ronald L. Rivest, Clifford Stein: Introduction to Algorithms. 2. Auflage. MIT Press, Cambridge MA 2001, ISBN 0-262-03293-7, S. 331–338. 
  • T. C. Hu, M. T. Shing: Computation of Matrix Chain Products. Part I. In: SIAM Journal on Computing. Band 11, Nr. 2, 1982, S. 362–373, doi:10.1137/0211028. 

Quellen

  1. Hu Shing, Computation of Matrix Chain Products, Part I, Part II. 1980, Report.