Strassen-Algorithmus

Der Strassen-Algorithmus (erfunden vom deutschen Mathematiker Volker Strassen) ist ein Algorithmus aus der Linearen Algebra und wird zur Matrizenmultiplikation verwendet. Der Strassen-Algorithmus realisiert die Matrizenmultiplikation asymptotisch effizienter als das Standardverfahren und ist in der Praxis schneller für große Matrizen (solche mit einem Rang größer als 1000).

Der Algorithmus

Vereinfachend wird der Spezialfall quadratischer Matrizen mit 2 k {\displaystyle 2^{k}} Zeilen bzw. Spalten betrachtet.

Seien also A , B R 2 k × 2 k {\displaystyle A,B\in R^{2^{k}\times 2^{k}}} Matrizen über einem Ring R {\displaystyle R} und ferner ihr Produkt C = A B R 2 k × 2 k {\displaystyle C=A\cdot B\in R^{2^{k}\times 2^{k}}} . Diese lassen sich auch als Blockmatrizen

A = ( A 1 , 1 A 1 , 2 A 2 , 1 A 2 , 2 ) , B = ( B 1 , 1 B 1 , 2 B 2 , 1 B 2 , 2 ) , C = ( C 1 , 1 C 1 , 2 C 2 , 1 C 2 , 2 ) {\displaystyle A={\begin{pmatrix}A_{1,1}&A_{1,2}\\A_{2,1}&A_{2,2}\end{pmatrix}},\qquad B={\begin{pmatrix}B_{1,1}&B_{1,2}\\B_{2,1}&B_{2,2}\end{pmatrix}},\qquad C={\begin{pmatrix}C_{1,1}&C_{1,2}\\C_{2,1}&C_{2,2}\end{pmatrix}}}

betrachten, wobei A i , j , B i , j , C i , j R 2 k 1 × 2 k 1 {\displaystyle A_{i,j},B_{i,j},C_{i,j}\in R^{2^{k-1}\times 2^{k-1}}} sind.

Für die Multiplikation von Blockmatrizen gilt:

C 1 , 1 = A 1 , 1 B 1 , 1 + A 1 , 2 B 2 , 1 {\displaystyle C_{1,1}=A_{1,1}\cdot B_{1,1}+A_{1,2}\cdot B_{2,1}}
C 1 , 2 = A 1 , 1 B 1 , 2 + A 1 , 2 B 2 , 2 {\displaystyle C_{1,2}=A_{1,1}\cdot B_{1,2}+A_{1,2}\cdot B_{2,2}}
C 2 , 1 = A 2 , 1 B 1 , 1 + A 2 , 2 B 2 , 1 {\displaystyle C_{2,1}=A_{2,1}\cdot B_{1,1}+A_{2,2}\cdot B_{2,1}}
C 2 , 2 = A 2 , 1 B 1 , 2 + A 2 , 2 B 2 , 2 {\displaystyle C_{2,2}=A_{2,1}\cdot B_{1,2}+A_{2,2}\cdot B_{2,2}}

Die direkte Berechnung der C i , j {\displaystyle C_{i,j}} benötigt also 8 {\displaystyle 8} (aufwändige) Matrizenmultiplikationen. Um diese Anzahl zu reduzieren, berechnet der Algorithmus von Strassen folgende Hilfsmatrizen:

M 1 := ( A 1 , 1 + A 2 , 2 ) ( B 1 , 1 + B 2 , 2 ) {\displaystyle M_{1}:=(A_{1,1}+A_{2,2})\cdot (B_{1,1}+B_{2,2})}
M 2 := ( A 2 , 1 + A 2 , 2 ) B 1 , 1 {\displaystyle M_{2}:=(A_{2,1}+A_{2,2})\cdot B_{1,1}}
M 3 := A 1 , 1 ( B 1 , 2 B 2 , 2 ) {\displaystyle M_{3}:=A_{1,1}\cdot (B_{1,2}-B_{2,2})}
M 4 := A 2 , 2 ( B 2 , 1 B 1 , 1 ) {\displaystyle M_{4}:=A_{2,2}\cdot (B_{2,1}-B_{1,1})}
M 5 := ( A 1 , 1 + A 1 , 2 ) B 2 , 2 {\displaystyle M_{5}:=(A_{1,1}+A_{1,2})\cdot B_{2,2}}
M 6 := ( A 2 , 1 A 1 , 1 ) ( B 1 , 1 + B 1 , 2 ) {\displaystyle M_{6}:=(A_{2,1}-A_{1,1})\cdot (B_{1,1}+B_{1,2})}
M 7 := ( A 1 , 2 A 2 , 2 ) ( B 2 , 1 + B 2 , 2 ) {\displaystyle M_{7}:=(A_{1,2}-A_{2,2})\cdot (B_{2,1}+B_{2,2})}

Zur Berechnung der M i {\displaystyle M_{i}} sind lediglich 7 {\displaystyle 7} Multiplikationen nötig, die C i j {\displaystyle C_{ij}} lassen sich nun durch Additionen (und Subtraktionen) ermitteln:

C 1 , 1 = M 1 + M 4 M 5 + M 7 {\displaystyle C_{1,1}=M_{1}+M_{4}-M_{5}+M_{7}}
C 1 , 2 = M 3 + M 5 {\displaystyle C_{1,2}=M_{3}+M_{5}}
C 2 , 1 = M 2 + M 4 {\displaystyle C_{2,1}=M_{2}+M_{4}}
C 2 , 2 = M 1 M 2 + M 3 + M 6 {\displaystyle C_{2,2}=M_{1}-M_{2}+M_{3}+M_{6}}

Für die Multiplikationen in der Berechnung der M i {\displaystyle M_{i}} wird obiges Verfahren rekursiv ausgeführt, bis das Problem auf die Multiplikation von Skalaren reduziert ist.

In der Praxis kann die gewöhnliche Multiplikation für kleine Matrizen durchaus schneller sein. Daher bietet sich ein Wechsel zur gewöhnlichen Multiplikation anstelle eines rekursiven Aufrufs an, sobald die Matrizendimensionen klein genug sind (Cut-Off).

Die linke Spalte repräsentiert eine 2 × 2 {\displaystyle 2\times 2} -Matrizenmultiplikation. Jede andere Spalte repräsentiert eine der 7 {\displaystyle 7} Multiplikationen des Strassen-Algorithmus.

Aufwand

Der Standardalgorithmus zur Matrizenmultiplikation benötigt

n log 2 8 = n 3 {\displaystyle n^{\log _{2}8}=n^{3}}

Multiplikationen der Elemente des Ringes R {\displaystyle R} . Die benötigten Additionen sind hierbei nicht in die Komplexitätsberechnung eingeflossen, Sie können, abhängig von R {\displaystyle R} , in Computerimplementationen viel schneller sein als die Multiplikationen. (Insbesondere bei gewöhnlichen ganzen oder Fließkommazahlen ist das oft der Fall.) Mit dem Strassen-Algorithmus wird die Anzahl der Multiplikationen auf

n log 2 7 n 2 , 807 {\displaystyle n^{\log _{2}7}\approx n^{2,807}}

reduziert. Die Reduktion der Anzahl der Multiplikationen führt allerdings zu einer Verringerung der numerischen Stabilität.[1]

Eine saubere Analyse einschließlich der Additionen ist mit dem Master-Theorem möglich: Die gewöhnliche Matrizenmultiplikation benötigt 2 n 3 n 2 O ( n 3 ) {\displaystyle 2n^{3}-n^{2}\in {\mathcal {O}}(n^{3})} Schritte (Multiplikationen und Additionen gleich gewichtet und zusammenaddiert). Dies gilt auch für den ganz oben erklärten naiven rekursiven Algorithmus, denn er erzeugt 8 Teilprobleme der Größe n 2 {\displaystyle {\frac {n}{2}}} und zudem sind 4 quadratische Matrizen der Seitenlänge n 2 {\displaystyle {\frac {n}{2}}} zu addieren, was einen zusätzlichen Aufwand von 4 ( n 2 ) 2 = n 2 {\displaystyle 4\cdot \left({\frac {n}{2}}\right)^{2}=n^{2}} nach sich zieht, also gilt für seine Laufzeit die Rekursion

T ( n ) = 8 T ( n 2 ) + n 2 {\displaystyle T(n)=8\cdot T\left({\frac {n}{2}}\right)+n^{2}}

was nach dem Master-Theorem T ( n ) Θ ( n log 2 8 ) = Θ ( n 3 ) {\displaystyle T(n)\in \Theta (n^{\log _{2}8})=\Theta (n^{3})} nach sich zieht.

Der Strassen-Algorithmus erzeugt hingegen jeweils nur sieben solche Teilprobleme, auch wenn dafür nun 18 Additionen oder Subtraktionen von Matrizen mit halber Seitenlänge, also 18 ( n 2 ) 2 = 9 2 n 2 {\displaystyle 18\cdot \left({\frac {n}{2}}\right)^{2}={\frac {9}{2}}\cdot n^{2}} Additionen/Subtraktionen einzelner Matrixeinträge in R {\displaystyle R} , erforderlich sind:

T ( n ) = 7 T ( n 2 ) + 9 2 n 2 {\displaystyle T(n)=7\cdot T\left({\frac {n}{2}}\right)+{\frac {9}{2}}\cdot n^{2}}

Mit dem Master-Theorem folgt T ( n ) Θ ( n log 2 7 ) {\displaystyle T(n)\in \Theta \left(n^{\log _{2}7}\right)} (mit log 2 7 2,807 {\displaystyle \log _{2}7\approx 2{,}807} ).

Literatur

  • Volker Strassen: Gaussian Elimination is not Optimal. In: Numerische Mathematik, Band 13, 1969, S. 354–356, ISSN 0029-599X, doi:10.1007/BF02165411.
  • Eric W. Weisstein: Strassen Formulas. In: MathWorld (englisch).

Einzelnachweise

  1. Webb Miller: Computational complexity and numerical stability. In: SIAM News. 4. Jahrgang, 1975, S. 97–107 (englisch, psu.edu [PDF]).