矩阵乘法

“纵向的一条线（column）”的各地常用名称
中国大陆	列
台湾	行

“横向的一条线（row）”的各地常用名称
中国大陆	行
台湾	列

线性代数
	向量 · 向量空间 · 基底 · 行列式 · 矩阵
向量
	标量 · 向量 · 向量空间 · 向量投影 · 外积（向量积 · 七维向量积） · 内积（数量积） · 二重向量
矩阵与行列式
	矩阵 · 行列式 · 线性方程组 · 秩 · 核 · 迹 · 单位矩阵 · 初等矩阵 · 方块矩阵 · 分块矩阵 · 三角矩阵 · 非奇异方阵 · 转置矩阵 · 逆矩阵 · 对角矩阵 · 可对角化矩阵 · 对称矩阵 · 反对称矩阵 · 正交矩阵 · 幺正矩阵 · 埃尔米特矩阵 · 反埃尔米特矩阵 · 正规矩阵 · 伴随矩阵 · 余因子矩阵 · 共轭转置 · 正定矩阵 · 幂零矩阵 · 矩阵分解（LU分解 · 奇异值分解 · QR分解 · 极分解 · 特征分解） · 子式和余子式 · 拉普拉斯展开 · 克罗内克积
线性空间与线性变换
	线性空间 · 线性变换 · 线性子空间 · 线性生成空间 · 基 · 线性映射 · 线性投影 · 线性无关 · 线性组合 · 线性泛函 · 行空间与列空间 · 对偶空间 · 正交 · 特征向量 · 最小二乘法 · 格拉姆-施密特正交化
	查; 论; 编;

数学中，矩阵乘法（英语：matrix multiplication）是一种根据两个矩阵得到第三个矩阵的二元运算，第三个矩阵即前两者的乘积，称为矩阵积（英语：matrix product）。设 $A$ 是 $n\times m$ 的矩阵， $B$ 是 $m\times p$ 的矩阵，则它们的矩阵积 $AB$ 是 $n\times p$ 的矩阵。 $A$ 中每一行的 $m$ 个元素都与 $B$ 中对应列的 $m$ 个元素对应相乘，这些乘积的和就是 $AB$ 中的一个元素。

矩阵可以用来表示线性映射，矩阵积则可以用来表示线性映射的复合。因此，矩阵乘法是线性代数的基础工具，不仅在数学中有大量应用，在应用数学、物理学、工程学等领域也有广泛使用。^[1]^[2]

一般矩阵乘积[编辑]

矩阵相乘最重要的方法是一般矩阵乘积。它只有在第一个矩阵的列数（column，中国大陆作列数，台湾作行数）和第二个矩阵的行数（row，中国大陆作行数，台湾作列数）相同时才有定义。一般单指矩阵乘积时，指的便是一般矩阵乘积。若 $A$ 为 $m\times n$ 矩阵， $B$ 为 $n\times p$ 矩阵，则他们的乘积 $AB$ (有时记做 $A\cdot B$ ）会是一个 $m\times p$ 矩阵。其乘积矩阵的元素如下面式子得出：

(AB)_{ij}=\sum _{r=1}^{n}a_{ir}b_{rj}=a_{i1}b_{1j}+a_{i2}b_{2j}+\cdots +a_{in}b_{nj}

以上是用矩阵单元的代数系统来说明这类乘法的抽象性质。本节以下各种运算法都是这个公式的不同角度理解，运算结果相等：

由定义直接计算[编辑]

左边的图表示出要如何计算 $AB$ 的 $(1,2)$ 和 $(3,3)$ 元素，当 $A$ 是个 $4\times 2$ 矩阵和B是个 $2\times 3$ 矩阵时。分别来自两个矩阵的元素都依箭头方向而两两配对，把每一对中的两个元素相乘，再把这些乘积加总起来，最后得到的值即为箭头相交位置的值。

(AB)_{1,2}=\sum _{r=1}^{2}a_{1,r}b_{r,2}=a_{1,1}b_{1,2}+a_{1,2}b_{2,2}

(AB)_{3,3}=\sum _{r=1}^{2}a_{3,r}b_{r,3}=a_{3,1}b_{1,3}+a_{3,2}b_{2,3}

向量方法[编辑]

这种矩阵乘积亦可由稍微不同的观点来思考：把向量和各系数相乘后相加起来。设 $\mathbf {A}$ 和 $\mathbf {B}$ 是两个给定如下的矩阵：

\mathbf {A} ={\begin{bmatrix}a_{1,1}&a_{1,2}&\dots \\a_{2,1}&a_{2,2}&\dots \\\vdots &\vdots &\ddots \end{bmatrix}}={\begin{bmatrix}A_{1}&A_{2}&\dots \end{bmatrix}},

\mathbf {B} ={\begin{bmatrix}b_{1,1}&b_{1,2}&\dots \\b_{2,1}&b_{2,2}&\dots \\\vdots &\vdots &\ddots \end{bmatrix}}={\begin{bmatrix}B_{1}\\B_{2}\\\vdots \end{bmatrix}}

其中

A_{1}

是由所有

a_{x,1}

元素所组成的向量(column)，

A_{2}

是由所有

a_{x,2}

元素所组成的向量，以此类推。

B_{1}

是由所有

b_{1,x}

元素所组成的向量(row)，

B_{2}

是由所有

b_{2,x}

元素所组成的向量，以此类推。

则

\mathbf {AB} ={\begin{bmatrix}a_{1,1}{\begin{bmatrix}b_{1,1}&b_{1,2}&\dots \end{bmatrix}}+a_{1,2}{\begin{bmatrix}b_{2,1}&b_{2,2}&\dots \end{bmatrix}}+\cdots \\\\a_{2,1}{\begin{bmatrix}b_{1,1}&b_{1,2}&\dots \end{bmatrix}}+a_{2,2}{\begin{bmatrix}b_{2,1}&b_{2,2}&\dots \end{bmatrix}}+\cdots \\\vdots \end{bmatrix}}=A_{1}B_{1}+A_{2}B_{2}+\dots

举个例子来说：

{\begin{bmatrix}1&0&2\\-1&3&1\end{bmatrix}}\cdot {\begin{bmatrix}3&1\\2&1\\1&0\end{bmatrix}}={\begin{bmatrix}1{\begin{bmatrix}3&1\end{bmatrix}}+0{\begin{bmatrix}2&1\end{bmatrix}}+2{\begin{bmatrix}1&0\end{bmatrix}}\\-1{\begin{bmatrix}3&1\end{bmatrix}}+3{\begin{bmatrix}2&1\end{bmatrix}}+1{\begin{bmatrix}1&0\end{bmatrix}}\end{bmatrix}}={\begin{bmatrix}{\begin{bmatrix}3&1\end{bmatrix}}+{\begin{bmatrix}0&0\end{bmatrix}}+{\begin{bmatrix}2&0\end{bmatrix}}\\{\begin{bmatrix}-3&-1\end{bmatrix}}+{\begin{bmatrix}6&3\end{bmatrix}}+{\begin{bmatrix}1&0\end{bmatrix}}\end{bmatrix}}

={\begin{bmatrix}5&1\\4&2\end{bmatrix}}

左面矩阵的列为为系数表，右边矩阵为向量表。例如，第一行是[1 0 2]，因此将1乘上第一个向量，0乘上第二个向量，2则乘上第三个向量。

向量表方法[编辑]

一般矩阵乘积也可以想为是行向量和列向量的内积。若 $\mathbf {A}$ 和 $\mathbf {B}$ 为给定如下的矩阵：

\mathbf {A} ={\begin{bmatrix}a_{1,1}&a_{1,2}&a_{1,3}&\dots \\a_{2,1}&a_{2,2}&a_{2,3}&\dots \\a_{3,1}&a_{3,2}&a_{3,3}&\dots \\\vdots &\vdots &\vdots &\ddots \end{bmatrix}}={\begin{bmatrix}A_{1}\\A_{2}\\A_{3}\\\vdots \end{bmatrix}}

且

\mathbf {B} ={\begin{bmatrix}b_{1,1}&b_{1,2}&b_{1,3}&\dots \\b_{2,1}&b_{2,2}&b_{2,3}&\dots \\b_{3,1}&b_{3,2}&b_{3,3}&\dots \\\vdots &\vdots &\vdots &\ddots \end{bmatrix}}={\begin{bmatrix}B_{1}&B_{2}&B_{3}&\dots \end{bmatrix}}

其中，这里

A_{1}

是由所有

a_{1,x}

元素所组成的向量，

A_{2}

是由所有

a_{2,x}

元素所组成的向量，以此类推。

B_{1}

是由所有

b_{x,1}

元素所组成的向量，

B_{2}

是由所有

b_{x,2}

元素所组成的向量，以此类推。

则

\mathbf {AB} ={\begin{bmatrix}A_{1}\\A_{2}\\A_{3}\\\vdots \end{bmatrix}}\times {\begin{bmatrix}B_{1}&B_{2}&B_{3}&\dots \end{bmatrix}}={\begin{bmatrix}(A_{1}\cdot B_{1})&(A_{1}\cdot B_{2})&(A_{1}\cdot B_{3})&\dots \\(A_{2}\cdot B_{1})&(A_{2}\cdot B_{2})&(A_{2}\cdot B_{3})&\dots \\(A_{3}\cdot B_{1})&(A_{3}\cdot B_{2})&(A_{3}\cdot B_{3})&\dots \\\vdots &\vdots &\vdots &\ddots \end{bmatrix}}

即

\left(\mathbf {AB} \right)_{ij}=A_{i}B_{j}

性质[编辑]

矩阵乘法是不可交换的（即 $AB\neq BA$ ），除了一些较特别的情况。很清楚可以知道，不可能预期说在改变向量的部分后还能得到相同的结果，而且第一个矩阵的列数必须要和第二个矩阵的行数相同，也可以看出为什么矩阵相乘的顺序会影响其结果。

虽然矩阵乘法是不可交换的，但 $AB$ 和 $BA$ 的行列式总会是一样的（当 $A$ 、 $B$ 是同样大小的方阵时）。其解释在行列式条目内。

当 $A$ 、 $B$ 可以被解释为线性算子，其矩阵乘积 $AB$ 会对应为两个线性算子的复合函数，其中B先作用。

在试算表中做矩阵乘法[编辑]

${\begin{bmatrix}1&0&2\\-1&3&1\end{bmatrix}}\cdot {\begin{bmatrix}3&1\\2&1\\1&0\end{bmatrix}}={\begin{bmatrix}5&1\\4&2\end{bmatrix}}$

以 Google Sheet 为例，选取储存格范围或者使用阵列，在储存格输入

=MMULT({1,0,2;-1,3,1},{3,1;2,1;1,0})

在某些试算表软件中必须必须按Ctrl+⇧ Shift+↵ Enter 将储存格内的变数变换为阵列

标量乘积[编辑]

矩阵 $A=(a_{ij})$ 和标量 $r$ 的标量乘积 $rA$ 的矩阵大小和 $A$ 一样， $rA$ 的各元素定义如下：

(rA)_{ij}=r\cdot a_{ij}\

若我们考虑于一个环的矩阵时，上述的乘积有时会称做左乘积，而右乘积的则定义为

(Ar)_{ij}=a_{ij}\cdot r\

当环是可交换时，例如实数域或复数域，这两个乘积是相同的。但无论如何，若环是不可交换的话，如四元数，他们可能会是不同的。例如，

i{\begin{bmatrix}i&0\\0&j\\\end{bmatrix}}={\begin{bmatrix}-1&0\\0&k\\\end{bmatrix}}\neq {\begin{bmatrix}-1&0\\0&-k\\\end{bmatrix}}={\begin{bmatrix}i&0\\0&j\\\end{bmatrix}}i

阿达马乘积[编辑]

给定两个相同维度的矩阵可计算有阿达马乘积（Hadamard product），或称做逐项乘积、分素乘积（element-wise product, entrywise product）。两个 $m\times n$ 矩阵 $A$ 、 $B$ 的阿达马乘积标记为 $A\circ B$ ，定义为 $(A\circ B)_{ij}=a_{ij}b_{ij}$ 的 $m\times n$ 矩阵。例如，

{\begin{bmatrix}1&3&2\\1&0&0\\1&2&2\end{bmatrix}}\circ {\begin{bmatrix}0&0&2\\7&5&0\\2&1&1\end{bmatrix}}={\begin{bmatrix}1\cdot 0&3\cdot 0&2\cdot 2\\1\cdot 7&0\cdot 5&0\cdot 0\\1\cdot 2&2\cdot 1&2\cdot 1\end{bmatrix}}={\begin{bmatrix}0&0&4\\7&0&0\\2&2&2\end{bmatrix}}

需注意的是，阿达马乘积是克罗内克乘积的子矩阵。

克罗内克乘积[编辑]

给定任两个矩阵 $A$ 和 $B$ ，可以得到两个矩阵的直积，或称为克罗内克乘积 $A\otimes B$ ，其定义如下

{\begin{bmatrix}a_{11}B&a_{12}B&\cdots &a_{1n}B\\\vdots &\vdots &\ddots &\vdots \\a_{m1}B&a_{m2}B&\cdots &a_{mn}B\end{bmatrix}}

当 $A$ 是一 $m\times n$ 矩阵和 $B$ 是一 $p\times r$ 矩阵时， $A\otimes B$ 会是一 $mp\times nr$ 矩阵，而且此一乘积也是不可交换的。

举个例子，

{\begin{bmatrix}1&2\\3&1\\\end{bmatrix}}\otimes {\begin{bmatrix}0&3\\2&1\\\end{bmatrix}}={\begin{bmatrix}1\cdot 0&1\cdot 3&2\cdot 0&2\cdot 3\\1\cdot 2&1\cdot 1&2\cdot 2&2\cdot 1\\3\cdot 0&3\cdot 3&1\cdot 0&1\cdot 3\\3\cdot 2&3\cdot 1&1\cdot 2&1\cdot 1\\\end{bmatrix}}={\begin{bmatrix}0&3&0&6\\2&1&4&2\\0&9&0&3\\6&3&2&1\end{bmatrix}}

若 $A$ 和 $B$ 分别表示两个线性算子 $V_{1}\to W_{1}$ 和 $V_{2}\to W_{2}$ ， $A\otimes B$ 便为其映射的张量乘积， $V_{1}\otimes V_{2}\to W_{1}\otimes W_{2}$

共同性质[编辑]

上述三种乘积都符合结合律：

A(BC)=(AB)C

以及分配律：

A(B+C)=AB+AC

(A+B)C=AC+BC

而且和标量乘积相容：

c(AB)=(cA)B

(Ac)B=A(cB)

(AB)c=A(Bc)

注意上述三个分开的表示式只有在标量体的乘法及加法是可交换（即标量体为一可交换环）时会相同。

另见[编辑]

外部链接[编辑]

WIMS Online Matrix Multiplier （页面存档备份，存于互联网档案馆）
Animated Matrix Multiplication Examples (purplemath) （页面存档备份，存于互联网档案馆）

Matrix Multipication in Javascript （页面存档备份，存于互联网档案馆）（works in Firefox）

参考[编辑]

^ Lerner, R. G.; Trigg, G. L. Encyclopaedia of Physics 2nd. VHC publishers. 1991. ISBN 3-527-26954-1 （英语）.
^ Parker, C. B. McGraw Hill Encyclopaedia of Physics 2nd. 1994. ISBN 0-07-051400-3 （英语）.

其它参考文献包括：

Strassen, Volker, Gaussian Elimination is not Optimal, Numer. Math. 13, p. 354-356, 1969.
Coppersmith, D., Winograd S., Matrix multiplication via arithmetic progressions, J. Symbolic Comput. 9, p. 251-280, 1990.
Horn, Roger; Johnson, Charles: "Topics in Matrix Analysis", Cambridge, 1994.
Robinson, Sara, Toward an Optimal Algorithm for Matrix Multiplication, SIAM News 38(9), November 2005.

[Physics_1991-1] Lerner, R. G.; Trigg, G. L. Encyclopaedia of Physics 2nd. VHC publishers. 1991. ISBN 3-527-26954-1 （英语）.

[2] Parker, C. B. McGraw Hill Encyclopaedia of Physics 2nd. 1994. ISBN 0-07-051400-3 （英语）.

[1]

[2]