第二十四讲：马尔科夫矩阵、傅里叶级数

马尔科夫矩阵

马尔科夫矩阵（Markov matrix）是指具有以下两个特性的矩阵：

矩阵中的所有元素大于等于 $0$ ；（因为马尔科夫矩阵与概率有关，而概率是非负的。）
每一列的元素之和为 $1$

对于马尔科夫矩阵，我们关心幂运算过程中的稳态（steady state）。与上一讲不同，指数矩阵关系特征值是否为 $0$ ，而幂运算要达到稳态需要特征值为 $1$ 。

根据上面两条性质，我们可以得出两个推论：

马尔科夫矩阵必有特征值为 $1$ ；
其他的特征值的绝对值皆小于 $1$ 。

使用第二十二讲中得到的公式进行幂运算 $u_{k} = A^{k} u_{0} = S Λ^{k} S^{- 1} u_{0} = S Λ^{k} S^{- 1} S c = S Λ^{k} c = c_{1} λ_{1}^{k} x_{1} + c_{2} λ_{2}^{k} x_{2} + \dots + c_{n} λ_{n}^{k} x_{n}$ ，从这个公式很容易看出幂运算的稳态。比如我们取 $λ_{1} = 1$ ，其他的特征值绝对值均小于 $1$ ，于是在经过 $k$ 次迭代，随着时间的推移，其他项都趋近于 $0$ ，于是在 $k \to \infty$ 时，有稳态 $u_{k} = c_{1} x_{1}$ ，这也就是初始条件 $u_{0}$ 的第 $1$ 个分量。

我们来证明第一个推论，取 $A = [\begin{matrix} 0.1 & 0.01 & 0.3 \\ 0.2 & 0.99 & 0.3 \\ 0.7 & 0 & 0.4 \end{matrix}]$ ，则 $A - I = [\begin{matrix} - 0.9 & 0.01 & 0.3 \\ 0.2 & - 0.01 & 0.3 \\ 0.7 & 0 & - 0.6 \end{matrix}]$ 。观察 $A - I$ 易知其列向量中元素之和均为 $0$ ，因为马尔科夫矩阵的性质就是各列向量元素之和为 $1$ ，现在我们从每一列中减去了 $1$ ，所以这是很自然的结果。而如果列向量中元素和为 $0$ ，则矩阵的任意行都可以用“零减去其他行之和”表示出来，即该矩阵的行向量线性相关。

用以前学过的子空间的知识描述，当 $n$ 阶方阵各列向量元素之和皆为 $1$ 时，则有 $[\begin{matrix} 1 \\ 1 \\ ⋮ \\ 1 \end{matrix}]$ 在矩阵 $A - I$ 左零空间中，即 $(A - I)^{T}$ 行向量线性相关。而 $A$ 特征值 $1$ 所对应的特征向量将在 $A - I$ 的零空间中，因为 $A x = x \to (A - I) x = 0$ 。

另外，特征值具有这样一个性质：矩阵与其转置的特征值相同。因为我们在行列式一讲了解了性质10，矩阵与其转置的行列式相同，那么如果 $det (A - λ I) = 0$ ，则有 $det (A - λ I)^{T} = 0$ ，根据矩阵转置的性质有 $det (A^{T} - λ I^{T}) = 0$ ，即 $det (A^{T} - λ I) = 0$ 。这正是 $A^{T}$ 特征值的计算式。

然后计算特征值 $λ_{1} = 1$ 所对应的特征向量， $(A - I) x_{1} = 0$ ，得出 $x_{1} = [\begin{matrix} 0.6 \\ 33 \\ 0.7 \end{matrix}]$ ，特征向量中的元素皆为正。

接下来介绍马尔科夫矩阵的应用，我们用麻省和加州这两个州的人口迁移为例：

${[\begin{matrix} u_{c a l} \\ u_{m a s s} \end{matrix}]}_{k + 1} [\begin{matrix} 0.9 & 0.2 \\ 0.1 & 0.8 \end{matrix}] {[\begin{matrix} u_{c a l} \\ u_{m a s s} \end{matrix}]}_{k}$ ，元素非负，列和为一。这个式子表示每年有 $10$ 的人口从加州迁往麻省，同时有 $20$ 的人口从麻省迁往加州。注意使用马尔科夫矩阵的前提条件是随着时间的推移，矩阵始终不变。

设初始情况 ${[\begin{matrix} u_{c a l} \\ u_{m a s s} \end{matrix}]}_{0} = [\begin{matrix} 0 \\ 1000 \end{matrix}]$ ，我们先来看第一次迁徙后人口的变化情况： ${[\begin{matrix} u_{c a l} \\ u_{m a s s} \end{matrix}]}_{1} = [\begin{matrix} 0.9 & 0.2 \\ 0.1 & 0.8 \end{matrix}] [\begin{matrix} 0 \\ 1000 \end{matrix}] = [\begin{matrix} 200 \\ 800 \end{matrix}]$ ，随着时间的推移，会有越来越多的麻省人迁往加州，而同时又会有部分加州人迁往麻省。

计算特征值：我们知道马尔科夫矩阵的一个特征值为 $λ_{1} = 1$ ，则另一个特征值可以直接从迹算出 $λ_{2} = 0.7$ 。

计算特征向量：带入 $λ_{1} = 1$ 求 $A - I$ 的零空间有 $[\begin{matrix} - 0.1 & 0.2 \\ 0.1 & - 0.2 \end{matrix}]$ ，则 $x_{1} = [\begin{matrix} 2 \\ 1 \end{matrix}]$ ，此时我们已经可以得出无穷步后稳态下的结果了。 $u_{\infty} = c_{1} [\begin{matrix} 2 \\ 1 \end{matrix}]$ 且人口总数始终为 $1000$ ，则 $c_{1} = \frac{1000}{3}$ ，稳态时 ${[\begin{matrix} u_{c a l} \\ u_{m a s s} \end{matrix}]}_{\infty} = [\begin{matrix} \frac{2000}{3} \\ \frac{1000}{3} \end{matrix}]$ 。注意到特征值为 $1$ 的特征向量元素皆为正。

为了求每一步的结果，我们必须解出所有特征向量。带入 $λ_{2} = 0.7$ 求 $A - 0.7 I$ 的零空间有 $[\begin{matrix} 0.2 & 0.2 \\ 0.1 & 0.1 \end{matrix}]$ ，则 $x_{2} = [\begin{matrix} - 1 \\ 1 \end{matrix}]$ 。

通过 $u_{0}$ 解出 $c_{1}, c_{2}$ ， $u_{k} = c_{1} 1^{k} [\begin{matrix} 2 \\ 1 \end{matrix}] + c_{2} {0.7}^{k} [\begin{matrix} - 1 \\ 1 \end{matrix}]$ ，带入 $k = 0$ 得 $u_{0} = [\begin{matrix} 0 \\ 1000 \end{matrix}] = c_{1} [\begin{matrix} 2 \\ 1 \end{matrix}] + c_{2} [\begin{matrix} - 1 \\ 1 \end{matrix}]$ ，解出 $c_{1} = \frac{1000}{3}, c_{2} = \frac{2000}{3}$ 。

另外，有时人们更喜欢用行向量，此时将要使用行向量乘以矩阵，其行向量各分量之和为 $1$ 。

傅里叶级数

在介绍傅里叶级数（Fourier series）之前，先来回顾一下投影。

设 $q_{1}, q_{2}, \dots q_{n}$ 为一组标准正交基，则向量 $v$ 在该标准正交基上的展开为 $v = x_{1} q_{1} + x_{2} q_{2} + \dots + x_{n} q_{n}$ ，此时我们想要得到各系数 $x_{i}$ 的值。比如求 $x_{1}$ 的值，我们自然想要消掉除 $x_{1} q_{1}$ 外的其他项，这时只需要等式两边同乘以 $q_{1}^{T}$ ，因为的 $q_{i}$ 向量相互正交且长度为 $1$ ，则 $q_{i}^{T} q_{j} = 0, q_{i}^{2} = 1$ 所以原式变为 $q_{1}^{T} v = x_{1}$ 。

写为矩阵形式有 $[q_{1} q_{2} \dots q_{n}] [\begin{matrix} x_{1} \\ x_{2} \\ ⋮ \\ x_{n} \end{matrix}] = v$ ，即 $Q x = v$ 。所以有 $x = Q^{- 1} v$ ，而在第十七讲我们了解到标准正交基有 $Q^{T} = Q^{- 1}$ ，所以我们不需要计算逆矩阵可直接得出 $x = Q^{T} v$ 。此时对于 $x$ 的每一个分量有 $x_{i} = q_{i}^{T} v$ 。

接下来介绍傅里叶级数。先写出傅里叶级数的展开式：

f (x) = a_{0} + a_{1} \cos x + b_{1} \sin x + a_{2} \cos 2 x + b_{2} \sin 2 x + \dots

傅里叶发现，如同将向量 $v$ 展开（投影）到向量空间的一组标准正交基中，在函数空间中，我们也可以做类似的展开。将函数 $f (x)$ 投影在一系列相互正交的函数中。函数空间中的 $f (x)$ 就是向量空间中的 $v$ ；函数空间中的 $1, \cos x, \sin x, \cos 2 x, \sin 2 x, \dots$ 就是向量空间中的 $q_{1}, q_{2}, \dots, q_{n}$ ；不同的是，函数空间是无限维的而我们以前接触到的向量空间通常是有限维的。

再来介绍何为“函数正交”。对于向量正交我们通常使用两向量内积（点乘）为零判断。我们知道对于向量 $v, w$ 的内积为 $v^{T} w = v_{1} w_{1} + v_{2} w_{2} + \dots + v_{n} w_{n} = 0$ ，也就是向量的每个分量之积再求和。而对于函数 $f (x) \cdot g (x)$ 内积，同样的，我们需要计算两个函数的每个值之积而后求和，由于函数取值是连续的，所以函数内积为：

f^{T} g = \int f (x) g (x) d x

在本例中，由于傅里叶级数使用正余弦函数，它们的周期都可以算作 $2 π$ ，所以本例的函数点积可以写作 $f^{T} g = \int_{0}^{2 π} f (x) g (x) d x$ 。我来检验一个内积 $\int_{0}^{2 π} \sin x \cos x d x = {\frac{1}{2} \sin^{2} x |}_{0}^{2 π} = 0$ ，其余的三角函数族正交性结果可以参考傅里叶级数的“希尔伯特空间的解读”一节。

最后我们来看 $\cos x$ 项的系数是多少（ $a_{0}$ 是 $f (x)$ 的平均值）。同向量空间中的情形一样，我们在等式两边同时做 $\cos x$ 的内积，原式变为 $\int_{0}^{2 π} f (x) \cos x d x = a_{1} \int_{0}^{2 π} \cos^{2} x d x$ ，因为正交性等式右边仅有 $\cos x$ 项不为零。进一步化简得 $a_{1} π = \int_{0}^{2 π} f (x) \cos x d x \to a_{1} = \frac{1}{π} \int_{0}^{2 π} f (x) \cos x d x$ 。

于是，我们把函数 $f (x)$ 展开到了函数空间的一组标准正交基上。

第二十四讲：马尔科夫矩阵、傅里叶级数 ​

马尔科夫矩阵 ​

傅里叶级数 ​

第二十四讲：马尔科夫矩阵、傅里叶级数

马尔科夫矩阵

傅里叶级数