diff --git "a/\350\256\262\344\271\211/\344\270\223\351\242\230/16 \347\233\270\344\274\274\346\240\207\345\207\206\345\275\242\357\274\232\345\212\250\346\234\272\344\270\216\345\237\272\347\241\200.tex" "b/\350\256\262\344\271\211/\344\270\223\351\242\230/16 \347\233\270\344\274\274\346\240\207\345\207\206\345\275\242\357\274\232\345\212\250\346\234\272\344\270\216\345\237\272\347\241\200.tex" index 73d4c3c..b7349eb 100644 --- "a/\350\256\262\344\271\211/\344\270\223\351\242\230/16 \347\233\270\344\274\274\346\240\207\345\207\206\345\275\242\357\274\232\345\212\250\346\234\272\344\270\216\345\237\272\347\241\200.tex" +++ "b/\350\256\262\344\271\211/\344\270\223\351\242\230/16 \347\233\270\344\274\274\346\240\207\345\207\206\345\275\242\357\274\232\345\212\250\346\234\272\344\270\216\345\237\272\347\241\200.tex" @@ -514,14 +514,14 @@ \subsection{相似与特征值、特征向量的关联} 下面这个例子非常重要,在解决一些题目时使用这一结论会更便捷: \begin{example}{}{} - (\autoref{thm:基的选择对向量坐标的影响}推广)设$P^{-1}AP=B$,证明:$A,B$分别属于同一特征值$\lambda$的特征向量$X$和$Y$满足$Y=P^{-1}X$. + (\autoref{thm:基的选择对向量坐标的影响} 推广)设$P^{-1}AP=B$,证明:$A,B$分别属于同一特征值$\lambda$的特征向量$X$和$Y$满足$Y=P^{-1}X$. \end{example} \begin{proof} 由$AX=\lambda_0 X$以及$A=PBP^{-1}$,我们有$PBP^{-1}X=\lambda_0 X$,即$BP^{-1}X=\lambda_0 P^{-1}X$,因此$P^{-1}X$是$B$属于$\lambda_0$的特征向量,即$P^{-1}X$是$B$的特征向量,即$Y=P^{-1}X$. \end{proof} -实际上本题是本讲义\autoref{thm:基的选择对向量坐标的影响}的推论,原因在于$P^{-1}AP=B$说明$A$和$B$是同一个线性变换(设为$\sigma$)在不同基下的矩阵,因此$X$和$Y$只是$\sigma$关于$\lambda_0$在两组基下的坐标,因此二坐标之间相差一个过渡矩阵. +实际上本题是本讲义\autoref{thm:基的选择对向量坐标的影响} 的推论,原因在于$P^{-1}AP=B$说明$A$和$B$是同一个线性变换(设为$\sigma$)在不同基下的矩阵,因此$X$和$Y$只是$\sigma$关于$\lambda_0$在两组基下的坐标,因此二坐标之间相差一个过渡矩阵. 最后我们谈一个拓展题型,我们考虑矩阵方程$AX-XB=O$,若$A,B$都是$n$阶方阵且$X$可逆,则方程可以改写为$X^{-1}AX=B$,即$A$与$B$相似. 事实上,这一矩阵方程的解空间的维数实际上刻画了$A$与$B$的相似程度. 我们有如下结论: \begin{theorem}{}{} @@ -530,46 +530,46 @@ \subsection{相似与特征值、特征向量的关联} \begin{proof} \begin{enumerate} - \item 设$\lambda_1,\ldots,\lambda_r$是$A$和$B$的$r$个公共特征值,$\alpha_1,\ldots,\alpha_r$为$A$相应的特征向量.由于$\lambda_1,\ldots,\lambda_r$也是$B^\mathrm{T}$的特征值,设$\beta_1,\ldots,\beta_r$是$B^\mathrm{T}$相应的特征向量.则$B^\mathrm{T}\beta_i=\lambda_i\beta_i$,从而$\beta_i^{\mathrm{T}}B=\lambda\beta_i^{\mathrm{T}}$.下面我们证明$X=(\alpha_1,\ldots,\alpha_r)\cdot(\beta_1,\ldots,\beta_r)^\mathrm{T}$是$AX-XB=0$的解. + \item 设$\lambda_1,\ldots,\lambda_r$是$A$和$B$的$r$个公共特征值,$\alpha_1,\ldots,\alpha_r$为$A$相应的特征向量. 由于$\lambda_1,\ldots,\lambda_r$也是$B^\mathrm{T}$的特征值,设$\beta_1,\ldots,\beta_r$是$B^\mathrm{T}$相应的特征向量. 则$B^\mathrm{T}\beta_i=\lambda_i\beta_i$,从而$\beta_i^{\mathrm{T}}B=\lambda\beta_i^{\mathrm{T}}$. 下面我们证明$X=(\alpha_1,\ldots,\alpha_r)\cdot(\beta_1,\ldots,\beta_r)^\mathrm{T}$是$AX-XB=0$的解. - 事实上,$AX=A(\alpha_1,\ldots,\alpha_r)\cdot(\beta_1,\ldots,\beta_r)^\mathrm{T}=(\lambda_1\alpha_1,\ldots,\lambda_r\alpha_r)\cdot(\beta_1,\ldots,\beta_r)^\mathrm{T}=\lambda_1\alpha_1\beta_1+\cdots+\lambda_r\alpha_r\beta_r$,$XB=(\alpha_1,\ldots,\alpha_r)\cdot(\beta_1,\ldots,\beta_r)^\mathrm{T}B=(\alpha_1,\ldots,\alpha_r)\cdot(\lambda_1\beta_1,\ldots,\lambda_r\beta_r)=(\lambda_1\alpha_1\beta_1+\cdots+\lambda_r\alpha_r\beta_1)$.故$AX-XB=0$. + 事实上,$AX=A(\alpha_1,\ldots,\alpha_r)\cdot(\beta_1,\ldots,\beta_r)^\mathrm{T}=(\lambda_1\alpha_1,\ldots,\lambda_r\alpha_r)\cdot(\beta_1,\ldots,\beta_r)^\mathrm{T}=\lambda_1\alpha_1\beta_1+\cdots+\lambda_r\alpha_r\beta_r$,$XB=(\alpha_1,\ldots,\alpha_r)\cdot(\beta_1,\ldots,\beta_r)^\mathrm{T}B=(\alpha_1,\ldots,\alpha_r)\cdot(\lambda_1\beta_1,\ldots,\lambda_r\beta_r)=(\lambda_1\alpha_1\beta_1+\cdots+\lambda_r\alpha_r\beta_1)$. 故$AX-XB=0$. 接下来证明$r(X)=r$. - 注意到$r(\alpha_1,\ldots,\alpha_r)=r((\beta_1,\ldots,\beta_r)^\mathrm{T})=r$,故$r(X)\le r(\alpha_1,\ldots,\alpha_r)=r,r(X)\ge r(\alpha_1,\ldots,\alpha_r)+r((\beta_1,\ldots,\beta_r)^\mathrm{T})-r$,从而$r(X)=r$. - \item 设$X=P$\begin{pmatrix} + 注意到$r(\alpha_1,\ldots,\alpha_r)=r((\beta_1,\ldots,\beta_r)^\mathrm{T})=r$,故$r(X)\leqslant r(\alpha_1,\ldots,\alpha_r)=r,r(X)\geqslant r(\alpha_1,\ldots,\alpha_r)+r((\beta_1,\ldots,\beta_r)^\mathrm{T})-r$,从而$r(X)=r$. + \item 设$X=P\begin{pmatrix} E_r & 0 \\ 0 & 0 - \end{pmatrix}Q,则$AX-XB=0$,从而$P^{-1}AP$\begin{pmatrix} + \end{pmatrix}Q$,则$AX-XB=0$,从而$P^{-1}AP\begin{pmatrix} E_r & 0 \\ 0 & 0 - \end{pmatrix}$=$ + \end{pmatrix} = \begin{pmatrix} E_r & 0 \\ 0 & 0 - \end{pmatrix}$QBQ^{-1}$. + \end{pmatrix}QBQ^{-1}$. - 设$C=P^{-1}AP=$\begin{pmatrix} + 设$C=P^{-1}AP=\begin{pmatrix} C_1 & C_2 \\ C_3 & C_4 - \end{pmatrix}, - $D=QBQ^{-1}=$\begin{pmatrix} + \end{pmatrix}$, + $D=QBQ^{-1}=\begin{pmatrix} D_1 & D_2 \\ D_3 & D_4 - \end{pmatrix}.则 - \begin{pmatrix} + \end{pmatrix}$. 则 + $\begin{pmatrix} C_1 & C_2 \\ C_3 & C_4 \end{pmatrix}\begin{pmatrix} E_r & 0 \\ 0 & 0 - \end{pmatrix}$=$\begin{pmatrix} + \end{pmatrix} = \begin{pmatrix} E_r & 0 \\ 0 & 0 \end{pmatrix}\begin{pmatrix} D_1 & D_2 \\ D_3 & D_4 - \end{pmatrix},从而知$C_1=D_1$,$C_2=D_3=0$. - 由于$|\lambda E-C|=|\lambda E_r-C_1||\lambda E_{n-r}-C_4|$,$|\lambda E-D|=|\lambda E_r-D_1||\lambda E_{m-r}-D_4|$,而$|\lambda E_r-C_1|$是一个关于$\lambda$的$r$次多项式,在复数域上有$r$个根(计重数),它们是$C$的特征值,同时也为$D$的特征值.从而$C$和$D$至少有$r$个公共的特征值.而相似变换不改变矩阵的特征值,这表明$A,B$至少有$r$个公共的特征值. + \end{pmatrix}$,从而知$C_1=D_1$,$C_2=D_3=0$. + 由于$|\lambda E-C|=|\lambda E_r-C_1||\lambda E_{n-r}-C_4|$,$|\lambda E-D|=|\lambda E_r-D_1||\lambda E_{m-r}-D_4|$,而$|\lambda E_r-C_1|$是一个关于$\lambda$的$r$次多项式,在复数域上有$r$个根(计重数),它们是$C$的特征值,同时也为$D$的特征值. 从而$C$和$D$至少有$r$个公共的特征值. 而相似变换不改变矩阵的特征值,这表明$A,B$至少有$r$个公共的特征值. \end{enumerate} \end{proof} @@ -815,7 +815,7 @@ \subsection{特征向量的基本性质} 以此类推,在等式两边不断左乘$(A-\lambda E)$可知:对于$\forall r \in \{1,\cdots,s-1\}$都有$\displaystyle\sum_{i=1}^{s-r}k_{i+r}\alpha_i=0$. - 令$r=s-1$得到$k_s\alpha_1=0,k_s=0$.再依次代回不难得到$k_i=0,\forall i \in \{1,\cdots,s\}$,从而向量组$\alpha_1,\cdots,\alpha_s$线性无关. + 令$r=s-1$得到$k_s\alpha_1=0,k_s=0$. 再依次代回不难得到$k_i=0,\forall i \in \{1,\cdots,s\}$,从而向量组$\alpha_1,\cdots,\alpha_s$线性无关. \end{proof} \section{实数域与复数域的讨论} @@ -831,7 +831,7 @@ \section{实数域与复数域的讨论} 这一命题也可以不使用特征多项式解决,下面我们给出一种不使用行列式、特征多项式的证明方法: \begin{proof} - 对于$v \in V,v \neq 0$,$v,\sigma(v),\cdots,\sigma^n(v)$线性相关,从而存在不全为$0$的复数$a_0,a_1,\cdots,a_n$,使得$a_0v+a_1\sigma(v)+\cdots+a_n\sigma^n(v)=0$.由于$v \neq 0$,故$a_1,\cdots,a_n$不全为$0$. + 对于$v \in V,v \neq 0$,$v,\sigma(v),\cdots,\sigma^n(v)$线性相关,从而存在不全为$0$的复数$a_0,a_1,\cdots,a_n$,使得$a_0v+a_1\sigma(v)+\cdots+a_n\sigma^n(v)=0$. 由于$v \neq 0$,故$a_1,\cdots,a_n$不全为$0$. 令$f(z)=\displaystyle\sum_{i=0}^{n}a_iz^i=c\displaystyle\prod_{i=1}^{m}(z-\lambda_i)$,则$0=f(\sigma)(v)=c(\sigma-\lambda_1I)\cdots(\sigma-\lambda_mI)v$,这表明$\exists j\in \{1,\cdots,m\}$使得$(\sigma-\lambda_jI)$不是单的,从而$\sigma$有本征值. \end{proof} diff --git "a/\350\256\262\344\271\211/\344\270\223\351\242\230/17 \347\233\270\344\274\274\346\240\207\345\207\206\345\275\242\357\274\232\345\244\215\346\225\260\345\237\237\344\270\212\347\232\204\345\260\235\350\257\225\344\270\216\347\220\206\350\256\272.tex" "b/\350\256\262\344\271\211/\344\270\223\351\242\230/17 \347\233\270\344\274\274\346\240\207\345\207\206\345\275\242\357\274\232\345\244\215\346\225\260\345\237\237\344\270\212\347\232\204\345\260\235\350\257\225\344\270\216\347\220\206\350\256\272.tex" index 5cda686..680a4d9 100644 --- "a/\350\256\262\344\271\211/\344\270\223\351\242\230/17 \347\233\270\344\274\274\346\240\207\345\207\206\345\275\242\357\274\232\345\244\215\346\225\260\345\237\237\344\270\212\347\232\204\345\260\235\350\257\225\344\270\216\347\220\206\350\256\272.tex" +++ "b/\350\256\262\344\271\211/\344\270\223\351\242\230/17 \347\233\270\344\274\274\346\240\207\345\207\206\345\275\242\357\274\232\345\244\215\346\225\260\345\237\237\344\270\212\347\232\204\345\260\235\350\257\225\344\270\216\347\220\206\350\256\272.tex" @@ -505,21 +505,21 @@ \subsection{广义特征子空间与分块对角矩阵} \begin{solution} $\sigma$在$\mathcal{L}(\mathbf{C}^3)$的自然基下的矩阵是 - \begin{pmatrix} + \[ \begin{pmatrix} 6 & 3 & 4 \\ 0 & 6 & 2 \\ 0 & 0 & 7 - \end{pmatrix} + \end{pmatrix} \] $\sigma$的特征值为$\lambda_1=6,\lambda_2=7$. 解方程可以得到两个广义特征子空间$G(\lambda_1,\sigma)=\spa((1,0,0),(0,\dfrac{1}{3},0))$,$G(\lambda_2,\sigma)=\spa((0,2,1))$. - 取$\alpha_1=(1,0,0),\alpha_2=(\dfrac{1}{3}),\alpha_3=(0,2,1)$,则$\sigma$在基$\{\alpha_1,\alpha_2,\alpha_3\}$下有分块对角矩阵 - \begin{pmatrix} + 取$\alpha_1=(1,0,0),\alpha_2=\dfrac{1}{3},\alpha_3=(0,2,1)$,则$\sigma$在基$\{\alpha_1,\alpha_2,\alpha_3\}$下有分块对角矩阵 + \[ \begin{pmatrix} 6 & 1 & 0 \\ 0 & 6 & 0 \\ 0 & 0 & 7 - \end{pmatrix}. + \end{pmatrix} \] \end{solution} 事实上,读者会发现虽然整体思路是很简单的,但是中间求解广义特征子空间的过程还是存在一定的困难. 因为当$\dim V$较大时,$G(\lambda,\sigma)=\ker (\sigma-\lambda I)^{\dim V}$的求解需要反复计算幂次,是比较复杂的;而如果根据核空间停止增长的性质不断提升矩阵的幂次,直到得到的广义特征子空间不再发生改变就能够停止计算也是一种可行的思路,只是每次算出一个幂次后都要判断线性变换或矩阵的秩是否下降. 在之后的章节中我们会通过多项式的理论来降低$\ker (\sigma-\lambda I)^{\dim V}$所需的幂次. @@ -559,12 +559,12 @@ \subsection{上三角标准形的存在性} \end{theorem} 定理的证明实际上只需要计算验证即可,非常简单: \begin{proof} -$1 \implies 2$:设$\sigma$关于$v_1,\ldots,v_n$的矩阵$A=(a_{ij})_{n\times n}$是上三角的,即$a_{ij}=0,\forall i>j$.则对于$\forall j \in \{1,\ldots,n\}$,有$\sigma(v_j)=\displaystyle\sum_{i=1}^{n}a_{ij}v_i=\displaystyle\sum_{i=1}^{j}a_{ij}v_i\in \spa(v_1,\ldots,v_n)$. +$1 \implies 2$:设$\sigma$关于$v_1,\ldots,v_n$的矩阵$A=(a_{ij})_{n\times n}$是上三角的,即$a_{ij}=0,\forall i>j$. 则对于$\forall j \in \{1,\ldots,n\}$,有$\sigma(v_j)=\displaystyle\sum_{i=1}^{n}a_{ij}v_i=\displaystyle\sum_{i=1}^{j}a_{ij}v_i\in \spa(v_1,\ldots,v_n)$. $2 \implies 3$:对$\forall v=\displaystyle\sum_{i=1}^{j}a_iv_i \in \spa(v_1,\ldots,v_j)$,有$\sigma(v)=\sigma(\displaystyle\sum_{i=1}^{j}a_iv_i)=\displaystyle\sum_{i=1}^{j}a_i\sigma(v_i)$. 由2知对于$\forall i \in \{1,\ldots,j\}$,有$\sigma(v_i) \in \spa(v_1,\ldots,v_i) \subseteq \spa(v_1,\ldots,v_j)$,从而知$\sigma(v) \in \spa(v_1,\ldots,v_j)$,$\spa(v_1,\ldots,v_j)$在$\sigma$下不变. -$3 \implies 1$:设$\sigma$关于$v_1,\ldots,v_n$的矩阵为$A=(a_{ij})_{n\times n}$对于$\forall j \in \{1,\ldots,n\}$,$\sigma(v_j)=\displaystyle\sum_{i=1}^{n}a_{ij}v_i\in \spa(v_1,\ldots,v_n)$,从而有$a_{j+1,j}=\cdots=a_{n,j}=0$,即$\forall i>j,a_{ij}=0$.故$A$为上三角矩阵. +$3 \implies 1$:设$\sigma$关于$v_1,\ldots,v_n$的矩阵为$A=(a_{ij})_{n\times n}$对于$\forall j \in \{1,\ldots,n\}$,$\sigma(v_j)=\displaystyle\sum_{i=1}^{n}a_{ij}v_i\in \spa(v_1,\ldots,v_n)$,从而有$a_{j+1,j}=\cdots=a_{n,j}=0$,即$\forall i>j,a_{ij}=0$. 故$A$为上三角矩阵. \end{proof} 这一定理给出了上三角矩阵的几个充要条件,因此我们的想法就是利用等价条件中的某一个条件来验证任意线性变换是否可以得到上三角矩阵. 幸运的是,的确对于任意的复向量空间上的线性变换,我们可以找到一组基使得其关于这组基有上三角矩阵. @@ -623,24 +623,24 @@ \subsection{上三角标准形的存在性} \begin{solution} $\sigma$在$\mathbf{C}^3$的自然基下的矩阵$A$为 - \begin{pmatrix} + \[ \begin{pmatrix} 2 & 0 & 0 \\ 0 & 0 & 0 \\ 1 & 0 & 2 - \end{pmatrix}. + \end{pmatrix} \] 令$|\lambda_E-A|=0$,知$A$的一个特征值是$0$,相应的一个特征向量为$\alpha_1=(0,1,0)$.$\sigma$在$\alpha_1,e_1,e_3$下的矩阵为矩阵 - \begin{pmatrix} + \[ \begin{pmatrix} 0 & 0 & 0 \\ 0 & 2 & 0 \\ 0 & 1 & 2 - \end{pmatrix}. + \end{pmatrix} \] 再考虑矩阵 - \begin{pmatrix} + \[ \begin{pmatrix} 2 & 0 \\ 1 & 2 - \end{pmatrix}. - 这个矩阵的特征值为$2$,相应的特征向量为$\alpha_2=(2,0,1)$.最后取$\alpha_3=(0,0,1)$,则$\sigma$在$\alpha_1,\alpha_2,\alpha_3$下的矩阵为上三角矩阵. + \end{pmatrix} \] + 这个矩阵的特征值为$2$,相应的特征向量为$\alpha_2=(2,0,1)$. 最后取$\alpha_3=(0,0,1)$,则$\sigma$在$\alpha_1,\alpha_2,\alpha_3$下的矩阵为上三角矩阵. \end{solution} 另一方面,我们可以再给出一个\autoref{thm:上三角矩阵存在} 的证明与这一矩阵的证明方法对应: @@ -689,16 +689,16 @@ \subsection{矩阵可交换的讨论} 我们对维数$n$归纳证明. \begin{enumerate} \item $n=1$时,结论显然成立. - \item 假设命题对$n-1$成立.由于$\sigma \tau=\tau \sigma$,故$\exists \alpha\in V$,使得$\alpha$同时为$\sigma$和$\tau$的特征向量. + \item 假设命题对$n-1$成立. 由于$\sigma \tau=\tau \sigma$,故$\exists \alpha\in V$,使得$\alpha$同时为$\sigma$和$\tau$的特征向量. - 设$U=\spa{\alpha}$,则$U$是$\sigma$和$\tau$的不变子空间.考虑商映射$\sigma/U,\tau/U$. + 设$U=\spa{\alpha}$,则$U$是$\sigma$和$\tau$的不变子空间. 考虑商映射$\sigma/U,\tau/U$. 对于$\forall v+U\in V/U$,有$((\sigma/U)(\tau/U))(v+U)=(\sigma/U)(\tau(v)+U)=\sigma(\tau(v))+U=\tau(\sigma(v))+U=((\tau/U)(\sigma/U))(v+U)$,即$(\sigma/U)(\tau/U)=(\tau/U)(\sigma/U)$. 由$\dim V/U=n-1$,结合归纳假设可知:存在$V/U$的一组基$v_1+U,\ldots,v_{n-1}+U$,使得$\sigma/U$和$\tau/U$在这组基下都是上三角矩阵. 则$(\sigma/U)(v_i+U)=\sigma(v_i)+U \in \spa(v_1+U,\ldots,v_i+U)$,从而$\sigma(v_i)\in \spa(\alpha,v_1,\ldots,v_i),\forall i=1,2,\ldots,n-1$. - 容易验证:$\alpha,v_1,\ldots,v_{n-1}$线性无关,从而构成$V$的基.由上面的叙述可知$\sigma$在这组基下的矩阵为上三角矩阵.同理,$\tau$在这组基下也为上三角矩阵,命题对$n$成立.从而命题成立. + 容易验证:$\alpha,v_1,\ldots,v_{n-1}$线性无关,从而构成$V$的基. 由上面的叙述可知$\sigma$在这组基下的矩阵为上三角矩阵. 同理,$\tau$在这组基下也为上三角矩阵,命题对$n$成立. 从而命题成立. \end{enumerate} \end{enumerate} \end{proof} @@ -838,9 +838,9 @@ \subsection{幂零矩阵} 考虑从$\mathbf{M}_n(F)$到自身的映射$\sigma:\sigma(X)=XB-BX$,则$\sigma(A)=A$. - 容易验证$\sigma$是线性映射.归纳容易证明:$\sigma(A^k)=kA^k,\forall k\in \mathbb{N}^*$ + 容易验证$\sigma$是线性映射. 归纳容易证明:$\sigma(A^k)=kA^k,\forall k\in \mathbb{N}^*$ - 假设$A$不是幂零的,则对$\forall k \in \mathbb{N}^*$,有$A^k \neq 0,\sigma(A^k)=kA^k$.这表明任意正整数$k$都是$\sigma$的特征值,这与$\sigma$最多只有$n^2$个特征值矛盾.故$A$是幂零矩阵. + 假设$A$不是幂零的,则对$\forall k \in \mathbb{N}^*$,有$A^k \neq 0,\sigma(A^k)=kA^k$. 这表明任意正整数$k$都是$\sigma$的特征值,这与$\sigma$最多只有$n^2$个特征值矛盾. 故$A$是幂零矩阵. \end{enumerate} \end{proof} @@ -866,15 +866,15 @@ \subsection{平方根问题} \item 从$\sqrt{1+x}=1+a_1x+a_2x^2+\cdots$受到启发,我们猜测$I+N$有形如$I+a_1N+a_2N^2+\cdots$的平方根. 由于$N$是幂零的,故存在正整数$m$,使得$N^m=0$,从而上面的式子成为一个有限和$I+a_1N+a_2N^2+\cdots+a_{m-1}N^{m-1}$. - 我们希望$(I+a_1N+a_2N^2+\cdots+a_{m-1}N^{m-1})^2=I+2a_1N+(2a_2+a_1)N^2+(2a_3+2a_1a_2)N^3+\cdots+(2a_{m-1}+f(a_1,\ldots,a_{m-2})N^{m-1})$等于$I+N$.所以取$2a_1=1$,再取$a_2$使得$2a_2+a_1^2=0$. + 我们希望$(I+a_1N+a_2N^2+\cdots+a_{m-1}N^{m-1})^2=I+2a_1N+(2a_2+a_1)N^2+(2a_3+2a_1a_2)N^3+\cdots+(2a_{m-1}+f(a_1,\ldots,a_{m-2})N^{m-1})$等于$I+N$. 所以取$2a_1=1$,再取$a_2$使得$2a_2+a_1^2=0$. 对所有$j=3,4,\ldots,m-1$如此进行下去,每次都能得到相应的$a_j$,我们并不关心$a_j$的显式公式,只需知道这些$a_j$的选取确实给出了$(I+N)$的一个平方根. - \item 设$\lambda_1,\ldots,\lambda_m$是$T$所有互不相同的本征值,则对每个$j$都存在一个幂零算子$N_j\in \mathcal{L}(G(\lambda_j,T))$使得$T|G_{(\lambda_j,T)}=\lambda_jI+N_j$.因为$T$可逆,所以$\lambda_j \neq 0$,于是有$T|G_{\lambda_j,T}=\lambda_j(I+\dfrac{N_j}{\lambda_j})$. + \item 设$\lambda_1,\ldots,\lambda_m$是$T$所有互不相同的本征值,则对每个$j$都存在一个幂零算子$N_j\in \mathcal{L}(G(\lambda_j,T))$使得$T|G_{(\lambda_j,T)}=\lambda_jI+N_j$. 因为$T$可逆,所以$\lambda_j \neq 0$,于是有$T|G_{\lambda_j,T}=\lambda_j(I+\dfrac{N_j}{\lambda_j})$. 显然$\dfrac{N_j}{\lambda_j}$也是幂零的,故$(I+\dfrac{N_j}{\lambda_j})$有平方根,从而我们可以得到$T|G_{(\lambda_j,T)}$的一个平方根$R_j$. 对于$\forall v\in V$,$v$可以唯一地写成$v=u_1+\cdots+u_m$,其中$u_j\in G(\lambda_j,T)$. - 我们定义算子$R\in\mathcal{L}(V):Rv=R_1u_1+\cdots+R_mu_m$.不难验证我们定义的$R$即为$T$的平方根. + 我们定义算子$R\in\mathcal{L}(V):Rv=R_1u_1+\cdots+R_mu_m$. 不难验证我们定义的$R$即为$T$的平方根. \end{enumerate} \end{proof} @@ -887,7 +887,7 @@ \subsection{平方根问题} \end{example} \begin{solution} - 由于$N^4=0$,我们设$\sqrt{I+N}=I+a_1N+a_2N^2+a_3N^3$,则$I+N=(I+a_1N+a_2N^2+a_3N^3)^2=I+2a_1N+(a_1^2+2a_2)N^2+(2a_3+2a_1a_2)N^3$,有$a_1=\dfrac{1}{2},a_2=-\dfrac{1}{8},a_3=\dfrac{1}{16}$.代入即可算出$(I+N)$的一个平方根. + 由于$N^4=0$,我们设$\sqrt{I+N}=I+a_1N+a_2N^2+a_3N^3$,则$I+N=(I+a_1N+a_2N^2+a_3N^3)^2=I+2a_1N+(a_1^2+2a_2)N^2+(2a_3+2a_1a_2)N^3$,有$a_1=\dfrac{1}{2},a_2=-\dfrac{1}{8},a_3=\dfrac{1}{16}$. 代入即可算出$(I+N)$的一个平方根. \end{solution} 最后,在开始习题内容前,我们需要讲解一类特殊的题型,即举例或举反例的问题. 一般而言,我们有如下两种思路: @@ -898,11 +898,11 @@ \subsection{平方根问题} \end{example} \begin{solution} 我们定义$\sigma\in\mathcal{L}({\mathbf{R}^3})$,$\sigma$在自然基下的矩阵为 - \begin{pmatrix} + \[ \begin{pmatrix} 0 & 1 & 0 \\ -1 & 0 & 0 \\ 0 & 0 & 0 - \end{pmatrix}. + \end{pmatrix} \] 则$0$是$\sigma$仅有的特征值,但$\sigma^3=-\sigma\neq 0$,$\sigma$不为幂零线性变换. \end{solution} \begin{example}{}{} @@ -910,10 +910,10 @@ \subsection{平方根问题} \end{example} \begin{solution} 从旋转的角度考虑可以得到$\sigma(x,y)=(x,y)\cdot$ - \begin{pmatrix} - \dfrac{\sqrt{2}}{2} & -\dfrac{\sqrt{2}}{2} \\ + \[ \begin{pmatrix} + \dfrac{\sqrt{2}}{2} & -\dfrac{\sqrt{2}}{2} \\[2ex] \dfrac{\sqrt{2}}{2} & \dfrac{\sqrt{2}}{2} - \end{pmatrix}. + \end{pmatrix} \] 满足. \end{solution} \item 考虑简单的情况:例如考虑2阶、3阶的简单线性变换/矩阵 @@ -922,20 +922,20 @@ \subsection{平方根问题} \end{example} \begin{solution} 反例:$V=\mathbf{R}^2,\sigma,\tau$在自然基下的矩阵分别为 - \begin{pmatrix} + \[ \begin{pmatrix} 0 & 1 \\ 0 & 0 - \end{pmatrix} + \end{pmatrix}, \quad \begin{pmatrix} 0 & 0 \\ 1 & 0 - \end{pmatrix}. + \end{pmatrix}\] 则$\sigma+\tau$在自然基下的矩为 - \begin{pmatrix} + \[ \begin{pmatrix} 0 & 1 \\ 1 & 0 - \end{pmatrix} - 表明$\sigma+\tau$不是幂零线性变换.从而命题不成立. + \end{pmatrix} \] + 表明$\sigma+\tau$不是幂零线性变换. 从而命题不成立. \end{solution} 很多时候一些反例很难构想就选择记住这一构造思想即可. 一些反例可能基于一些简单的结论,但如果未思考到位可能很难构造. \end{enumerate} diff --git "a/\350\256\262\344\271\211/\347\272\277\346\200\247\344\273\243\346\225\260\350\215\243\350\252\211\350\257\276\350\276\205\345\255\246\350\256\262\344\271\211.tex" "b/\350\256\262\344\271\211/\347\272\277\346\200\247\344\273\243\346\225\260\350\215\243\350\252\211\350\257\276\350\276\205\345\255\246\350\256\262\344\271\211.tex" index c4832fd..203d9a0 100644 --- "a/\350\256\262\344\271\211/\347\272\277\346\200\247\344\273\243\346\225\260\350\215\243\350\252\211\350\257\276\350\276\205\345\255\246\350\256\262\344\271\211.tex" +++ "b/\350\256\262\344\271\211/\347\272\277\346\200\247\344\273\243\346\225\260\350\215\243\350\252\211\350\257\276\350\276\205\345\255\246\350\256\262\344\271\211.tex" @@ -12,6 +12,7 @@ \usepackage{rotating} \usepackage{extarrows} \usepackage{blkarray} +\usepackage{cases} \usepackage{float} \usepackage{diagbox}