diff --git "a/\350\256\262\344\271\211/LALU-answers.tex" "b/\350\256\262\344\271\211/LALU-answers.tex" index 1fd319c..32c2c85 100644 --- "a/\350\256\262\344\271\211/LALU-answers.tex" +++ "b/\350\256\262\344\271\211/LALU-answers.tex" @@ -8,6 +8,9 @@ ]{LALUbook} \usepackage{booktabs} % Excel 导出的大表格 +\usepackage{xr} + +\externaldocument{LALU} \usetikzlibrary{arrows, arrows.meta, calc, intersections, decorations.pathreplacing, patterns, decorations.markings} diff --git "a/\350\256\262\344\271\211/\344\270\223\351\242\230/1 \351\242\204\345\244\207\347\237\245\350\257\206.tex" "b/\350\256\262\344\271\211/\344\270\223\351\242\230/1 \351\242\204\345\244\207\347\237\245\350\257\206.tex" index 8427215..1463148 100644 --- "a/\350\256\262\344\271\211/\344\270\223\351\242\230/1 \351\242\204\345\244\207\347\237\245\350\257\206.tex" +++ "b/\350\256\262\344\271\211/\344\270\223\351\242\230/1 \351\242\204\345\244\207\347\237\245\350\257\206.tex" @@ -247,8 +247,8 @@ \section{等价关系} \[B=\{(a,b)\in A\times A \mid b=f(a)\}\] 刻画了这一关系. 换言之,函数是一种特殊的关系,它要求$\forall a\in A$有且仅有一个元素$b\in A$使得$(a,b)\in B$,其中$B$为上述定义的$A\times A$的子集,这个子集就是我们熟知的函数图像. - \item 设$A=\mathbf{Z}$,关系$R$满足$a\,R\,b\iff a\equiv b \pmod n$,即模$n$同余,则$A\times A$的子集 - \[\{(a,b)\in A\times A \mid a\equiv b \pmod n\}\] + \item 设$A=\mathbf{Z}$,关系$R$满足$a\,R\,b\iff a\equiv b \bmod n$,即模$n$同余,则$A\times A$的子集 + \[\{(a,b)\in A\times A \mid a\equiv b \bmod n\}\] 可以刻画这一关系. \end{enumerate} \end{example} @@ -343,12 +343,43 @@ \section{等价关系} \section{高斯消元法} -高斯消元法是线性代数中最常用的算法之一,是之后解决大量问题所需要掌握的基本方法,同时也是考试中一定会考察的内容,无论是单独一个大题考察,还是嵌入在其它问题中. 教材中相关概念和算法的介绍已经非常详细,这里只作总结. +高斯消元法是一种求解线性方程组的方法,我们先从一个简单的例子开始: -注意考试中单独考察解方程时,时间充足时建议将过程写完整,标明初等行变换的具体步骤,并且至少写出阶梯矩阵和行简化阶梯矩阵. 除此之外,需要保证计算中尽量减少错误,时间充足可以解完方程后将答案代入进行检查. +\begin{example}{}{高斯消元法引入} + 求解线性方程组 + \begin{numcases}{} + x_1+3x_2+x_3 & =2 \\ + 3x_1+4x_2+2x_3 & =9 \\ + -x_1-5x_2+4x_3 & =10 + \end{numcases} -需要强调的是,不要认为本节内容很简单就放过了,实际上如果长期不计算高斯消元法很容易陷入眼高手低的窘境,因此希望各位同学熟悉高斯消元法的基本步骤并熟练应用. + 将方程$(1)$分别乘以$-3$和$1$加到方程$(2)$,$(3)$上消去两个方程中的$(1)$,得 + + \begin{numcases}{} + -5x_2-x_3=3 \\ + -2x_2+5x_3=12 + \end{numcases} + + 再将方程$(5)$乘以$-\dfrac{5}{2}$加到方程$(4)$上消去$x_2$可知$x_3=2$,依次代回$(4)$,$(1)$可知$x_1=3$,$x_2=-1$,$x_3=2$. +\end{example} +可以看出,求解线性方程组无非是通过加、减、乘等尽可能地减少每个方程中未知数的个数,即消元.在上面的例子中,通过几次消元后,我们得到了一个更简单的方程组 + +\begin{numcases}{} + x_1+3x_2+x_3=2 \\ + -5x_2-x_3=3 \\ + x_3=2 +\end{numcases} + +回代本质上是为了得到一个更简单的方程组 + +\begin{numcases}{} + x_1=3 \\ + x_2=-1 \\ + x_3=2 +\end{numcases}. + +下面我们将这种方法一般化. 一般的,对于一个由$m$个方程组成的$n$元(即变量数为$n$)线性方程组 \[ \begin{cases} \begin{aligned} a_{11}x_1+a_{12}x_2+\cdots+a_{1n}x_n & = b_1 \\ @@ -367,29 +398,49 @@ \section{高斯消元法} 令$\vec{\beta}_i=(a_{1i},a_{2i},\ldots,a_{mi})^\mathrm{T}$,即方程组系数矩阵的某一列,则方程组还可以记为$x_1\vec{\beta}_1+x_2\vec{\beta}_2+\cdots+x_n\vec{\beta}_n=\vec{b}$\phantomsection\label{线性方程的向量表示},这一形式将在之后多次见到. -在以上的记号下,我们可以将解线性方程组的过程转化为矩阵的初等行变换. 高斯消元法的一般步骤如下: +在以上的记号下,我们定义几个概念: + +增广矩阵:$(A,\vec{b})$,即左$n$列为系数矩阵,最右列为列向量$\vec{b}$的$b+1$列矩阵. + +阶梯矩阵:系数全零行在最下方,并且非零行中,在下方的行的第一个非零元素一定在上方行的右侧(每行第一个非零元素称主元素). + +简化阶梯矩阵:阶梯矩阵中每个主元素所在列的其余元素全为$0$. + +有了这些定义,我们可以将解线性方程组的过程转化为矩阵的初等行变换. 高斯消元法的一般步骤如下: \begin{center} 线性方程组$\overset{1}{\longrightarrow}$增广矩阵$\overset{2}{\longrightarrow}$阶梯矩阵$\overset{3}{\longrightarrow}$(行)简化阶梯矩阵$\overset{4}{\longrightarrow}$解 \end{center} \begin{enumerate}[label=步骤\arabic*~] - \item 只需要将线性方程组转化为$(A, \vec{b})$的形式,得到左$n$列为系数矩阵,最右列为列向量$\vec{b}$的$n+1$列的增广矩阵; + \item 只需要将线性方程组转化为$(A, \vec{b})$的形式,得到增广矩阵; - \item 通过初等行变换后,得到教材P34(1--13)的形式的矩阵——阶梯矩阵. 阶梯矩阵系数全零行在最下方,并且非零行中,在下方的行的第一个非零元素一定在上方行的右侧(每行第一个非零元素称主元素); + \item 通过初等行变换后,得到阶梯矩阵. - \item 将主元素化1后将主元素所在列的其他元素均通过初等行变换化为0即可; + \item 将主元素化1后将主元素所在列的其他元素均通过初等行变换化为0即可,即化为简化阶梯矩阵. \item \label{item:1:解方程组} 我们分三种情况讨论: \begin{enumerate} - \item 有唯一解:没有全零行,最后一个主元素的行号与系数矩阵的列数相等,且行简化阶梯矩阵对角线上全为1,其余元素均为0,此时可以直接写出解; + \item 有唯一解:没有全零行,最后一个主元素的行号与系数矩阵的列数相等,且行简化阶梯矩阵对角线上全为1,其余元素均为0,此时可以直接写出解.前面的例子就属于这种情况. \item 无解:出现矛盾方程,即系数为0的行的行末元素不为0,此时直接写无解即可; - \item 有无穷解:非上述情况. 此时设出自由未知量将其令为$k_1,k_2,\ldots$,然后代入增广矩阵对应的方程组即可. 注意选取自由未知量时,选取没有主元素出现的列对应的未知量会与标准答案更贴近(如教材P33选取$x_2,x_5$),当然选择其他作为自由未知量也可以. + \item 有无穷解:非上述情况. 此时设出自由未知量将其令为$k_1,k_2,\ldots$,然后代入增广矩阵对应的方程组即可. 注意选取自由未知量时,选取没有主元素出现的列对应的未知量会与标准答案更贴近,当然选择其他作为自由未知量也可以.例如如果最后得到的简化阶梯矩阵是 + \[\begin{pmatrix} + 1 & 1 & 0 & 2 \\ + 0 & 0 & 1 & -1 + \end{pmatrix}\] + 则解为$\vec{X}=(x_1,x_2,x_3)^\mathrm{T}=(2,0,-1)^\mathrm{T}+k(1,-1,0)^\mathrm{T}$. \end{enumerate} \end{enumerate} +高斯消元法是线性代数中最常用的算法之一,是之后解决大量问题所需要掌握的基本方法,同时也是考试中一定会考察的内容,无论是单独一个大题考察,还是嵌入在其它问题中. +注意考试中单独考察解方程时,时间充足时建议将过程写完整,标明初等行变换的具体步骤,并且至少写出阶梯矩阵和行简化阶梯矩阵. 除此之外,需要保证计算中尽量减少错误,时间充足可以解完方程后将答案代入进行检查. + +需要强调的是,不要认为本节内容很简单就放过了,实际上如果长期不计算高斯消元法很容易陷入眼高手低的窘境,因此希望各位同学熟悉高斯消元法的基本步骤并熟练应用. + + + 从高斯消元法开始,我们正式进入线性代数的学习. 实际上,上述 \ref*{item:1:解方程组} 中关于方程组解的情况的讨论我们是浮于表面,是基于算法最后得到的矩阵的形式进行的讨论,但事实上,这背后蕴含着更深刻的意义. 我们将会在接下来的十余个章节中讲述线性代数中的核心概念,并在\nameref{chap:朝花夕拾}中回过头来重新审视线性方程组解的问题. 相信在那时,经历十余章各式抽象概念和运算技巧的洗礼后再来回味这一问题的你,定有``守得云开见月明''之感,对线性代数的理解也会更深一层. \begin{summary} diff --git "a/\350\256\262\344\271\211/\344\270\223\351\242\230/13 \346\234\235\350\212\261\345\244\225\346\213\276.tex" "b/\350\256\262\344\271\211/\344\270\223\351\242\230/13 \346\234\235\350\212\261\345\244\225\346\213\276.tex" index 5b29829..af3f433 100644 --- "a/\350\256\262\344\271\211/\344\270\223\351\242\230/13 \346\234\235\350\212\261\345\244\225\346\213\276.tex" +++ "b/\350\256\262\344\271\211/\344\270\223\351\242\230/13 \346\234\235\350\212\261\345\244\225\346\213\276.tex" @@ -781,7 +781,7 @@ \subsection{线性方程组反问题} \[\beta_1=t_1\alpha_1+t_2\alpha_2,\ \beta_2=t_1\alpha_2+t_2\alpha_3,\ \ldots,\ \beta_{s-1}=t_1\alpha_{s-1}+t_2\alpha_s\] 试问当实数 $t_1,t_2$ 满足何条件时,$AX=\vec{0}$ 有基础解系包含向量 $\beta_1,\beta_2,\ldots,\beta_{s-1}$,并写出该基础解系中的其余向量. - \item (注:本题一般形式在教材第六章补充题1)已知线性方程组 + \item 已知线性方程组 \[\begin{cases} \begin{aligned} a_{11}x_1+a_{12}x_2+\cdots+a_{1,2n}x_{2n} & =0 \\ a_{21}x_1+a_{22}x_2+\cdots+a_{2,2n}x_{2n} & =0 \\ @@ -795,7 +795,7 @@ \subsection{线性方程组反问题} & \vdotswithin{=} \\ b_{n1}x_1+b_{n2}x_2+\cdots+b_{n,2n}x_{2n} & =0 \\ \end{aligned} \end{cases}.\] - + (注:本题的一般形式:设$A=(a_{ij})_{m\times n},m0$(否则考虑$-f(x)$). + + 取$x=\dfrac{\sum\limits_{i=0}^{n-1}|a_i|}{a_n}+2$,则$a_nx^n>\displaystyle\sum_{i=0}^{n-1}|a_i|x^n>\displaystyle\sum_{i=0}^{n-1}|a_i|x^i\geqslant |\displaystyle\sum_{i=0}^{n-1}a_ix^i|$, + + 从而$f(x)=a_nx^n+\displaystyle\sum_{i=0}^{n-1}a_ix^i>0$,$f(-x)=-a_nx^n+\displaystyle\sum_{i=0}^{n-1}a_i(-x)^i\leqslant -a_nx_n+\displaystyle\sum_{i=0}^{n-1}|a_ix^i|<0$. + 而实系数多项式在$R$上连续,故$f$一定有实的零点. + \end{answer} + \end{exgroup} \begin{exgroup} \item 设多项式$f(x)$被$(x-1),(x-2),(x-3)$除后,余式分别为$4,8,16$. 求$f(x)$被$(x-1)(x-2)(x-3)$除后的余式. + \begin{answer} + $1=\dfrac{1}{2}(x-2)(x-3)-\dfrac{1}{2}(x-4)(x-1)$,故$\dfrac{1}{2}(x-2)(x-3) \equiv1\bmod{(x-1)}$. + + 同理有$-(x-1)(x-3)\equiv1\bmod{(x-2)}$,$\dfrac{1}{2}(x-1)(x-2)\equiv1\bmod{(x-3)}$. + + 从而$f(x)\equiv\dfrac{1}{2}\times 4 \times(x-2)(x-3)-1\times 8\times(x-1)(x-3)+\dfrac{1}{2}\times 16\times(x-1)(x-2)\equiv 2x^2-2x+4\bmod{(x-1)(x-2)(x-3)}$. + \end{answer} \item 设$p,q\in\mathbf{F}[x]$,证明:$p^2 \mid q^2\iff p \mid q$. + \begin{answer} + 设$q=ps+t$,其中$\deg t<\deg p$,则$q^2=p^2s^2+2pst+t^2$. + + 从而$p^2\mid q^2\iff 2pst+t^2=0 \iff t(2ps+t)=0$.由于$\deg t<\deg p\leqslant \deg (ps)$,故$t(2ps+t)=0\iff t=0 \iff p\mid q$. + \end{answer} \item 证明:$\mathbf{F}[x]$中两个次数大于0的多项式没有公共复根的充要条件是它们互素. + \begin{answer} + \begin{enumerate} + \item 充分性:假设多项式$p,q$有公共复根$\lambda$,则$(x-\lambda)$为$p$和$q$的公因式,这与$p$和$q$互素矛盾. + \item 必要性:设$d(x)$是$p(x)$和$q(x)$的公因式,则$\deg d>1$,由代数基本定理知$d(x)$在复数域上有根,这表明$p$和$q$有公共复根,矛盾.从而$p$和$q$互素. + \end{enumerate} + \end{answer} \item 设$p\in\mathbf{F}[x]$且$q\neq 0$. 证明:$c$是$f(x)$的$k\enspace(k\geqslant 1)$重根的充要条件为 \[f(c)=f'(c)=\cdots=f^{(k-1)}(c),\enspace f^{(k)}(c)\neq 0.\] + \begin{answer} + 必要性显然.下面归纳证明充分性. + \begin{enumerate} + \item $k=1$时,命题成立. + \item 假设命题对$k$成立,则对于$k+1$,令$g(x)=f'(x)$,则$g(c)=g'(c)=\cdots=g^{(k-1)}(c)=0,g^{(k)}(c)\neq 0$,根据归纳假设,$c$是$g(x)$的$k$重根,从而$c$是$f(x)$的$(k+1)$重根,命题对$k+1$成立. + \end{enumerate} + \end{answer} \item 设$p(x)$和$q(x)$是$\mathbf{F}[x]$中的两个次数不超过$n$的多项式,若存在$\mathbf{F}$上$n+1$个不同的数$\lambda_0,\lambda_1,\ldots,\lambda_n$使得$p(\lambda_i)=q(\lambda_i),\enspace i=0,1,\ldots,n$,则$p(x)=q(x)$. + \begin{answer} + 考虑多项式$f(x)=p(x)-q(x)$,$\deg f\leqslant \max\{\deg p,\deg q\}=n$,而$m\enspace(m\geqslant 0)$次多项式至多有$m$个根,这表明$\deg f=-\infty$,只能有$f(x)\equiv 0$,从而$p(x)=q(x)$. + \end{answer} \end{exgroup} \begin{exgroup} \item 证明带余除法的其它角度. + \begin{answer} + \begin{enumerate} + \item 存在性:给定$p(x),s(x)\in\mathbf{F}[x],s(x)\neq 0$,设$A=\{r(x)\in \mathbf{F}[x]\mid\exists s(x)\in \mathbf{F}[x],p(x)=s(x)q(x)+r(x)\}$. + + 由于$p(x)=0\cdot s(x)+p(x)$,故$p(x)\in A$,$A\neq \emptyset$.若$s\mid p$,则$r(x)=0\in A$,且满足$\deg r<\deg s$. + + 否则存在$\displaystyle \min_{r\in A}\{\deg r\}$,我们证明$\deg r<\deg s$. + + 若不然,假设$r_1(x)$为$A$中次数最低的多项式,$\deg r_1=m\geqslant \deg s$,设$r_1=a_mx^m+\cdots+a_0$,则$r_2(x)=r_1(x)-s(x)\cdot a_mx^{m-\deg s}\in A$,且$\deg r_2 1$,则$T$在$\mathbf{R}$上无特征值,$T$的不变子空间只有$\{0\}$和$V$. + \end{answer} \item 设$A,B$都是$n$阶矩阵,且$r(A)+r(B)j$. 则对于$\forall j \in \{1,\ldots,n\}$,有$\sigma(v_j)=\displaystyle\sum_{i=1}^{n}a_{ij}v_i=\displaystyle\sum_{i=1}^{j}a_{ij}v_i\in \spa(v_1,\ldots,v_n)$. + +$2 \implies 3$:对$\forall v=\displaystyle\sum_{i=1}^{j}a_iv_i \in \spa(v_1,\ldots,v_j)$,有$\sigma(v)=\sigma(\displaystyle\sum_{i=1}^{j}a_iv_i)=\displaystyle\sum_{i=1}^{j}a_i\sigma(v_i)$. +由2知对于$\forall i \in \{1,\ldots,j\}$,有$\sigma(v_i) \in \spa(v_1,\ldots,v_i) \subseteq \spa(v_1,\ldots,v_j)$,从而知$\sigma(v) \in \spa(v_1,\ldots,v_j)$,$\spa(v_1,\ldots,v_j)$在$\sigma$下不变. +$3 \implies 1$:设$\sigma$关于$v_1,\ldots,v_n$的矩阵为$A=(a_{ij})_{n\times n}$对于$\forall j \in \{1,\ldots,n\}$,$\sigma(v_j)=\displaystyle\sum_{i=1}^{n}a_{ij}v_i\in \spa(v_1,\ldots,v_n)$,从而有$a_{j+1,j}=\cdots=a_{n,j}=0$,即$\forall i>j,a_{ij}=0$. 故$A$为上三角矩阵. \end{proof} 这一定理给出了上三角矩阵的几个充要条件,因此我们的想法就是利用等价条件中的某一个条件来验证任意线性变换是否可以得到上三角矩阵. 幸运的是,的确对于任意的复向量空间上的线性变换,我们可以找到一组基使得其关于这组基有上三角矩阵. @@ -596,11 +618,29 @@ \subsection{上三角标准形的存在性} 事实上,我们在这里介绍这一证明的一个重要的目的在于,这一证明给了我们一个求解线性变换(或矩阵)上三角化的方法. 与对角化等类似,线性变换的上三角化依赖于矩阵上三角化,因此我们这里只讨论矩阵的情况. 根据上面的证明,我们只需任意挑选$n$阶矩阵的一个特征值和一个对应的特征向量,然后问题就转化为求解$n-1$阶矩阵的上三角化问题,那么我们继续求出$n-1$阶矩阵的一个特征值和一个对应的特征向量,依次类推直到一阶的情况. 我们给出下面的例子供读者运用这一方法: \begin{example}{}{} - 设$\sigma\in\mathbf{C}^3$定义为$\sigma(x,y,z)=(2x+y,5y+3z,8z)$,求$\mathbf{C}^3$的一组基使得$\sigma$在这组基下的矩阵为上三角矩阵. + 设$\sigma\in\mathbf{C}^3$定义为$\sigma(x,y,z)=(2x,0,x+2z)$,求$\mathbf{C}^3$的一组基使得$\sigma$在这组基下的矩阵为上三角矩阵. \end{example} \begin{solution} - + $\sigma$在$\mathbf{C}^3$的自然基下的矩阵$A$为 + \[ \begin{pmatrix} + 2 & 0 & 0 \\ + 0 & 0 & 0 \\ + 1 & 0 & 2 + \end{pmatrix} \] + + 令$|\lambda_E-A|=0$,知$A$的一个特征值是$0$,相应的一个特征向量为$\alpha_1=(0,1,0)$.$\sigma$在$\alpha_1,e_1,e_3$下的矩阵为矩阵 + \[ \begin{pmatrix} + 0 & 0 & 0 \\ + 0 & 2 & 0 \\ + 0 & 1 & 2 + \end{pmatrix} \] + 再考虑矩阵 + \[ \begin{pmatrix} + 2 & 0 \\ + 1 & 2 + \end{pmatrix} \] + 这个矩阵的特征值为$2$,相应的特征向量为$\alpha_2=(2,0,1)$. 最后取$\alpha_3=(0,0,1)$,则$\sigma$在$\alpha_1,\alpha_2,\alpha_3$下的矩阵为上三角矩阵. \end{solution} 另一方面,我们可以再给出一个\autoref{thm:上三角矩阵存在} 的证明与这一矩阵的证明方法对应: @@ -644,11 +684,22 @@ \subsection{矩阵可交换的讨论} \begin{enumerate} \item 设$\lambda_1,\ldots,\lambda_s$是$\sigma$的$s$个不同的特征值,$V_{\lambda_1},\ldots,V_{\lambda_s}$是对应的特征子空间. 根据\autoref{thm:线性变换可交换},$V_{\lambda_1},\ldots,V_{\lambda_s}$是$\tau$的不变子空间,并且根据\autoref{thm:线性变换可交换} 的2的证明我们可以在每个特征子空间中找到一个公共的特征向量,这样我们就找到了$s$个公共且线性无关的特征向量. - \item 这一结论的证明与\autoref{thm:上三角矩阵存在} 类似,也有矩阵和商空间两个版本. - \begin{enumerate} - \item - \item - \end{enumerate} + \item 这一结论的证明与\autoref{thm:上三角矩阵存在} 类似,也有矩阵和商空间两个版 + 限于篇幅这里只给出商空间版本的证明: + 我们对维数$n$归纳证明. + \begin{enumerate} + \item $n=1$时,结论显然成立. + \item 假设命题对$n-1$成立. 由于$\sigma \tau=\tau \sigma$,故$\exists \alpha\in V$,使得$\alpha$同时为$\sigma$和$\tau$的特征向量. + + 设$U=\spa{\alpha}$,则$U$是$\sigma$和$\tau$的不变子空间. 考虑商映射$\sigma/U,\tau/U$. + 对于$\forall v+U\in V/U$,有$((\sigma/U)(\tau/U))(v+U)=(\sigma/U)(\tau(v)+U)=\sigma(\tau(v))+U=\tau(\sigma(v))+U=((\tau/U)(\sigma/U))(v+U)$,即$(\sigma/U)(\tau/U)=(\tau/U)(\sigma/U)$. + + 由$\dim V/U=n-1$,结合归纳假设可知:存在$V/U$的一组基$v_1+U,\ldots,v_{n-1}+U$,使得$\sigma/U$和$\tau/U$在这组基下都是上三角矩阵. + + 则$(\sigma/U)(v_i+U)=\sigma(v_i)+U \in \spa(v_1+U,\ldots,v_i+U)$,从而$\sigma(v_i)\in \spa(\alpha,v_1,\ldots,v_i),\forall i=1,2,\ldots,n-1$. + + 容易验证:$\alpha,v_1,\ldots,v_{n-1}$线性无关,从而构成$V$的基. 由上面的叙述可知$\sigma$在这组基下的矩阵为上三角矩阵. 同理,$\tau$在这组基下也为上三角矩阵,命题对$n$成立. 从而命题成立. + \end{enumerate} \end{enumerate} \end{proof} @@ -782,9 +833,14 @@ \subsection{幂零矩阵} \begin{proof} \begin{enumerate} - \item + \item 由于$tr(A)=tr(AB-BA)=tr(AB)-tr(BA)=0$,而$tr(A)$为$A$的所有特征值之积,这表明$0$是$A$的特征值,从而$A$不可逆. + \item 由$AB-BA=A$知$AB=BA+A$. - \item + 考虑从$\mathbf{M}_n(F)$到自身的映射$\sigma:\sigma(X)=XB-BX$,则$\sigma(A)=A$. + + 容易验证$\sigma$是线性映射. 归纳容易证明:$\sigma(A^k)=kA^k,\forall k\in \mathbb{N}^*$ + + 假设$A$不是幂零的,则对$\forall k \in \mathbb{N}^*$,有$A^k \neq 0,\sigma(A^k)=kA^k$. 这表明任意正整数$k$都是$\sigma$的特征值,这与$\sigma$最多只有$n^2$个特征值矛盾. 故$A$是幂零矩阵. \end{enumerate} \end{proof} @@ -807,9 +863,18 @@ \subsection{平方根问题} \begin{proof} \begin{enumerate} - \item + \item 从$\sqrt{1+x}=1+a_1x+a_2x^2+\cdots$受到启发,我们猜测$I+N$有形如$I+a_1N+a_2N^2+\cdots$的平方根. + 由于$N$是幂零的,故存在正整数$m$,使得$N^m=0$,从而上面的式子成为一个有限和$I+a_1N+a_2N^2+\cdots+a_{m-1}N^{m-1}$. + + 我们希望$(I+a_1N+a_2N^2+\cdots+a_{m-1}N^{m-1})^2=I+2a_1N+(2a_2+a_1)N^2+(2a_3+2a_1a_2)N^3+\cdots+(2a_{m-1}+f(a_1,\ldots,a_{m-2})N^{m-1})$等于$I+N$. 所以取$2a_1=1$,再取$a_2$使得$2a_2+a_1^2=0$. + + 对所有$j=3,4,\ldots,m-1$如此进行下去,每次都能得到相应的$a_j$,我们并不关心$a_j$的显式公式,只需知道这些$a_j$的选取确实给出了$(I+N)$的一个平方根. + \item 设$\lambda_1,\ldots,\lambda_m$是$T$所有互不相同的本征值,则对每个$j$都存在一个幂零算子$N_j\in \mathcal{L}(G(\lambda_j,T))$使得$T|G_{(\lambda_j,T)}=\lambda_jI+N_j$. 因为$T$可逆,所以$\lambda_j \neq 0$,于是有$T|G_{\lambda_j,T}=\lambda_j(I+\dfrac{N_j}{\lambda_j})$. + 显然$\dfrac{N_j}{\lambda_j}$也是幂零的,故$(I+\dfrac{N_j}{\lambda_j})$有平方根,从而我们可以得到$T|G_{(\lambda_j,T)}$的一个平方根$R_j$. - \item + 对于$\forall v\in V$,$v$可以唯一地写成$v=u_1+\cdots+u_m$,其中$u_j\in G(\lambda_j,T)$. + + 我们定义算子$R\in\mathcal{L}(V):Rv=R_1u_1+\cdots+R_mu_m$. 不难验证我们定义的$R$即为$T$的平方根. \end{enumerate} \end{proof} @@ -822,7 +887,7 @@ \subsection{平方根问题} \end{example} \begin{solution} - + 由于$N^4=0$,我们设$\sqrt{I+N}=I+a_1N+a_2N^2+a_3N^3$,则$I+N=(I+a_1N+a_2N^2+a_3N^3)^2=I+2a_1N+(a_1^2+2a_2)N^2+(2a_3+2a_1a_2)N^3$,有$a_1=\dfrac{1}{2},a_2=-\dfrac{1}{8},a_3=\dfrac{1}{16}$. 代入即可算出$(I+N)$的一个平方根. \end{solution} 最后,在开始习题内容前,我们需要讲解一类特殊的题型,即举例或举反例的问题. 一般而言,我们有如下两种思路: @@ -831,14 +896,47 @@ \subsection{平方根问题} \begin{example}{}{} 找出有限维实向量空间的一个线性变换$\sigma$,使得0是$\sigma$仅有的特征值但$\sigma$不是幂零线性变换. \end{example} + \begin{solution} + 我们定义$\sigma\in\mathcal{L}({\mathbf{R}^3})$,$\sigma$在自然基下的矩阵为 + \[ \begin{pmatrix} + 0 & 1 & 0 \\ + -1 & 0 & 0 \\ + 0 & 0 & 0 + \end{pmatrix} \] + 则$0$是$\sigma$仅有的特征值,但$\sigma^3=-\sigma\neq 0$,$\sigma$不为幂零线性变换. + \end{solution} \begin{example}{}{} 找出一个$\sigma\in L(\mathbf{R}^2)$使得$\sigma^4=-I$. \end{example} - + \begin{solution} + 从旋转的角度考虑可以得到$\sigma(x,y)=(x,y)\cdot$ + \[ \begin{pmatrix} + \dfrac{\sqrt{2}}{2} & -\dfrac{\sqrt{2}}{2} \\[2ex] + \dfrac{\sqrt{2}}{2} & \dfrac{\sqrt{2}}{2} + \end{pmatrix} \] + 满足. + \end{solution} \item 考虑简单的情况:例如考虑2阶、3阶的简单线性变换/矩阵 \begin{example}{}{} 证明或给出反例:$V$上的幂零线性变换的集合是$L(V)$的子空间. \end{example} + \begin{solution} + 反例:$V=\mathbf{R}^2,\sigma,\tau$在自然基下的矩阵分别为 + \[ \begin{pmatrix} + 0 & 1 \\ + 0 & 0 + \end{pmatrix}, \quad + \begin{pmatrix} + 0 & 0 \\ + 1 & 0 + \end{pmatrix}\] + 则$\sigma+\tau$在自然基下的矩为 + \[ \begin{pmatrix} + 0 & 1 \\ + 1 & 0 + \end{pmatrix} \] + 表明$\sigma+\tau$不是幂零线性变换. 从而命题不成立. + \end{solution} 很多时候一些反例很难构想就选择记住这一构造思想即可. 一些反例可能基于一些简单的结论,但如果未思考到位可能很难构造. \end{enumerate} @@ -855,7 +953,13 @@ \subsection{平方根问题} \begin{exgroup} \item 请举例:存在两个矩阵相抵但不相似. - + \begin{answer} + 非常简单,可以举$\begin{pmatrix} + 1 & 0 \\ 0 & 1 + \end{pmatrix}$和$\begin{pmatrix} + 1 & 0 \\ 0 & 2 + \end{pmatrix}$的例子,也可以举一个可对角化另一个不可对角化的例子,因为上述情况矩阵对应的相似标准形不一样,故不相似. + \end{answer} \item 求矩阵 \[A = \begin{pmatrix} 0 & -1 & 1 \\ @@ -863,7 +967,9 @@ \subsection{平方根问题} 1 & 1 & 0 \end{pmatrix}\] 的所有特征值,对应的特征子空间,以及与 $A$ 相似的一个对角矩阵. - + \begin{answer} + 解$|\lambda E-A|=0$可得特征值为$1,1,-2$. 然后解$(E-A)X=0$得$X=t_1(-1,1,0)^\mathrm{T}+t_2(1,0,1)^\mathrm{T}$;解$(-2E-A)X=0$,得$X=t(-1,-1,1)^\mathrm{T}$. 可见特征值1对应的特征子空间为$\spa((-1,1,0)^\mathrm{T},(1,0,1)^\mathrm{T})$,特征值$-2$对应的特征子空间为 $\spa((-1,-1,1)^\mathrm{T})$. 可知与$A$相似的对角矩阵为 $\diag(1,1,-2)$. + \end{answer} \item 设$A=\begin{pmatrix} a & b \\ c & d \end{pmatrix}$为二阶实矩阵. @@ -872,7 +978,15 @@ \subsection{平方根问题} \item 若$ad-bc=1$,$|a+d|>2$,问:$A$是否可对角化. \end{enumerate} - + \begin{answer} + \begin{enumerate} + \item $f(\lambda)=|\lambda E-A|=\begin{vmatrix} + \lambda-a & -b \\ -c & \lambda-d + \end{vmatrix}=\lambda^2-(a+d)\lambda+(ad-bc)=\lambda^2-(a+d)\lambda+|A|$. 由于$|A|<0$,因此判别式$\Delta=(a+d)^2-4|A|>0$,因此二阶矩阵$A$有两个互异特征值,故可对角化,因此与对角矩阵相似; + + \item 同 (1),判别式$\Delta=(a+d)^2-4|A|>0$,因此二阶矩阵$A$有两个不同的特征值,故可对角化. + \end{enumerate} + \end{answer} \item 设$A=\begin{pmatrix} 1 & 1 & a \\ 1 & a & 1 \\ @@ -885,26 +999,73 @@ \subsection{平方根问题} \item 求可逆矩阵$P$使得$P^{-1}AP$为对角矩阵. \end{enumerate} - + \begin{answer} + \begin{enumerate} + \item 由Cramer法则,$A$为方阵且$AX=\beta$有解但不唯一,即$|A|\neq 0$,解得$a=-2$或$a=1$,分别代入可知$a=1$时增广矩阵的秩为2,而$r(A)=1$,故无解;$a=-2$时增广矩阵的秩为2,而$r(A)=2$,故有解,故$a=-2$. + + \item 容易求得特征值为$0,-3,3$,求特征向量可知$P=\begin{pmatrix} + 1 & -1 & 1 \\ 1 & 0 & -2 \\ 1 & 1 & 1 + \end{pmatrix}$. + \end{enumerate} + \end{answer} \item 设$A$为三阶矩阵,$\alpha_1,\alpha_2,\alpha_3$线性无关,且$A\alpha_1=\alpha_1,A\alpha_2=\alpha_1+\alpha_2-2\alpha_3,A\alpha_3=\alpha_1-2\alpha_2+\alpha_3$,求$A$的特征值. - + \begin{answer} + 由分块矩阵乘法,$A(\alpha_1,\alpha_2,\alpha_3)=(A\alpha_1,A\alpha_2,A\alpha_3)=(\alpha_1,\alpha_1+\alpha_2-2\alpha_3,\alpha_1-2\alpha_2+\alpha_3)=(\alpha_1,\alpha_2,\alpha_3)\begin{pmatrix} + 1 & 1 & 1 \\ 0 & 1 & -2 \\ 0 & -2 & 1 + \end{pmatrix}$. 令$P=(\alpha_1,\alpha_2,\alpha_3)$,则$AP=P\begin{pmatrix} + 1 & 1 & 1 \\ 0 & 1 & -2 \\ 0 & -2 & 1 + \end{pmatrix}=PB$,即$P^{-1}AP=B$,故$A$与$B$相似,故两矩阵的特征值相同,简单求解$B$的特征值即得$A$的特征值为$1,-1,3$. + \end{answer} \item 设三阶实对称矩阵$A$的各行元素之和为3,向量$\alpha_1=(-1,2,-1)^\mathrm{T}$,$\alpha_2=(0,-1,1)^\mathrm{T}$是方程组$AX=0$的两个解,求矩阵$P$使得$P^{-1}AP$为对角矩阵. + \begin{answer} + 每行元素之和为3,则我们知道$\alpha=(1,1,1)^\mathrm{T}$是3对应的特征向量(具体理由只需要验证$A\alpha=3\alpha$即可,这是很常用的性质),而$AX=0$的解是对应特征值0的特征向量,故由题意可知取$P=\begin{pmatrix} + 1 & -1 & 0 \\ 1 & 2 & -1 \\ 1 & -1 & 1 + \end{pmatrix}$,则$P^{-1}AP=\begin{pmatrix} + 3 & 0 & 0 \\ 0 & 0 & 0 \\ 0 & 0 & 0 + \end{pmatrix}$. + \end{answer} \end{exgroup} \begin{exgroup} \item 设$a\neq b$,且$(aE-A)(bE-A)=O$. 证明:$A$可对角化(特例:对合矩阵); + \begin{answer} + 回忆例题中$A^2=2A$,即$A(A-2E)=O$的证明,我们知道$A$的特征值只能为$a$或$b$,然后我们可以证明$r(aE-A)+r(bE-A)\leqslant n$和$r(aE-A)+r(bE-A)\geqslant n$,因此$r(aE-A)+r(bE-A)=n$,即$A$可对角化(由于和例题完全类似,这里不再展开具体做法). + \end{answer} \item 证明:满足$A^2=E$且特征值只有1的矩阵只能是$E$,特征值只有$-1$的矩阵只能是$-E$. + \begin{answer} + 若$A^2=E$,则$A$可对角化.设$A=P^{-1}BP$,$B$为对角矩阵,若$A$的特征值只有$1$,则$B=E$,从而$A=P^{-1}EP=E$.若$A$的特征值只有$-1$,则$B=-E$,从而$A=-E$. + \end{answer} \item 设$A$为三阶矩阵,$A^2=A$且$r(A)=r$,求$|A-2E|$. + \begin{answer} + 根据例题中关于$A^2=A$的讨论可知,满足$A^2=A$的矩阵$A$可对角化(设过渡矩阵为$P$),特征值0和1的重数分别为$n-r$和$r$,因此$|A-2E|=|P^{-1}||A-2E||P|=|\diag(-1,\ldots,-1,-2,\ldots,-2)|=(-1)^r(-2)^{n-r}$. + \end{answer} \item 设$T\in \mathcal{L}(\mathbf{C}^3)$使得6和7是$T$的特征值,且$T$不可对角化. 证明:存在$(x,y,z)\in\mathbf{C}^3$使得$T(x,y,z)=(17+8x,\sqrt{5}+8y,2\pi+8z)$. + \begin{answer} + 三阶矩阵如果有三个特征值则一定可对角化,故由题意$T$只能有6和7两个特征值. 故$\lambda\neq 6,7$时$T-\lambda I$都是可逆的(回顾正文中的定理),故$T-8I$可逆(故是满射),因此一定存在$(x,y,z)\in\mathbf{C}^3$使得$(T-8I)(x,y,z)=(17,\sqrt{5},2\pi)$,因此存在$(x,y,z)\in\mathbf{C}^3$使得$T(x,y,z)=(17+8x,\sqrt{5}+8y,2\pi+8z)$. + \end{answer} \item 证明:两个可对角化的同阶矩阵特征值相同(包括重数)等价于它们相似. 对于不可对角化的矩阵来说,这一结论还成立吗? + \begin{answer} + 可对角化矩阵特征值(包括重数)相等则相似标准形(对角矩阵)相等,故一定相似. 不可对角化的举例说明不成立:$\begin{pmatrix} + 0 & 1 & 0 \\ 0 & 0 & 1 \\ 0 & 0 & 0 + \end{pmatrix}$和$\begin{pmatrix} + 0 & 1 & 0 \\ 0 & 0 & 0 \\ 0 & 0 & 0 + \end{pmatrix}$的特征值全为0(重数均为3),但它们对应不同的若当标准形(之后章节会介绍),因此不相似. + \end{answer} \item 设$A=\begin{pmatrix} 2 & 2 & 0 \\ 8 & 2 & a \\ 0 & 0 & 6 \end{pmatrix}$相似于对角矩阵,求常数$a$,并求可逆矩阵$P$使得$P^{-1}AP$为对角矩阵. + \begin{answer} + 直接计算$|\lambda E-A|=0$,得到$A$的特征值为$-2,6,6$,因为$A$可对角化,则特征值6对应的特征子空间为2维,即$(6E-A)X=0$的解空间为2维,根据齐次线性方程组一般理论,$r(6E-A)=3-2=1$,即$r\begin{pmatrix} + 4 & -2 & 0 \\ -8 & 4 & -a \\ 0 & 0 & 0 + \end{pmatrix}=1$,显然$a=0$. 接下来求解-2和6对应的特征向量即可,得到可行的解$P=\begin{pmatrix} + -1 & 1 & 0 \\ 2 & 2 & 0 \\ 0 & 0 & 1 + \end{pmatrix}$. + \end{answer} \item 设$A=(a_{ij})_{n\times n}$是上三角矩阵. \begin{enumerate} @@ -914,6 +1075,15 @@ \subsection{平方根问题} \item 若$n$个主对角元相等且$A$不为对角矩阵,证明:$A$不与对角阵相似. \end{enumerate} + \begin{answer} + \begin{enumerate} + \item 上三角矩阵特征值就是所有主对角元$a_{ii},\enspace i=1,2,\ldots,n$; + + \item 由(1)知主对角元互不相等表示$A$有$n$个互不相等的特征值,故可对角化; + + \item 由(1)知此时$A$有一个$n$重特征值,记为$c$,则所有特征向量都在$(cE-A)X=0$的解空间中,而$r(cE-A)=1$,故解空间维数为$n-1