diff --git "a/\350\256\262\344\271\211/\344\270\223\351\242\230/10 \350\241\214\345\210\227\345\274\217.tex" "b/\350\256\262\344\271\211/\344\270\223\351\242\230/10 \350\241\214\345\210\227\345\274\217.tex" index ae8c6a6..dded99e 100644 --- "a/\350\256\262\344\271\211/\344\270\223\351\242\230/10 \350\241\214\345\210\227\345\274\217.tex" +++ "b/\350\256\262\344\271\211/\344\270\223\351\242\230/10 \350\241\214\345\210\227\345\274\217.tex" @@ -759,7 +759,7 @@ \subsection{范德蒙(Vandermonde)行列式} 由于$V_1,V_2,\ldots,V_s$是$V$的非平凡子空间,因此每个子空间最多包含$\{\beta_k\}$中$n-1$个向量,进而$V_1\cup V_2\cup\cdots\cup V_s$只包含$\{\beta_k\}$中有限个向量,所以必然存在一个向量$\beta_j$使得$\beta_j \notin V_1\cup V_2\cup\cdots\cup V_s$. \end{proof} -行列式计算的核心思想:观察行列式的特征,通过用一行消去其它所有行或者通过逐行相减化出更多的 $0$,得到模板行列式(例如上三角、箭形等)求解;或者通过一些明显的技巧性方法(例如递推法)来求解. +下面我们将介绍行列式运算的一些技巧,这些技巧有一些可以总结的核心思想:观察行列式的特征,通过用一行消去其它所有行或者通过逐行相减化出更多的 $0$,得到模板行列式(例如上三角、箭形等)求解;或者通过一些明显的技巧性方法(例如递推法)来求解. \subsection{化三角形法} @@ -837,26 +837,26 @@ \subsection{连加法} 观察到每一行的和都是相同的,所以我们可以将每一列都累加到第一列上,得到 \begin{align*} D_n & =\begin{vmatrix} - \displaystyle\sum_{i=1}^{n} x_i-m & x_2 & \cdots & x_n \\ - \displaystyle\sum_{i=1}^{n} x_i-m & x_2-m & \cdots & x_n \\ + \displaystyle\sum_{i=1}^{n}\limits x_i-m & x_2 & \cdots & x_n \\ + \displaystyle\sum_{i=1}^{n}\limits x_i-m & x_2-m & \cdots & x_n \\ \vdots & \vdots & \ddots & \vdots \\ - \displaystyle\sum_{i=1}^{n} x_i-m & x_2 & \cdots & x_n-m + \displaystyle\sum_{i=1}^{n}\limits x_i-m & x_2 & \cdots & x_n-m \end{vmatrix} \\ - & =\left(\sum_{i=1}^{n} x_i-m\right) + & =\left(\sum_{i=1}^{n}\limits x_i-m\right) \begin{vmatrix} 1 & x_2 & \cdots & x_n \\ 1 & x_2-m & \cdots & x_n \\ \vdots & \vdots & \ddots & \vdots \\ 1 & x_2 & \cdots & x_n-m \end{vmatrix} \\ - & =\left(\sum_{i=1}^{n} x_i-m\right) + & =\left(\sum_{i=1}^{n}\limits x_i-m\right) \begin{vmatrix} 1 & x_2 & \cdots & x_n \\ & -m & & \\ & & \ddots & \\ & & & -m \end{vmatrix} \\ - & =(-m)^{n-1}\left(\sum_{i=1}^{n} x_i-m\right). + & =(-m)^{n-1}\left(\sum_{i=1}^{n}\limits x_i-m\right). \end{align*} \end{solution} @@ -1503,7 +1503,7 @@ \section{Laplace定理} \section{Cauchy-Binet 公式} -我们已经证明,方阵乘积的行列式等于各方阵行列式之积. 现在的问题是:如果 $A$ 是 $m \times n$ 矩阵,$B$ 是 $n \times m$ 矩阵,$AB$ 是 $m$ 阶方阵,则行列式 $|AB|$ 应该等于什么?Cauchy-Binet(柯西–毕内)公式回答了这个问题. 它可以看成是矩阵乘法的行列式定理的推广. +我们已经证明,方阵乘积的行列式等于各方阵行列式之积. 现在的问题是:如果 $A$ 是 $m \times n$ 矩阵,$B$ 是 $n \times m$ 矩阵,$AB$ 是 $m$ 阶方阵,则行列式 $|AB|$ 应该等于什么?Cauchy-Binet 公式回答了这个问题. 它可以看成是矩阵乘法的行列式定理的推广. \begin{theorem}{Cauchy-Binet 公式}{Cauchy-Binet 公式} 设 $A = (a_{ij})$ 是 $m \times n$ 矩阵,$B = (b_{ij})$ 是 $n \times m$ 矩阵. @@ -1516,9 +1516,9 @@ \section{Cauchy-Binet 公式} 表示 $A$ 的一个 $s$ 阶子式,它由 $A$ 的第 $i_1, \cdots, i_s$ 行与第 $j_1, \cdots, j_s$ 列交点上的元素按原次序排列组成的行列式. 同理可定义 $B$ 的 $s$ 阶子式. \begin{enumerate} \item 若 $m > n$,则必有 $|AB| = 0$; - \item 若 $m \leq n$,则必有 + \item 若 $m \leqslant n$,则必有 $$ - |AB| = \sum_{1 \leq j_1 < j_2 < \cdots < j_m \leq n} A + |AB| = \sum_{1 \leqslant j_1 < j_2 < \cdots < j_m \leqslant n} A \begin{pmatrix} 1 & 2 & \cdots & m \\ j_1 & j_2 & \cdots & j_m @@ -1557,9 +1557,9 @@ \section{Cauchy-Binet 公式} |M| = (-1)^{(n+1)+(n+2)+\cdots+(n+m)} \cdot I_n ||AB| = (-1)^{n(m+1)} |AB|. $$ - 再来计算 $|C|$,用 Laplace 定理按前 $m$ 行展开. 这时若 $m > n$,则前 $m$ 行中任意一个 $m$ 阶子式至少有一列全为零,因此行列式值等于零,即 $|AB| = 0$. 若 $m \leq n$,则由 Laplace 定理得 + 再来计算 $|C|$,用 Laplace 定理按前 $m$ 行展开. 这时若 $m > n$,则前 $m$ 行中任意一个 $m$ 阶子式至少有一列全为零,因此行列式值等于零,即 $|AB| = 0$. 若 $m \leqslant n$,则由 Laplace 定理得 $$ - |C| = \sum_{1 \leq j_1 < j_2 < \cdots < j_m \leq n} A + |C| = \sum_{1 \leqslant j_1 < j_2 < \cdots < j_m \leqslant n} A \begin{pmatrix} 1 & 2 & \cdots & m \\ j_1 & j_2 & \cdots & j_m @@ -1595,7 +1595,7 @@ \section{Cauchy-Binet 公式} 注意到 $ (i_1 + i_2 + \cdots + i_{n-m}) + (j_1 + j_2 + \cdots + j_m) = 1 + 2 + \cdots + n $.综合上面的结论,经过简单计算不难得到 - $$ |AB| = \sum_{1 \leq j_1 < j_2 < \cdots < j_m \leq n} A + $$ |AB| = \sum_{1 \leqslant j_1 < j_2 < \cdots < j_m \leqslant n} A \begin{pmatrix} 1 & 2 & \cdots & m \\ j_1 & j_2 & \cdots & j_m @@ -1611,17 +1611,18 @@ \section{Cauchy-Binet 公式} 下面的定理是 Cauchy-Binet 公式的进一步推广,它告诉我们如何求矩阵乘积的 $r$ 阶子式. \begin{theorem}{}{Cauchy-Binet 公式推广} - 设 $A = (a_{ij})$ 是 $m \times n$ 矩阵,$B = (b_{ij})$ 是 $n \times m$ 矩阵,$r$ 是一个正整数且 $r \leq m$. + 设 $A = (a_{ij})$ 是 $m \times n$ 矩阵,$B = (b_{ij})$ 是 $n \times m$ 矩阵,$r$ 是一个正整数且 $r \leqslant m$. \begin{enumerate} \item 若 $r > n$,则 $AB$ 的任意一个 $r$ 阶子式等于零; - \item 若 $r \leq n$,则 $AB$ 的 $r$ 阶子式 - $$ + \item 若 $r \leqslant n$,则 $AB$ 的 $r$ 阶子式 + \end{enumerate} + \[ AB \begin{pmatrix} i_1 & i_2 & \cdots & i_r \\ j_1 & j_2 & \cdots & j_r \end{pmatrix} - = \sum_{1 \leq k_1 < k_2 < \cdots < k_r \leq n} A + = \sum_{1 \leqslant k_1 < k_2 < \cdots < k_r \leqslant n} A \begin{pmatrix} i_1 & i_2 & \cdots & i_r \\ k_1 & k_2 & \cdots & k_r @@ -1631,8 +1632,7 @@ \section{Cauchy-Binet 公式} k_1 & k_2 & \cdots & k_r \\ j_1 & j_2 & \cdots & j_r \end{pmatrix}. - $$ - \end{enumerate} + \] \end{theorem} \begin{proof} @@ -1665,14 +1665,14 @@ \section{Cauchy-Binet 公式} \begin{pmatrix} i_1 & i_2 & \cdots & i_r \\ j_1 & j_2 & \cdots & j_r - \end{pmatrix} = 0$;当 $r \leq n$ 时, + \end{pmatrix} = 0$;当 $r \leqslant n$ 时, $$ C \begin{pmatrix} i_1 & i_2 & \cdots & i_r \\ j_1 & j_2 & \cdots & j_r \end{pmatrix} $$ - $$ =\sum_{1 \leq k_1 < k_2 < \cdots < k_r \leq n} A + $$ =\sum_{1 \leqslant k_1 < k_2 < \cdots < k_r \leqslant n} A \begin{pmatrix} i_1 & i_2 & \cdots & i_r \\ k_1 & k_2 & \cdots & k_r @@ -1693,36 +1693,36 @@ \section{Cauchy-Binet 公式} 如果满足条件 $i_1 = j_1, i_2 = j_2, \cdots, i_r = j_r$,则称为主子式. \begin{corollary}{}{} - 设 $A$ 是 $m \times n$ 实矩阵,则矩阵 $AA'$ 的任一主子式都非负. + 设 $A$ 是 $m \times n$ 实矩阵,则矩阵 $AA\mathrm{T}$ 的任一主子式都非负. \end{corollary} \begin{proof} - 若 $r \leq n$,则由 \autoref{thm:Cauchy-Binet 公式推广} 得到: - $$ AA' + 若 $r \leqslant n$,则由 \autoref{thm:Cauchy-Binet 公式推广} 得到: + $$ AA\mathrm{T} \begin{pmatrix} i_1 & i_2 & \cdots & i_r \\ i_1 & i_2 & \cdots & i_r \end{pmatrix} - = \sum_{1 \leq k_1 < k_2 < \cdots < k_r \leq n} A + = \sum_{1 \leqslant k_1 < k_2 < \cdots < k_r \leqslant n} A \begin{pmatrix} i_1 & i_2 & \cdots & i_r \\ k_1 & k_2 & \cdots & k_r - \end{pmatrix}^2 \geq 0; $$ - 若 $r > n$,则 $AA'$ 的任一 $r$ 阶主子式等于零,结论也成立. + \end{pmatrix}^2 \geqslant 0; $$ + 若 $r > n$,则 $AA\mathrm{T}$ 的任一 $r$ 阶主子式等于零,结论也成立. \end{proof} -下面介绍 Cauchy-Binet 公式的两个重要应用. 它们分别是著名的 Lagrange (拉格朗日) 恒等式和 Cauchy-Schwarz (柯西-许瓦茨) 不等式. 这两个结论也可以用其他方法证明,但用矩阵方法显得非常简洁. +下面介绍 Cauchy-Binet 公式的两个重要应用. 它们分别是著名的 Lagrange 恒等式和 Cauchy-Schwarz 不等式. 这两个结论也可以用其他方法证明,但用矩阵方法显得非常简洁. \begin{example}{}{} - 证明 Lagrange 恒等式 $(n \geq 2)$: - $$ \left( \sum_{i=1}^{n} a_i^2 \right) \left( \sum_{i=1}^{n} b_i^2 \right) - \left( \sum_{i=1}^{n} a_i b_i \right)^2 = \sum_{1 \leq i < j \leq n} (a_i b_j - a_j b_i)^2. $$ + 证明 Lagrange 恒等式 $(n \geqslant 2)$: + $$ \left( \sum_{i=1}^{n}\limits a_i^2 \right) \left( \sum_{i=1}^{n}\limits b_i^2 \right) - \left( \sum_{i=1}^{n}\limits a_i b_i \right)^2 = \sum_{1 \leqslant i < j \leqslant n} (a_i b_j - a_j b_i)^2. $$ \end{example} \begin{solution} 左边的式子等于 $$ \begin{vmatrix} - \sum_{i=1}^{n} a_i^2 & \sum_{i=1}^{n} a_i b_i \\ - \sum_{i=1}^{n} a_i b_i & \sum_{i=1}^{n} b_i^2 + \sum_{i=1}^{n}\limits a_i^2 & \sum_{i=1}^{n}\limits a_i b_i \\ + \sum_{i=1}^{n}\limits a_i b_i & \sum_{i=1}^{n}\limits b_i^2 \end{vmatrix}, $$ 这个行列式对应的矩阵可化为: @@ -1740,22 +1740,22 @@ \section{Cauchy-Binet 公式} $$ \begin{vmatrix} - \sum_{i=1}^{n} a_i^2 & \sum_{i=1}^{n} a_i b_i \\ - \sum_{i=1}^{n} a_i b_i & \sum_{i=1}^{n} b_i^2 + \sum_{i=1}^{n}\limits a_i^2 & \sum_{i=1}^{n}\limits a_i b_i \\ + \sum_{i=1}^{n}\limits a_i b_i & \sum_{i=1}^{n}\limits b_i^2 \end{vmatrix} - = \sum_{1 \leq i < j \leq n} + = \sum_{1 \leqslant i < j \leqslant n} \begin{vmatrix} a_i & a_j \\ b_i & b_j \end{vmatrix}^2 - = \sum_{1 \leq i < j \leq n} (a_i b_j - a_j b_i)^2. + = \sum_{1 \leqslant i < j \leqslant n} (a_i b_j - a_j b_i)^2. $$ \end{solution} \begin{example}{}{} 设 $a_i, b_i$ 都是实数,证明 Cauchy-Schwarz 不等式: $$ - \left( \sum_{i=1}^{n} a_i^2 \right) \left( \sum_{i=1}^{n} b_i^2 \right) \geq \left( \sum_{i=1}^{n} a_i b_i \right)^2. + \left( \sum_{i=1}^{n}\limits a_i^2 \right) \left( \sum_{i=1}^{n}\limits b_i^2 \right) \geqslant \left( \sum_{i=1}^{n}\limits a_i b_i \right)^2. $$ \end{example} @@ -2581,7 +2581,7 @@ \subsection{关于秩的总结} & & & a_n \end{vmatrix} \\ = & \left(\prod_{k=1}^{n} a_{k}+\frac{1}{a_{2}} - \prod_{k=1}^{n} a_{k}\right)\left(1+\sum_{i=1}^{n} \frac{1}{a_{i}}\right). + \prod_{k=1}^{n} a_{k}\right)\left(1+\sum_{i=1}^{n}\limits \frac{1}{a_{i}}\right). \end{align*} \end{enumerate} \end{answer} @@ -3411,6 +3411,11 @@ \subsection{关于秩的总结} \end{exgroup} \begin{exgroup} + \item 证明:无法定义非方阵的行列式,使其与方阵行列式的定义相容. + \begin{answer} + + \end{answer} + \item 设$A=(a_{ij})$是$n\enspace(n\geqslant 2)$阶整数方阵,满足对任意的$i,j$,$|A|$均可整除$a_{ij}$,证明:$|A|=\pm 1$. \begin{answer} 设 $a_{ij} = |A| b_{ij}$,其中 $b_{ij}$ 为整数,则 diff --git "a/\350\256\262\344\271\211/\344\270\223\351\242\230/11 \346\234\235\350\212\261\345\244\225\346\213\276.tex" "b/\350\256\262\344\271\211/\344\270\223\351\242\230/11 \346\234\235\350\212\261\345\244\225\346\213\276.tex" index 3b082f0..dc56c3c 100644 --- "a/\350\256\262\344\271\211/\344\270\223\351\242\230/11 \346\234\235\350\212\261\345\244\225\346\213\276.tex" +++ "b/\350\256\262\344\271\211/\344\270\223\351\242\230/11 \346\234\235\350\212\261\345\244\225\346\213\276.tex" @@ -11,8 +11,16 @@ \subsection{线性方程组解的一般理论} \begin{theorem}{线性方程组有解的充要条件}{有解条件} 线性方程组有解的充分必要条件是其系数矩阵与增广矩阵有相同的秩. \end{theorem} -定理的证明非常简单,这里简要介绍思路:将方程组视为$x_1\beta_1+x_2\beta_2+\cdots+x_n\beta_n=\vec{b}$($\beta_i$就是系数矩阵的第$i$列),则有解的条件为$\vec{b}$可以被$\beta_1,\ldots,\beta_n$线性表示,这等价于向量组$(\beta_1,\ldots,\beta_n)$与$(\beta_1,\ldots,\beta_n,\vec{b})$等价,故定理成立. +定理的证明非常简单,这里简要介绍思路:将方程组视为$x_1\beta_1+x_2\beta_2+\cdots+x_n\beta_n=\vec{b}$($\beta_i$就是系数矩阵的第$i$列),则有解的条件为$\vec{b}$可以被$\beta_1,\ldots,\beta_n$线性表示,这等价于向量组$(\beta_1,\ldots,\beta_n)$与$(\beta_1,\ldots,\beta_n,\vec{b})$等价,故定理成立. 下面是一个应用的例子: +\begin{example}{}{} + 设$n$阶矩阵$A$的行列式$|A|\neq 0$,记$A$的前$n-1$列形成的矩阵为$A_1$,$A$的第$n$列为$\vec{b}$,问:线性方程组$A_1X=\vec{b}$是否有解? +\end{example} +\begin{solution} + 无解;$|A|\neq 0$可知$r(A)=n$,$r(A_1)=n-1$,因此系数矩阵$A_1$的秩小于增广矩阵$A$的秩$n$,故无解. +\end{solution} + +下面这一定理讨论方程组有解的情况下,唯一解和无穷解的条件,根据高斯消元法这一定理是很显然的: \begin{theorem}{}{方程组解} 当方程组有解时(注意这个前提),以下定理成立: \begin{enumerate} @@ -21,18 +29,8 @@ \subsection{线性方程组解的一般理论} \item 如果$A$的秩小于$n$,则方程组有无穷多个解. \end{enumerate} \end{theorem} -实际上,当系数矩阵为方阵时,这一定理就是 \nameref{thm:Cramer}结论的一部分,我们不再赘述其证明. 实际上,通过上面两个定理我们首先了解了线性方程组有无解的一般准则,然后讨论了有解前提下唯一解、无穷解对应于什么情况. 事实上,有关线性方程组解的情况的讨论至此文意已尽. 无论是理论层面或是解决题目的方面,这两个定理都为我们提供了足量的信息. -\begin{example}{}{} - 设$n$阶矩阵$A$的行列式$|A|\neq 0$,记$A$的前$n-1$列形成的矩阵为$A_1$,$A$的第$n$列为$\vec{b}$,问:线性方程组$A_1X=\vec{b}$是否有解? -\end{example} - -\begin{solution} - 无解;$|A|\neq 0$可知$r(A)=n$,$r(A_1)=n-1$,因此系数矩阵$A_1$的秩小于增广矩阵$A$的秩$n$,故无解. -\end{solution} -\section{Cramer法则} - -从历史角度来开,引入行列式是用于求解线性方程组的. 瑞士数学家克莱姆(Cramer)于1750年在他的《线性代数分析导言》中发表了这一方法. 事实上莱布尼兹〔1693〕,以及麦克劳林〔1748〕亦研究了这一法则,但他们的记法不如克莱姆清晰. 接下来我们介绍这一充满历史底蕴的定理: +当系数矩阵为方阵时,这一定理就是著名的\nameref{thm:Cramer}结论的一部分. 从历史角度来开,引入行列式是用于求解线性方程组的. 瑞士数学家克莱姆(Cramer)于1750年在他的《线性代数分析导言》中发表了这一方法. 事实上莱布尼兹〔1693〕,以及麦克劳林〔1748〕亦研究了这一法则,但他们的记法不如克莱姆清晰. 接下来我们介绍这一充满历史底蕴的定理: \begin{theorem}{Cramer法则}{Cramer} \index{Cramer@Cramer 法则 (Cramer's rule)} 对线性方程组 \begin{gather} @@ -140,7 +138,7 @@ \section{Cramer法则} \[x_1=\dfrac{D_1}{D}=\dfrac{a_2a_3}{(a_2-a_1)(a_3-a_1)},\]\[x_2=\dfrac{D_2}{D}=\dfrac{a_1a_3}{(a_1-a_2)(a_3-a_2)},\]\[x_3=\dfrac{D_3}{D}=\dfrac{a_1a_2}{(a_1-a_3)(a_2-a_3)}.\] \end{solution} -事实上,Cramer法则在定理内容中已经给我们提供了关于线性方程组解的理论的重要结论——它实现了我们第一讲中提到的方程组解的情况的更一般化的讨论,即不需要化为简化阶梯矩阵就可以利用更为一般化的结论判断方程组解的情况,我们将在朝花夕拾中进行更完整的讨论. +因此通过上述定理我们首先了解了线性方程组有无解的一般准则,然后讨论了有解前提下唯一解、无穷解对应于什么情况,并且给出了求解的方法. 事实上,有关线性方程组解的情况的讨论至此文意已尽. 无论是理论层面或是解决题目的方面,这两个定理都为我们提供了足量的信息. \subsection{齐次线性方程组解的一般理论} @@ -269,7 +267,7 @@ \subsection{非齐次线性方程组解的一般理论} 即$\eta_2-\eta_1,\eta_3-\eta_1,\ldots,\eta_{n-r+2}-\eta_1$线性无关,因此$AX=\vec{0}$的解向量至少有$n-r+1$个线性无关,这与$AX=\vec{0}$的解空间维数为$n-r$矛盾,故假设不成立,命题得证. \end{proof} -\subsection{从对偶到线性方程组} +\section{线性方程组解的几何解释} 接下来从对偶空间的角度探讨一下线性方程组的结构问题. 考虑方程组 $Ax = b$,我们将其写开: @@ -298,7 +296,7 @@ \subsection{从对偶到线性方程组} 我们知道,这样的一组纤维构成一个仿射子集,而仿射子集无非就是一个超平面,所以,现在上面的直观已经被用代数的语言描述了. 接下来,让我们考察仿射子集的交,也就是以下引理: -\begin{lemma} +\begin{lemma}{}{} 仿射子集的交如果非空,则它依然是仿射子集. \end{lemma} @@ -338,9 +336,7 @@ \subsection{从对偶到线性方程组} \bigcap_{i = 1}^m \varphi_i^{-1} (b_i) = v_0 + \bigcap_{i = 0}^m \ker \varphi_i \] -我们将前面部分称为特解,后面部分称为通解. 而通解如我们所见就是 $Ax = 0$ 的解. 于是,参照我们在 1.3 节末尾给出的评述,$Ax = 0$ 的解空间的维数就是 $\dim N(\mathop{\mathrm{span}} \{\varphi_i\}) = \dim V - \mathop{\mathrm{span}} \{\varphi_i\}$. 因此,我们只需考察在 $m$ 个线性泛函当中,有多少个是线性无关的. 而在我们给出了对偶空间中的坐标之后,这就等价于是一个求矩阵秩的问题了. - -最后的一个反思是,对偶空间的意义到底在哪?在最开始,我们已经提到过,线性泛函就是超平面,超平面与点具备对偶关系. 而这样的对偶关系延伸开去,就是两种对线性方程组的视角,其中,超平面的交的视角在上文中已经得到了充分的解释,而点的视角还没说明.如果将 $(a_{i1}, a_{i2}, \cdots, a_{in})$ 视作一个点,那么我们的求解任务就是找一个超平面过 $m$ 个点. 而我们在中学阶段就已经知道,要证明一组点共面是一个比较麻烦的事情,但是求一组面是否有交点往往来说是比较轻松的. 因此,我们通过对偶空间进行了一个翻译工作,将求一组点所共的那些面转化成了一些面所交的那些点,进而对问题完成了简化. +我们将前面部分称为特解,后面部分称为通解. 而通解如我们所见就是 $Ax = 0$ 的解. 于是,参照\autoref{thm:零化子维数}以及\autoref{lem:NU性质},$Ax = 0$ 的解空间的维数就是 $\dim N(\mathop{\mathrm{span}} \{\varphi_i\}) = \dim V - \mathop{\mathrm{span}} \{\varphi_i\}$. 因此,我们只需考察在 $m$ 个线性泛函当中,有多少个是线性无关的. 而在我们给出了对偶空间中的坐标之后,这就等价于是一个求矩阵秩的问题了. \section{理论应用} diff --git "a/\350\256\262\344\271\211/\344\270\223\351\242\230/24 \345\245\207\345\274\202\345\200\274\345\210\206\350\247\243.tex" "b/\350\256\262\344\271\211/\344\270\223\351\242\230/21 \345\245\207\345\274\202\345\200\274\345\210\206\350\247\243.tex" similarity index 100% rename from "\350\256\262\344\271\211/\344\270\223\351\242\230/24 \345\245\207\345\274\202\345\200\274\345\210\206\350\247\243.tex" rename to "\350\256\262\344\271\211/\344\270\223\351\242\230/21 \345\245\207\345\274\202\345\200\274\345\210\206\350\247\243.tex" diff --git "a/\350\256\262\344\271\211/\344\270\223\351\242\230/21 \347\272\277\346\200\247\344\273\243\346\225\260\344\270\216\345\207\240\344\275\225.tex" "b/\350\256\262\344\271\211/\344\270\223\351\242\230/21 \347\272\277\346\200\247\344\273\243\346\225\260\344\270\216\345\207\240\344\275\225.tex" deleted file mode 100644 index 00167d5..0000000 --- "a/\350\256\262\344\271\211/\344\270\223\351\242\230/21 \347\272\277\346\200\247\344\273\243\346\225\260\344\270\216\345\207\240\344\275\225.tex" +++ /dev/null @@ -1,155 +0,0 @@ -\chapter{线性代数与几何} - -解析几何很大程度上是线性代数发展的初衷,在研究点线面以及几何体时,将集体的几何问题抽象化为代数问题使其方便解决与计算,即是解析几何的主要思想. 本节我们将会从线性代数的角度探究解析几何的一些基本概念与方法. 此在线性代数课程的考察中也会有少部分的解析几何内容,但内容较浅,主要考察点、直线、平面等之间的关系. - -\section{欧几里得空间} - -在前面的学习中我们已经较为全面地学习了内积空间的相关知识,而在解析几何中,我们在更多情况下会研究\term{欧几里得空间}\index{oujilidekongjian@欧几里得空间 (Euclidean space)}下的问题. -\begin{definition}{欧几里得空间}{} - 欧几里得空间(欧氏空间)是一个有限维实内积空间. -\end{definition} -同学们可能对欧氏空间的几何直观更为熟悉. 当欧氏空间的维数为 2 或 3 时,我们可以用熟悉的平面直角坐标系与空间直角坐标系来描述欧氏空间中的向量,并用点积作为向量的内积. - -\section{欧氏空间上的运算} - -我们也已经基本掌握了模、内积、夹角等在内积空间中的基本概念,在此我们引入一些在先前的学习中接触较少的概念. -\begin{definition}{点积}{} \index{dianji@点积 (dot product)} - \term{点积}是在三维欧氏空间中对两个向量的运算,用$\vec{a}\cdot\vec{b}$表示. 两向量点积得到的数值等于两向量模长的乘积与两向量夹角的余弦的乘积. -\end{definition} -特别的,三维欧氏空间中的向量点积$(a_1,a_2,a_3)\cdot(b_1,b_2,b_3)$可以表示为\[a_1b_1+a_2b_2+a_3b_3\] -由点积的计算,我们可以很方便地得到两向量夹角的余弦,即\[\cos\theta=\frac{\vec{a}\cdot\vec{b}}{|\vec{a}||\vec{b}|}\] -\begin{definition}{叉乘}{} \index{chacheng@叉乘 (cross product)} - \term{叉乘}是在三维欧氏空间中对两个向量的运算,用$\vec{a}\times\vec{b}$表示. 两向量叉乘得到的向量垂直于两向量,方向遵循右手定则,其模长为两向量的模的乘积与两向量夹角的正弦的乘积. -\end{definition} -由定义可知,叉乘仅在三维欧氏空间中有定义,且叉乘的结果是一个向量,而不是一个数. 关于叉乘向量的计算有另一种更常用的用行列式表示的计算方法,即 -\[(a_1,a_2,a_3)\times(b_1,b_2,b_3)=\begin{vmatrix} - \vec{i} & \vec{j} & \vec{k} \\ - a_1 & a_2 & a_3 \\ - b_1 & b_2 & b_3 - \end{vmatrix}\] -其中$\vec{i},\vec{j},\vec{k}$为三维欧氏空间的自然基. - -在解析几何中,叉乘的一个重要应用是求解与两向量垂直的向量. -\begin{definition}{混合积}{} \index{hunheji@混合积 (mixed product)} \index{biaoliangsancongji@标量三重积 (scalar triple product)} - \term{混合积}(或称\term{标量三重积},不同于\term{矢量三重积})是三维欧氏空间中对三个向量的运算,用$[\vec{a},\vec{b},\vec{c}]$表示,等价于$(\vec{a}\times\vec{b})\cdot\vec{c}$. -\end{definition} -混合积的几何意义是以$\vec{a},\vec{b},\vec{c}$为邻边的平行六面体的体积,可以用行列式表示为 -\[[(a_1,a_2,a_3),(b_1,b_2,b_3),(c_1,c_2,c_3)]=\begin{vmatrix} - a_1 & a_2 & a_3 \\ - b_1 & b_2 & b_3 \\ - c_1 & c_2 & c_3 - \end{vmatrix}\] -同时读者也不难验证 $ (\vec{a}\times\vec{b})\cdot\vec{c} = \vec{a}\cdot(\vec{b}\times\vec{c}) $. 其应用之一是可以用来判断三个向量是否共面. - -\section{点、直线、平面的表示} - -一个点在欧氏空间中可以用一个向量来表示. 在三维欧氏空间中,我们可以用三个实数来表示一个点的坐标. - -\subsection{平面的方程} - -平面是欧氏空间中的一个基本几何对象,我们有多种代数方法来表示平面. - -平面的一般方程是平面的一种最基本的表示方法,即$Ax+By+Cz+D=0$. 平面的一般方程十分简洁,但是我们很难由此方程得到平面的几何性质,因此我们还需要考虑其他的表示方法. 例如,一个平面由平面上一点与平面上两个不共线的向量来表示. 假设已知平面上一点$P(x_0,y_0,z_0)$和平面上两个不共线的向量$\vec{u}=(a,b,c)$和$\vec{v}=(d,e,f)$,则平面上的任意一点$Q(x,y,z)$都满足$\overrightarrow{PQ}$与$\vec{u}$和$\vec{v}$线性相关,即 -\[\overrightarrow{PQ}=k_1\vec{u}+k_2\vec{v}\] -化为坐标形式即为 -\[\begin{cases} - x=x_0+k_1a+k_2d \\ - y=y_0+k_1b+k_2e \\ - z=z_0+k_1c+k_2f - \end{cases}\] -这就是平面的参数方程,其中$k_1,k_2$是参数. - -此外,平面还可以由平面上一点和平面的法向量来表示. 假设已知平面上一点$P(x_0,y_0,z_0)$和平面的法向量$\vec{n}=(A,B,C)$,则平面上的任意一点$Q(x,y,z)$都满足向量$\overrightarrow{PQ}$与$\vec{n}$垂直,即点积为0. 由此可得其方程为\[A(x-x_0)+B(y-y_0)+C(z-z_0)=0\]这种表示方法称为\term{点法式}. - -我们发现这跟平面的一般方程十分相似,实际上,我们可以直接通过平面的一般方程得到平面的法向量. - -在得到一张由其他方式表示的平面时,我们往往也会将其转化为一般式或点法式,以便于我们计算其与其他几何对象的关系. 例如,得到一个由平面上一点与平面上两不共线的向量表示的平面,则可以通过求两向量的叉积得到平面的法向量,从而得到平面的点法式. - -\begin{example}{}{} - 若已知一个平面上有三点$A(1,2,0),\enspace B(0,1,-1),\enspace C(1,1,1)$,求该平面的一般方程. -\end{example} - -\subsection{直线的方程} - -直线在欧氏空间中也是一个基本对象,同样有多种代数方法可以表示直线. - -首先直线可以用某两张平面的交表示. 假设有两相交平面的方程,联立可得直线方程 -\[\begin{cases} - A_1x+B_1y+C_1z+D_1=0 \\ - A_2x+B_2y+C_2z+D_2=0 - \end{cases}\] -即为直线的一般方程. 这种联立方程的表示方法最为基本,但是不够简洁,大多情况下也不够直观. 所以更多情况下我们希望在表示中可以直观体现直线的一些特征. 因此,可以用直线上的一个点和直线的方向(即方向向量)来确定一条直线. - -假设已知直线上的一点$A_0(x_0,y_0,z_0)$和直线的方向向量$\vec{l}=(a,b,c)$,则直线上的任意一点$A(x,y,z)$都满足$\overrightarrow{AA_0}$与$\vec{l}$平行,用具体的方程则表示为 -\[\frac{x-x_0}{a}=\frac{y-y_0}{b}=\frac{z-z_0}{c}\] -其中$a,b,c$不为零. 这种表示方法称为\term{点向式}. - -如果我们对上述式子进行替换,令\[t=\frac{x-x_0}{a}=\frac{y-y_0}{b}=\frac{z-z_0}{c}\] -则可得 -\[\begin{cases} - x=x_0+at \\ - y=y_0+bt \\ - z=z_0+ct - \end{cases}\] -这样就得到了直线的参数方程,其中$t$为参数. - -当然还有以两点确定一条直线的表示方法,我们可以轻松地算出直线的方向向量,然后用点向式或参数方程来表示. 最后可以得出方程 -\[\frac{x-x_1}{x_2-x_1}=\frac{y-y_1}{y_2-y_1}=\frac{z-z_1}{z_2-z_1}\] - -那么如何实现从一般方程到点向式或参数方程的转换呢?最简单的方法是求解线性方程组再用两点表示或者参数表示,但是这样的方法比较麻烦,事实上我们可以利用法向量进行转换. 假设两平面的一般方程为$A_1x+B_1y+C_1z+D_1=0$与$A_2x+B_2y+C_2z+D_2=0$,则可以得到两平面的法向量分别为$\vec{n}_1=(A_1,B_1,C_1),\enspace\vec{n}_2=(A_2,B_2,C_2)$,因为该直线在两张平面内,所以直线与两个法向量都垂直,所以$\vec{n}_1\times\vec{n}_2$即为直线的方向向量. 再求出一般方程的一个解(即直线上一点)即可得到直线的点向式与参数方程. - -\section{平面与直线间的位置关系} - -对于三维欧氏空间中的几何对象,我们主要需要研究平行、相交与重合等关系. 我们可以通过平面与直线的方程来判断. - -\subsection{线与线的位置关系} - -线与线之间的位置关系判断主要依靠它们的方向向量. 如果两条直线的方向向量平行,则两条直线平行或重合,此时再判断两直线是否存在公共点,若联立方程有解,说明两直线重合,否则两条直线平行. 如果两条直线的方向向量不平行,则还需要判断两条直线是否共面,若共面则说明两条直线相交,否则两条直线异面. 此时以两直线方程联立方程组,若有解则说明存在交点,否则说明两条直线异面. - -\begin{example}{}{} - 已知直线$L_1=\begin{cases} - x+y+z-1=0 \\ - x-2y+2=0 - \end{cases},\enspace L_2=\begin{cases} - x=2t \\ - y=t+a \\ - z=bt+1 - \end{cases}$,试确定$a,b$的值使得$L_1,L_2$是: - \begin{enumerate} - \item 平行直线; - - \item 异面直线. - \end{enumerate} -\end{example} - -\subsection{线与面的位置关系} - -线与面的位置关系首先需要判断线的方向向量与平面的法向量的关系. 如果方向向量与法向量平行,则说明线与面垂直. 如果两者垂直,则说明该直线与平面平行或者在平面内,只需再判断直线上的点是否在平面内即可. - -此外还有一些对于平面不同表示形式的方法. 例如,假设已知直线的方向向量与平面上两个不平行的向量,则可以对这三个向量做混合积,如果混合积为零,则说明三个向量共面,即直线与平面平行或者在平面内. - -\subsection{面与面的位置关系} - -面与面的位置关系主要依靠两个平面的法向量来判断. 如果两个平面的法向量平行,则说明两个平面平行或重合,再判断两平面是否存在公共点. 若两法向量垂直,则两平面也垂直. - -\begin{summary} - - 这里关于解析几何的部分浅尝辄止,只是简单地介绍了一些基本的概念与方法,希望能够帮助大家对解析几何有一个简单的初步认识. 在线性代数课程中可能的相关考察基本也仅限于点、线、面之间的关系,方程的联立、求解等等,或许大家在未来其他课程的学习中可以学到更多相关的知识. - -\end{summary} - -\begin{exercise} - \exquote[笛卡尔]{我决心放弃那个仅仅是抽象的几何. 这就是说,不再去考虑那些仅仅是用来练思想的问题. 我这样做,是为了研究另一种几何,即目的在于解释自然现象的几何.} - - \begin{exgroup} - \item - \end{exgroup} - - \begin{exgroup} - \item - \end{exgroup} - - \begin{exgroup} - \item - \end{exgroup} -\end{exercise} diff --git "a/\350\256\262\344\271\211/\344\270\223\351\242\230/22 \347\272\277\346\200\247\344\273\243\346\225\260\344\270\216\345\207\240\344\275\225.tex" "b/\350\256\262\344\271\211/\344\270\223\351\242\230/22 \347\272\277\346\200\247\344\273\243\346\225\260\344\270\216\345\207\240\344\275\225.tex" new file mode 100644 index 0000000..5c78c8a --- /dev/null +++ "b/\350\256\262\344\271\211/\344\270\223\351\242\230/22 \347\272\277\346\200\247\344\273\243\346\225\260\344\270\216\345\207\240\344\275\225.tex" @@ -0,0 +1,453 @@ +\chapter{线性代数与几何} + +解析几何很大程度上是线性代数发展的初衷,在研究点线面以及几何体时,将集体的几何问题抽象化为代数问题使其方便解决与计算,即是解析几何的主要思想. 本节我们将会从线性代数的角度探究解析几何的一些基本概念与方法. 此在线性代数课程的考察中也会有少部分的解析几何内容,但内容较浅,主要考察点、直线、平面等之间的关系. + +\section{欧氏空间上的运算} + +我们也已经基本掌握了模、内积、夹角等在内积空间中的基本概念,在此我们引入一些在先前的学习中接触较少的概念. +\begin{definition}{点积}{} \index{dianji@点积 (dot product)} + \term{点积}是在三维欧氏空间中对两个向量的运算,用$\vec{a}\cdot\vec{b}$表示. 两向量点积得到的数值等于两向量模长的乘积与两向量夹角的余弦的乘积. +\end{definition} +特别的,三维欧氏空间中的向量点积$(a_1,a_2,a_3)\cdot(b_1,b_2,b_3)$可以表示为\[a_1b_1+a_2b_2+a_3b_3\] +由点积的计算,我们可以很方便地得到两向量夹角的余弦,即\[\cos\theta=\frac{\vec{a}\cdot\vec{b}}{|\vec{a}||\vec{b}|}\] +\begin{definition}{叉乘}{} \index{chacheng@叉乘 (cross product)} + \term{叉乘}是在三维欧氏空间中对两个向量的运算,用$\vec{a}\times\vec{b}$表示. 两向量叉乘得到的向量垂直于两向量,方向遵循右手定则,其模长为两向量的模的乘积与两向量夹角的正弦的乘积. +\end{definition} +由定义可知,叉乘仅在三维欧氏空间中有定义,且叉乘的结果是一个向量,而不是一个数. 关于叉乘向量的计算有另一种更常用的用行列式表示的计算方法,即 +\[(a_1,a_2,a_3)\times(b_1,b_2,b_3)=\begin{vmatrix} + \vec{i} & \vec{j} & \vec{k} \\ + a_1 & a_2 & a_3 \\ + b_1 & b_2 & b_3 + \end{vmatrix}\] +其中$\vec{i},\vec{j},\vec{k}$为三维欧氏空间的自然基. + +在解析几何中,叉乘的一个重要应用是求解与两向量垂直的向量. +\begin{definition}{混合积}{} \index{hunheji@混合积 (mixed product)} \index{biaoliangsancongji@标量三重积 (scalar triple product)} + \term{混合积}(或称\term{标量三重积},不同于\term{矢量三重积})是三维欧氏空间中对三个向量的运算,用$[\vec{a},\vec{b},\vec{c}]$表示,等价于$(\vec{a}\times\vec{b})\cdot\vec{c}$. +\end{definition} +混合积的几何意义是以$\vec{a},\vec{b},\vec{c}$为邻边的平行六面体的体积,可以用行列式表示为 +\[[(a_1,a_2,a_3),(b_1,b_2,b_3),(c_1,c_2,c_3)]=\begin{vmatrix} + a_1 & a_2 & a_3 \\ + b_1 & b_2 & b_3 \\ + c_1 & c_2 & c_3 + \end{vmatrix}\] +同时读者也不难验证 $ (\vec{a}\times\vec{b})\cdot\vec{c} = \vec{a}\cdot(\vec{b}\times\vec{c}) $. 其应用之一是可以用来判断三个向量是否共面. + +\section{点、直线、平面的表示} + +一个点在欧氏空间中可以用一个向量来表示. 在三维欧氏空间中,我们可以用三个实数来表示一个点的坐标. + +\subsection{平面的方程} + +平面是欧氏空间中的一个基本几何对象,我们有多种代数方法来表示平面. + +平面的一般方程是平面的一种最基本的表示方法,即$Ax+By+Cz+D=0$. 平面的一般方程十分简洁,但是我们很难由此方程得到平面的几何性质,因此我们还需要考虑其他的表示方法. 例如,一个平面由平面上一点与平面上两个不共线的向量来表示. 假设已知平面上一点$P(x_0,y_0,z_0)$和平面上两个不共线的向量$\vec{u}=(a,b,c)$和$\vec{v}=(d,e,f)$,则平面上的任意一点$Q(x,y,z)$都满足$\overrightarrow{PQ}$与$\vec{u}$和$\vec{v}$线性相关,即 +\[\overrightarrow{PQ}=k_1\vec{u}+k_2\vec{v}\] +化为坐标形式即为 +\[\begin{cases} + x=x_0+k_1a+k_2d \\ + y=y_0+k_1b+k_2e \\ + z=z_0+k_1c+k_2f + \end{cases}\] +这就是平面的参数方程,其中$k_1,k_2$是参数. + +此外,平面还可以由平面上一点和平面的法向量来表示. 假设已知平面上一点$P(x_0,y_0,z_0)$和平面的法向量$\vec{n}=(A,B,C)$,则平面上的任意一点$Q(x,y,z)$都满足向量$\overrightarrow{PQ}$与$\vec{n}$垂直,即点积为0. 由此可得其方程为\[A(x-x_0)+B(y-y_0)+C(z-z_0)=0\]这种表示方法称为\term{点法式}. + +我们发现这跟平面的一般方程十分相似,实际上,我们可以直接通过平面的一般方程得到平面的法向量. + +在得到一张由其他方式表示的平面时,我们往往也会将其转化为一般式或点法式,以便于我们计算其与其他几何对象的关系. 例如,得到一个由平面上一点与平面上两不共线的向量表示的平面,则可以通过求两向量的叉积得到平面的法向量,从而得到平面的点法式. + +\begin{example}{}{} + 若已知一个平面上有三点$A(1,2,0),\enspace B(0,1,-1),\enspace C(1,1,1)$,求该平面的一般方程. +\end{example} + +\subsection{直线的方程} + +直线在欧氏空间中也是一个基本对象,同样有多种代数方法可以表示直线. + +首先直线可以用某两张平面的交表示. 假设有两相交平面的方程,联立可得直线方程 +\[\begin{cases} + A_1x+B_1y+C_1z+D_1=0 \\ + A_2x+B_2y+C_2z+D_2=0 + \end{cases}\] +即为直线的一般方程. 这种联立方程的表示方法最为基本,但是不够简洁,大多情况下也不够直观. 所以更多情况下我们希望在表示中可以直观体现直线的一些特征. 因此,可以用直线上的一个点和直线的方向(即方向向量)来确定一条直线. + +假设已知直线上的一点$A_0(x_0,y_0,z_0)$和直线的方向向量$\vec{l}=(a,b,c)$,则直线上的任意一点$A(x,y,z)$都满足$\overrightarrow{AA_0}$与$\vec{l}$平行,用具体的方程则表示为 +\[\frac{x-x_0}{a}=\frac{y-y_0}{b}=\frac{z-z_0}{c}\] +其中$a,b,c$不为零. 这种表示方法称为\term{点向式}. + +如果我们对上述式子进行替换,令\[t=\frac{x-x_0}{a}=\frac{y-y_0}{b}=\frac{z-z_0}{c}\] +则可得 +\[\begin{cases} + x=x_0+at \\ + y=y_0+bt \\ + z=z_0+ct + \end{cases}\] +这样就得到了直线的参数方程,其中$t$为参数. + +当然还有以两点确定一条直线的表示方法,我们可以轻松地算出直线的方向向量,然后用点向式或参数方程来表示. 最后可以得出方程 +\[\frac{x-x_1}{x_2-x_1}=\frac{y-y_1}{y_2-y_1}=\frac{z-z_1}{z_2-z_1}\] + +那么如何实现从一般方程到点向式或参数方程的转换呢?最简单的方法是求解线性方程组再用两点表示或者参数表示,但是这样的方法比较麻烦,事实上我们可以利用法向量进行转换. 假设两平面的一般方程为$A_1x+B_1y+C_1z+D_1=0$与$A_2x+B_2y+C_2z+D_2=0$,则可以得到两平面的法向量分别为$\vec{n}_1=(A_1,B_1,C_1),\enspace\vec{n}_2=(A_2,B_2,C_2)$,因为该直线在两张平面内,所以直线与两个法向量都垂直,所以$\vec{n}_1\times\vec{n}_2$即为直线的方向向量. 再求出一般方程的一个解(即直线上一点)即可得到直线的点向式与参数方程. + +\section{平面与直线间的位置关系} + +对于三维欧氏空间中的几何对象,我们主要需要研究平行、相交与重合等关系. 我们可以通过平面与直线的方程来判断. + +\subsection{线与线的位置关系} + +线与线之间的位置关系判断主要依靠它们的方向向量. 如果两条直线的方向向量平行,则两条直线平行或重合,此时再判断两直线是否存在公共点,若联立方程有解,说明两直线重合,否则两条直线平行. 如果两条直线的方向向量不平行,则还需要判断两条直线是否共面,若共面则说明两条直线相交,否则两条直线异面. 此时以两直线方程联立方程组,若有解则说明存在交点,否则说明两条直线异面. + +\begin{example}{}{} + 已知直线$L_1=\begin{cases} + x+y+z-1=0 \\ + x-2y+2=0 + \end{cases},\enspace L_2=\begin{cases} + x=2t \\ + y=t+a \\ + z=bt+1 + \end{cases}$,试确定$a,b$的值使得$L_1,L_2$是: + \begin{enumerate} + \item 平行直线; + + \item 异面直线. + \end{enumerate} +\end{example} + +\subsection{线与面的位置关系} + +线与面的位置关系首先需要判断线的方向向量与平面的法向量的关系. 如果方向向量与法向量平行,则说明线与面垂直. 如果两者垂直,则说明该直线与平面平行或者在平面内,只需再判断直线上的点是否在平面内即可. + +此外还有一些对于平面不同表示形式的方法. 例如,假设已知直线的方向向量与平面上两个不平行的向量,则可以对这三个向量做混合积,如果混合积为零,则说明三个向量共面,即直线与平面平行或者在平面内. + +\subsection{面与面的位置关系} + +面与面的位置关系主要依靠两个平面的法向量来判断. 如果两个平面的法向量平行,则说明两个平面平行或重合,再判断两平面是否存在公共点. 若两法向量垂直,则两平面也垂直. + +\subsection{平面与点的位置关系} +一个空间中的平面 $\Gamma$ 可以以一个方程表示: +\[ +A x + B y + C z + D = 0 +\] +它的一个法向量是 $\vec{n} = (A, B, C)$,因此我们说一个向量 $\vec{a}$ 在平面 $\Gamma$ 中当且仅当 +\[ +\langle \vec{n}, \vec{a} \rangle = -D +\] +一个简单的观察是,$D$ 表征了平面和原点之间的距离. 实际上,平面和原点之间的距离就是 +\[ +d_{O\text{-}\Gamma} = \frac{\abs{D}}{\sqrt{A^2 + B^2 + C^2}} +\] +这并不难估计,只需注意到 +\[ +\langle \vec{n}, \frac{-D}{A^2 + B^2 + C^2}\vec{n} \rangle = -D +\] +即可. 另一种计算方式也可由截距入手,读者可自行计算直角四面体的体积,这留作一个习题. 有了这个式子之后,我们就能考虑任意一点到平面的距离. 这种考虑的第一个步骤是考虑怎么将某个点``移作''原点,实际上,设这个点的向量表示为 $\vec{b}$,我们就有一个新的以内积的形式作的表示: +\[ +\left\langle \vec{n}, \vec{a} + \vec{b} \right\rangle = -D +\] +利用线性性将其写开,并移项,得到新的平面的常数项: +\[ +D' = \langle \vec{n}, \vec{b} \rangle + D +\] +将此式代入到已有的方程中,就能得到: +\[ +d_{\vec{b}\text{-}\Gamma} = \frac{\abs{\langle \vec{n}, \vec{b} \rangle + D}}{\sqrt{A^2 + B^2 + C^2}} +\] +或者,如果你宁愿为了得到一个更为优雅的方程而多加一些标记,把 $\vec{b}$ 记作 $(x_0, y_0, z_0)$,则可以得到结果: +\[ +d_{\vec{b}\text{-}\Gamma} = \frac{\abs{A x_0 + B y_0 + C z_0 + D}}{\sqrt{A^2 + B^2 + C^2}} +\] +另一种同样利用内积的推导方式是利用 Cauchy-Schwartz 不等式,同样见诸习题. + +另一个式子是球方程. 就球而言,我们需要考虑的事情其实很少. 一个圆心为 $\vec{a}$,半径为 $r$ 的球 $C$ 中的点 $\vec{x}$ 满足方程: +\[ +\langle \vec{x} - \vec{a}, \vec{x} - \vec{a} \rangle = r^2 +\] +如果你乐意的话,也可以将其展开: +\[ +\langle \vec{x}, \vec{x} \rangle - 2 \langle \vec{x}, \vec{a} \rangle + \langle \vec{a}, \vec{a} \rangle - r^2 = 0 +\] +它是一个二次的形式. 对它而言,我们更关注的是它的另外一个性质:其切点的向量表示就是切面的一个法向量,在后面的讨论中,这将是至关重要的一点. 因为相切关系的平移不变性,我们给出以下结果: + +\begin{theorem}{}{} +球 $\langle \vec{x}, \vec{x} \rangle = r^2$ 与平面 $\langle \vec{n}, \vec{x} \rangle = -D$ 在点 $\vec{t}$ 处相交,且总共有且仅有一个交点(即相切)当且仅当: +\begin{enumerate} + \item $\langle \vec{t}, \vec{t} \rangle = r^2, \quad \langle \vec{n}, \vec{t} \rangle = -D$,即 $\vec{t}$ 既在圆上,也在平面上; + \item 存在 $\lambda \in \R$ 使得 $\vec{t} = \lambda \vec{n}$ 成立,即 $\vec{t}$ 和 $\vec{n}$ 共线. +\end{enumerate} +\end{theorem} + +这个命题的证明与命题本身一样显而易见,只要利用二次方程的求根公式即可,与圆和直线相切的推导别无二致,请读者自行完成证明. + +\section{射影空间与仿射变换} + +在不考虑内积的情况下,在向量空间中的几何性质当中,实际上只有共线性和共线点之间的比例是特殊的. 在此,我们定义 + +\begin{definition}{}{} + 称一个保持共线性和定比分点性质的映射为仿射变换(affine transformation). +\end{definition} + +一个重要的结论如下: +\begin{theorem}{}{} + $\R^n \to \R^m$ 的仿射变换全体就是所有形如 + \[ + F(u) = A u + v + \] + 的映射全体 +\end{theorem} + +这个结论告诉我们,仿射变换就是线性变换的一种推广. 它实际上就是线性变换和平移操作的复合. 这个结论的证明并不复杂: + +\begin{proof} + 零点的像平移、基的像线性变换(利用共线性和定比分点性质推导出线性变换的定义). +\end{proof} + +% 例子:平移、旋转、拉伸、斜截 + +但是,这样的记号多少有点不够精致. 我们知道的线性变换有了非常丰富的性质,所以我们也希望能够把仿射变换做成某种线性映射. 考虑一个更加形式性的解法: +\[ +A u + v = \begin{pmatrix} + A & v \\ + 0 & 1 +\end{pmatrix} \begin{pmatrix} + u \\ 1 +\end{pmatrix} +\] +作为分块矩阵,它们自然地能够满足仿射变换的需求,但是它将一个 $\R^n \to \R^m$ 的仿射变换表示为了一个 $\R^{n + 1} \to \R^{m + 1}$ 的线性变换. 但是,这样的表示依然是不够充分的. 这是因为我们``要求''向量为一个末尾为 $1$ 的向量,而矩阵的最后一行也被确定为一个末尾为 $1$ 的行向量. 基于此限制的线性变换是``过度受限''的. 因此,我们希望更多地以几何的方式解读这些限制,而不是以代数的方式将其强加到空间之上. + +回顾对平面方程的讨论. 我们业已提及,一个平面的表达式就是 +\[ +\langle \vec{n}, \vec{a} \rangle = -D +\] +注意到,这里的法向量 $\vec{n}$ 是没有正规化的. 也就是说,实际上平面方程由两种东西决定:一是 $\vec{n}$ 的坐标,一是 $-D$ 的取值,而且实际上平面方程就相当于 +\[ +\langle (\vec{n}, D), (\vec{a}, 1) \rangle = 0 +\] +而且左边的向量似乎可以在相差一个倍数的意义下表示同一个平面. 因此,我们定义: +\begin{definition}{}{} + 称空间 $\R^{n + 1}$ 关于如下等价关系构成的等价类为 $n$ 维实射影空间: + \[ + x \sim y \iff \exists k \in \R, x = k y + \] + 将其构成的集合全体记作 $\mathbf{PR}^n$. +\end{definition} + +现在,我们完成了从代数到几何最关键的一步:通过一个等价关系,原来的线性空间变成了一个看上去相当奇怪的结构. 但是,它把捉了几何上重要的``比值''关系. 接下来的部分当中,我们就需要讨论实射影空间所具备的结构特征. + +注意到,在射影空间之间,存在一个事实上很平凡的嵌入关系: +\begin{lemma}{}{} + $\mathbf{PR}^{n - 1}$ 能够被自然地嵌入到 $\mathbf{PR}^n$ 当中,此嵌入映射如下: + \[ + [x] \mapsto [(x, 0)] + \] +\end{lemma} + +证明只需要验证这个映射的良定性即可. 不难发现,这个映射实际上是一个单射. 而且在去掉所有形如 $[(x, 0)]$ 的等价类之后,剩下的所有等价类就是所有形如 $[(x, 1)]$ 的等价类. 也就是说: +\begin{theorem}{}{} + 实射影空间 $\mathbf{PR}^n$ 无非是 $\R^{n - 1}$ 和 $\mathbf{PR^{n - 1}}$ 的无交并. +\end{theorem} + +通过一个更简单的想法可以更好地理解这样的结构:射影直线 $\mathbf{PR}^1$ 就是一个 $\R$ 并上一个``无穷远点'',射影平面 $\mathbf{PR}^2$ 就是一个 $\R^2$ 并上一个无穷远处的射影直线. 推而广之,一个射影空间 $\mathbf{PR}^n$ 就是一个 $R^{n - 1}$ 并上一个无穷远处的子射影空间 $\mathbf{PR}^{n - 1}$. + +那么,对于我们的目的而言,这有什么用呢?实际上,可以表明: + +\begin{theorem}{}{} + 一个 $\R^n \to \R^m$ 的仿射变换可以被写成一个 $\mathbf{PR}^n \to \mathbf{PR}^m$ 的线性映射的商,且子空间 $\mathbf{PR}^{m - 1}$ 的原像包含于子空间 $\mathbf{PR}^n$ 当中. +\end{theorem} + +也就是说,我们现在的操作如下图所示: +\[ +\begin{tikzcd} + \R^n \dar \rar & \R^{n + 1} \dar \rar & \mathbf{PR}^n \dar \rar & \R^n \dar \\ + \R^m \rar & \R^{m + 1} \rar & \mathbf{PR}^m \rar & \R^m +\end{tikzcd} +\] + +\section{曲面上的标架} + +考虑曲面 $S$ 的参数化,将其写成下面的形式: +\[ +\begin{cases} +x = x(u, v) \\ +y = y(u, v) \\ +z = z(u, v) +\end{cases} +\] + +考虑导数 +\[ +\vec{t}_u = (x_{u}, y_{u}, z_{u}), \quad \vec{t}_v = (x_{v}, y_{v}, z_{v}) +\] + +对微积分有所了解的读者应该不难看出,这两个向量是曲面在某个点的切向量. 考虑一个ˋˋ好的''参数化,即在任意点这样的两个切向量线性无关. 这样的参数网对于满足一些可微性条件的曲面来说总是存在的,在此不做证明. 我们定义: +\begin{definition} + 称切向量 $\vec{t}_u |_{\vec{t}_0}, \vec{t}_v |_{\vec{t}_0}$ 所张成的向量空间为曲面 $S$ 在 $\vec{t_0}$ 点的切平面,记作 $T_{\vec{t}_0} S$. +\end{definition} +切平面的单位法向量称为这个点处曲面的法向量,记作 $\vec{n}$. 不难发现,在曲面上的任意点上,$(\vec{t}_u, \vec{t}_v, \vec{n})$ 张成三维空间,这被称为曲面上在这个点处的自然标架. + +在自然标架下,我们不难考虑曲面上某一片小区域的面积,通过一点点微积分的操作,我们可以得出: +\[ +\mathrm{d} s^2 = |\vec{t}_u|^2 \mathrm{d} u^2 + 2 \vec{t}_u \cdot \vec{t}_v \mathrm{d} u \mathrm{d} v + |\vec{t}_v|^2 \mathrm{d} v^2 +\] +我们定义: +\begin{align*} + E &= |\vec{t}_u|^2 \\ + F &= \vec{t}_u \cdot \vec{t}_v \\ + G &= |\vec{t}_v|^2 +\end{align*} +不难发现,$E > 0, G > 0, E G - F^2 > 0$,我们可以将其写成矩阵的形式: +\[ +\begin{pmatrix} + E & F \\ + F & G +\end{pmatrix} +\] +这种形式通常被称作曲面的第一基本形式. 不难发现,它给定了曲面上的长度和面积. + +考虑坐标变换 +\[ +\begin{cases} + \tilde{u} = \tilde{u}(u, v) \\ + \tilde{v} = \tilde{v}(u, v) +\end{cases} +\] +我们探讨在此变换下(如果这个变换之后的结果也是``好的''),第一基本形式会发生什么样的变化. 记变换之后的第一基本形式为: +\[ +\begin{pmatrix} + \tilde{E} & \tilde{F} \\ + \tilde{F} & \tilde{G} +\end{pmatrix} +\] +可以证明: +\begin{theorem}{}{} + 变换前后的第一标准形式与原来的第一标准形式有如下关系: + \[ + \begin{pmatrix} + \tilde{E} & \tilde{F} \\ + \tilde{F} & \tilde{G} + \end{pmatrix} + = + J^\mathrm{T} \begin{pmatrix} + E & F \\ + F & G + \end{pmatrix} J + \] + 其中 $J$ 为 Jacobi 矩阵,形式如下: + \[ + \begin{pmatrix} + \dfrac{\partial u}{\partial \tilde{u}} & \dfrac{\partial u}{\partial \tilde{v}} \\ \\ + \dfrac{\partial v}{\partial \tilde{u}} & + \dfrac{\partial v}{\partial \tilde{v}} + \end{pmatrix} + \] +\end{theorem} + +证明基于 Jacobi 矩阵的含义来完成. + +\begin{proof} + 将 $\mathrm{d} s^2$ 按照一阶的形式展开. +\end{proof} + +我们会意识到,这个``乘上一个可逆矩阵及其转置''的形式是非常重要的. 在后文中,我们会称之为矩阵的相合标准型. 由此,读者亦可窥见此定义的重要性. + +\section{二次曲面及其分类} + +下面我们考虑一族简单的曲面,令 +\[ +S: a x^2 + b y^2 + c z^2 + 2 d y z + 2 e x z + 2 f x y + g x + h y + i z = 1 +\] +其中关于 $x, y, z$ 都是二次的,称作二次曲面. 下面我们想问的是,如何对二次曲面完成分类. 注意到,上面的方程也可以被写成: +\[ +S: \begin{pmatrix} + x & y & z +\end{pmatrix} +\begin{pmatrix} + a & f & e \\ + f & b & d \\ + e & d & c +\end{pmatrix} +\begin{pmatrix} + x \\ y \\ z +\end{pmatrix} + \begin{pmatrix} + g & h & i +\end{pmatrix} \begin{pmatrix} + x \\ y \\ z +\end{pmatrix} = 1 +\] + +一般地,前面的形式 $v^\mathrm{T} A v$ 被称为``二次型'',在后面我们会花费一整讲的时间来讨论有关于它的理论. 但是在此之前,我们先思考如何对二次曲面进行分类. + +上面的方程可以简记作: +\[ +v^\mathrm{T} A v + b^\mathrm{T} v = 1 +\] + +首先,我们考虑对 $A$ 进行谱分解. 由于 $A$ 是实对称矩阵,所以它可以被写成 $Q^\mathrm{T} \Lambda Q$ 的形式,其中 $\Lambda$ 为对角矩阵,$Q$ 为正交矩阵. 我们知道,正交矩阵对应的是一个等距同构. 所以,我们将其先写成: +\[ +v^\mathrm{T} Q^\mathrm{T} \Lambda Q v + b^\mathrm{T} Q^\mathrm{T} Q v = 1 +\] +于是,将 $Q v$ 置为 $\tilde v$,则能得到方程: +\[ +\tilde v^\mathrm{T} \Lambda \tilde v^\mathrm{T} + \tilde b^\mathrm{T} \tilde v' = 1 +\] +其中 $\tilde b = Q^\mathrm{T} b$. + +此时我们对应到二次曲面,实际上是通过一次等距同构消掉了 $d, e, f$ 三个系数. 我们得到的方程就变成了 +\[ +S: ax^2 + by^2 + cz^2 + g x + h y + i z = 1 +\] +通过我们熟知的配方法,我们可以把左式变成 +\[ +S: a(x - \frac{g}{2a})^2 - \frac{g^2}{4a} + b(y - \frac{h}{2b})^2 - \frac{h^2}{4b} + c(z - \frac{i}{2c})^2 - \frac{i^2}{4c} = 1 +\] +也就是说,通过一个平移变换,就能将原式变成 +\[ +a x^2 + b y^2 + c z^2 = d +\] +的形式. + +总结上述讨论,我们可以得到以下定理: + +\begin{theorem}{}{} + 任意二次曲面经过等距变换都可以得到满足如下曲面方程的曲面: + \[ + a x^2 + b y^2 + c z^2 = d + \] +\end{theorem} + +注意到一点,这里的 $a, b, c$ 是原先的矩阵 +\[ +\begin{pmatrix} + a & f & e \\ + f & b & d \\ + e & d & c +\end{pmatrix} +\] +的特征值. 也就是说,对于一个二次曲面的方程,这个矩阵的特征值几乎决定了它的几何结构,这在后面的分类讨论给出每种曲面的形式之后将能够更清晰地展现. 一个有意思的观察是,对于二次曲线,我们也能得出类似的结果,这留作一个习题,请读者自行完成分类. 而在后面的学习中,我们会发现,对于更高维度空间中的二次曲面,这依然是一个重要的分类依据. + +\begin{summary} + +\end{summary} + +\begin{exercise} + \exquote[笛卡尔]{我决心放弃那个仅仅是抽象的几何. 这就是说,不再去考虑那些仅仅是用来练思想的问题. 我这样做,是为了研究另一种几何,即目的在于解释自然现象的几何.} + + \begin{exgroup} + \item 用等体积法计算原点到平面的距离. 考虑 $A, B, C$ 均非零的平面 $A x + B y + C z + D = 0$,计算: + \begin{enumerate} + \item 平面在 $x, y, z$ 轴上的截距以及三个截点与平面构成的直角四面体的体积. + \item 三个截点围成的三角形的面积.(提示:运用 Helen 公式或者秦九韶公式). + \item 给出平面到原点的距离公式,并与文中的公式比对. + \end{enumerate} + + \item 用 Cauchy-Schwartz 不等式证明点到平面的距离公式. + \end{exgroup} + + \begin{exgroup} + \item 考虑平面曲线 \[A x^2 + B y^2 + C x y + D x + E y + F = 0\] 的分类.(提示:类比上面对空间二次曲面的分类,找出变换方式和判据) + \end{exgroup} + + \begin{exgroup} + \item + \end{exgroup} +\end{exercise} diff --git "a/\350\256\262\344\271\211/\344\270\223\351\242\230/22 \344\272\214\346\254\241\345\236\213.tex" "b/\350\256\262\344\271\211/\344\270\223\351\242\230/23 \344\272\214\346\254\241\345\236\213.tex" similarity index 93% rename from "\350\256\262\344\271\211/\344\270\223\351\242\230/22 \344\272\214\346\254\241\345\236\213.tex" rename to "\350\256\262\344\271\211/\344\270\223\351\242\230/23 \344\272\214\346\254\241\345\236\213.tex" index d4d66a7..5549709 100644 --- "a/\350\256\262\344\271\211/\344\270\223\351\242\230/22 \344\272\214\346\254\241\345\236\213.tex" +++ "b/\350\256\262\344\271\211/\344\270\223\351\242\230/23 \344\272\214\346\254\241\345\236\213.tex" @@ -13,9 +13,9 @@ \section{二次型的定义} & = a_{11}x_1^2+a_{22}x_2^2+\cdots+a_{nn}x_n^2 \\ & \quad +2a_{12}x_1x_2+\cdots+2a_{1n}x_1x_n+2a_{23}x_2x_3+\cdots+2a_{n-1,n}x_{n-1}x_n \end{align*} - 称为数域$\mathbf{F}$上的$n$元二次型(简称\term{二次型}). + 称为域$\mathbf{F}$上的$n$元二次型(简称\term{二次型}). \end{definition} -先考虑实数域上的情况. 若令$a_{ij}=a_{ji}\enspace(1\leqslant i=stealth}} \begin{tikzcd} @@ -170,10 +170,6 @@ \section{对偶空间与对偶映射} \end{tikzcd} \] -从图中我们可以读出 $\sigma\circ(\rho\circ\psi) = (\sigma\circ\rho)\circ\psi$,即映射复合的结合律. 自此,构造出指定的映射就可以图形化地表示成在图上画箭头,只要能够找到两个节点之间的一条通路,就能够通过映射的复合构造出一个映射. - -映射的唯一性 - 在定义了交换图后我们可以考虑以下交换图: \begin{center} \begin{tikzcd} @@ -284,14 +280,14 @@ \section{零化子} 为 $U$ 的\term{零化子}. \end{definition} -在零化子中的线性泛函,是那些零点集\emph{包含} $U$ 中的线性泛函. 为什么不定义零点集\emph{恰好是} $U$ 的线性泛函构成的集合呢?稍微想一想就会发现那样定义的集合结构非常难看:它对于线性泛函的加法和数乘都不封闭. 这就引出了零化子的第一个性质: +在零化子中的线性泛函,是那些零点集包含 $U$ 中的线性泛函. 为什么不定义零点集恰好是 $U$ 的线性泛函构成的集合呢?稍微想一想就会发现那样定义的集合结构非常难看:它对于线性泛函的加法和数乘都不封闭. 这就引出了零化子的第一个性质: \begin{theorem}{}{} 零化子构成一个对偶空间的子空间. \end{theorem} \begin{proof} - 首先,任何空间的零化子都包含 $0$ 泛函,它将所有向量都映到 $0$; + 首先,任何空间的零化子都包含 $0$ 泛函,它将所有向量都映到 $0$,因此零化子必定非空; 其次,如果 $\alpha, \beta \in U^0$,则不难发现 $\alpha + \beta \in U^0$,因为对于任意 $u \in U$,有 @@ -302,7 +298,7 @@ \section{零化子} 同理,数乘封闭性也能这样证明. \end{proof} -那么,定义了一个线性空间之后,我们的第一个问题就是,它的维数是多少. 对此,课本给出了一个证明,但笔者在此希望将其重写一下,使之变得更加容易理解. 实际上,我们将其看作以下非常有对称性的定理的推论: +那么,定义了一个线性空间之后,我们的第一个问题就是,它的维数是多少. 为了解决这一问题,我们首先给出一个非常有对称性的定理,零化子的维数是这一定理自然的推论: \begin{theorem}{}{对偶空间的维数引理} 设 $V = U_1 \oplus U_2$,则 $V^* = U_1^0 \oplus U_2^0$,而且 $U_1^0 = U_2^*, U_2^0 = U_1^*$. @@ -318,7 +314,7 @@ \section{零化子} 于是,我们就有了一个显然的推论: -\begin{theorem}{}{} +\begin{theorem}{}{零化子维数} $\dim U^0 = \dim V - \dim U$ \end{theorem} \begin{proof} @@ -350,7 +346,7 @@ \section{零化子} \] 它显然也是一个线性空间. 这样,上面引理的第一、第二条就有了一个看上去更加对称的推论: -\begin{lemma}{}{} +\begin{lemma}{}{NU性质} \begin{enumerate} \item 如果 $U$ 是 $V^*$ 的子空间,则 $U = N(U)^0$ \item 如果 $U$ 是 $V$ 的子空间,则 $U = N(U^0)$ @@ -386,7 +382,7 @@ \section{再论商空间} 我们已经探讨了很多直和的式子,也讨论了零点之类的问题. 现在,我们想问的是,这种零点是否依然还有别的方式来理解?为此,我们需要仔细观察一下零空间的结构. 首先,我们考虑单个线性泛函 $\varphi$ 的情形. -在很久以前,我们就已经知道,$\ker \varphi$ 是一个线性空间,而这个东西无非就是 $\varphi^{-1} (0)$. 那么,我们就自然想要知道 $\varphi^{-1} (\lambda)$ 到底长什么样,这些东西一般被称为 $\varphi$ 的\term{纤维}. 下面我们考虑一个引理: +我们就已经知道,$\ker \varphi$ 是一个线性空间,而这个东西无非就是 $\varphi^{-1} (0)$. 那么,我们就自然想要知道 $\varphi^{-1} (\lambda)$ 到底长什么样,这些东西一般被称为 $\varphi$ 的\term{纤维}. 下面我们考虑一个引理: \begin{lemma}{}{} 设 $r \in \R$,则对于任意 $v' \in \varphi^{-1}(r), v \in \ker \varphi$,都有 $v + v' \in \varphi^{-1} (r)$. @@ -402,13 +398,7 @@ \section{再论商空间} 我们仅证明左侧包含于右侧,另一个包含由上面的引理保证. 考虑 $v'' \in \phi^{-1} (r)$,则 $\varphi (v') = \varphi (v'') = r$,因此 $\varphi(v' - v'') = 0, v' - v'' \in \ker \varphi$. \end{proof} -这个东西显然不是一个线性空间,所以我们要给它另外一个名字: - -\begin{definition}{}{} - 设 $W$ 是 $V$ 的子空间,$v \in V$,则称形如 $v + W$ 的集合为 $V$ 的\term{仿射子集}. -\end{definition} - -根据语境的不同,我们也会称其为线性簇甚至线性流形. 于是我们从线性泛函的纤维再次推导出了仿射子集的结构,这相比于之前基于等价关系的推导更为直观. 事实上很显然,我们定义的超平面就是一个仿射子集,而且,一个泛函所对应的超平面,按照\autoref{lem:cong_functional_hyperplane} 所述,就是它在 $1$ 处的纤维. 于是我们也再次理解了仿射子集的几何意义,它所表达的就是那些``近似线性对象'',比如线、面,等等. +这事实上就是一个的仿射子集,我们在商空间中已经介绍过. 根据语境的不同,我们也会称其为线性簇甚至线性流形. 于是我们从线性泛函的纤维再次推导出了仿射子集的结构,这相比于之前基于等价关系的推导更为直观. 很显然,我们定义的超平面 $a^\mathrm{T}x = 1$ 就是一个仿射子集,而且,一个泛函所对应的超平面,按照\autoref{lem:cong_functional_hyperplane} 所述,就是它在 $1$ 处的纤维. 于是我们也再次理解了仿射子集的几何意义,它所表达的就是那些``近似线性对象'',比如线、面,等等. 按照泛函的纤维的线性性的直观,我们也应该有以下结论: @@ -429,15 +419,7 @@ \section{再论商空间} 设 $f\colon V \to W$ 是一个线性映射,则 $f^{-1} (w) = v_0 + \ker f$,其中 $w \in W, v_0 \in f^{-1} (w)$. \end{theorem} -因此,我们不妨给这些纤维的集合一个名字,而且,如果方便的话,最好能推广到所有的仿射子集上去,我们定义: - -\begin{definition}{}{} - 设 $W$ 是 $V$ 的子空间,称所有形如 $v + W$ 的集合所构成的集合为 $V$ 对 $W$ 的\term{商空间},记作 $V / W$. -\end{definition} - -在此背景下重述上面的结论,就是 $V/\ker f$ 是一个线性空间,而且 $V/\ker f \simeq \im f$. - -更进一步的,实际上我们有一个天然的漂亮的方法,来给出这样的一个核: +回忆所有这样的纤维(仿射子集)构成的集合就是商空间 $V/\ker f$. 因此我们可以重述上面的结论,就是 $V/\ker f$ 是一个线性空间,而且 $V/\ker f \simeq \im f$. 更进一步的,实际上我们有一个天然的漂亮的方法,来给出这样的一个核: \begin{lemma}{}{} 若 $W$ 是 $V$ 的一个子空间,则存在线性映射 $V \to V$,使得其在 $W$ 上的点取值均为 $0$,而在 $W$ 以外的点取值均不为 $0$. diff --git "a/\350\256\262\344\271\211/\344\270\223\351\242\230/7 \347\272\277\346\200\247\346\230\240\345\260\204\347\237\251\351\230\265\350\241\250\347\244\272\344\270\216\347\237\251\351\230\265\350\277\220\347\256\227\345\237\272\347\241\200.tex" "b/\350\256\262\344\271\211/\344\270\223\351\242\230/7 \347\272\277\346\200\247\346\230\240\345\260\204\347\237\251\351\230\265\350\241\250\347\244\272\344\270\216\347\237\251\351\230\265\350\277\220\347\256\227\345\237\272\347\241\200.tex" index 733a681..4fa2f77 100644 --- "a/\350\256\262\344\271\211/\344\270\223\351\242\230/7 \347\272\277\346\200\247\346\230\240\345\260\204\347\237\251\351\230\265\350\241\250\347\244\272\344\270\216\347\237\251\351\230\265\350\277\220\347\256\227\345\237\272\347\241\200.tex" +++ "b/\350\256\262\344\271\211/\344\270\223\351\242\230/7 \347\272\277\346\200\247\346\230\240\345\260\204\347\237\251\351\230\265\350\241\250\347\244\272\344\270\216\347\237\251\351\230\265\350\277\220\347\256\227\345\237\272\347\241\200.tex" @@ -1197,9 +1197,11 @@ \subsection{对阵矩阵与反对称矩阵} \subsection{对偶映射的矩阵表示} -我们已经提及,$\mathcal{L}(V, W)$ 和矩阵空间具备同构性质,而我们已经表明,对偶有一个函子性,也就是说,$\mathcal{L}(V, W)$ 到 $\mathcal{L}(W^*, V^*)$ 有对应. 因此,我们不免就想构造矩阵空间的一个类似的对偶,使得它能够``具备类似对偶的函子性''. 更直白地说,我们希望得到其对偶映射的矩阵表示. +最后我们讨论转置这一矩阵运算在线性映射中的对应. 由于转置将一个 $m \times n$ 矩阵变为了 $n \times m$ 矩阵,也就是说转置前后的矩阵对应的两个线性映射,它们的出发空间和到达空间维数互换了. 设原矩阵 $A$ 是线性变换 $\sigma \in \mathcal{L}(V, W)$ 在两组基下的矩阵表示,对偶需要的维数互换使我们自然地想到对偶映射 $\sigma^* \in \mathcal{L}(W^*, V^*)$,而且我们之前提到,对偶映射是一个反变的东西,而转置似乎也很符合``反变''的直观,下面的定理将验证这种直观: -那么,让我们思考一下怎么给出这个表示. 现在,我们的第一反应是,它一定是一个反变的东西. 其次,它一定对于任意行数和列数的矩阵都存在. 那么,最简单的想法就是,它是不是就是矩阵的转置?矩阵的转置看起来符合反变的直观,而且也带有我们已经给出的性质. 而下面的问题是,如何验证这种直观. +% 我们已经提及,$\mathcal{L}(V, W)$ 和矩阵空间具备同构性质,而我们已经表明,对偶有一个函子性,也就是说,$\mathcal{L}(V, W)$ 到 $\mathcal{L}(W^*, V^*)$ 有对应. 因此,我们不免就想构造矩阵空间的一个类似的对偶,使得它能够``具备类似对偶的函子性''. 更直白地说,我们希望得到其对偶映射的矩阵表示. + +% 那么,让我们思考一下怎么给出这个表示. 现在,我们的第一反应是,它一定是一个反变的东西. 其次,它一定对于任意行数和列数的矩阵都存在. 那么,最简单的想法就是,它是不是就是矩阵的转置?矩阵的转置看起来符合反变的直观,而且也带有我们已经给出的性质. 而下面的问题是,如何验证这种直观. \begin{theorem}{}{对偶映射的矩阵表示} $V$和$W$为有限维线性空间. $V$的一组基为$\alpha_1,\ldots,\alpha_n$,$W$的一组基为$\beta_1,\ldots,\beta_m$,它们对偶空间的基分别为$f_1,\ldots,f_n$和$g_1,\ldots,g_m$. 设$\sigma\in\mathcal{L}(V,W)$,它在上述$V$和$W$的基下的矩阵为$A=(a_{ij})_{m \times n}$,则$\sigma^*\in\mathcal{L}(W^*,V^*)$在上述对偶基下的矩阵为$C=(c_{ij})_{n \times m}=A^\mathrm{T}$. \end{theorem} @@ -1214,18 +1216,15 @@ \subsection{对偶映射的矩阵表示} 因此我们有$c_{kj}=a_{jk}$,即$C=A^\mathrm{T}$. \end{proof} -这个结果看起来很平凡,对吧?但是让我们暂停一下,重新反思一下前面的几何直观. 如果我们有超平面方程 +这个结果看起来很平凡,对吧?但是让我们暂停一下,回顾对偶空间中提到的几何直观,反思一下这一定理的几何直观. 如果我们有超平面方程 \[ a_1 x_1 + a_2 x_2 + \cdots + a_n x_n = 1 \] -我们记$a=(a_1,a_2,\ldots,a_n)^\mathrm{T},x=(x_1,x_2,\ldots,x_n)^\mathrm{T}$,于是上面的方程可以简化为$a^T x = 1$. 事实上,对于给定的一个超平面$a^T x = 1$,我们知道一定有某个点与之对应,事实上它就是$\tilde{x} = a$,即就是超平面方程的系数. -\begin{proof} - 原谅我没时间严格说明这个关系,之后会补上的,但其实这个很直观. -\end{proof} +我们记 $a = (a_1,a_2,\ldots,a_n)^\mathrm{T}, x = (x_1,x_2,\ldots,x_n)^\mathrm{T}$,于是上面的方程可以简化为 $a^\mathrm{T} x = 1$. 根据线性空间同构于其对偶,$a \in \mathbf{F}^n$ 与 $a^\mathrm{T} x = 1$(视为 $(\mathbf{F}^n)^*$ 中的元素) 是一一对应的关系. 于是我们接下来可以给出\autoref{thm:对偶映射的矩阵表示} 从几何上的理解. 考虑超平面方程 $a^\mathrm{T} x = 1$,则与这个超平面对偶的点是 $a$. 设 $\sigma \in \mathcal{L}(\mathbf{F}^n,\mathbf{F}^m)$,根据\autoref{lem:向量空间线性映射的矩阵表示},$\sigma$ 与一个矩阵 $M$ 对应. -于是我们接下来可以给出\autoref{thm:对偶映射的矩阵表示} 从几何上的理解. 如果原来的方程是 $a^\mathrm{T} x = 1$,则与这个超平面对偶的点则是 $\tilde{x} = a$. 如果我们对 $\tilde{x}$ 作用上 $M$,也就是写成 $\tilde{x} = Ma$,则实现了$V\to W$的映射,那么前面与之对应的方程就是 $(Ma)^\mathrm{T} x = 1$,或者写作 $a^\mathrm{T} (M^\mathrm{T} x) = 1$,即新的超平面和原来的超平面相差一个 $M^\mathrm{T}$,即$W^*$与$V^*$之间相差了$M^\mathrm{T}$. 因此,从几何直观上,我们也验证了转置和对偶映射的对应关系. % TODO: 这段要重写 +我们对 $a \in \mathbf{F}^n$ 作用上 $\sigma$,得到了 $\sigma(a) = Ma \in \mathbf{F}^m$. 而与 $\tilde{x}'$ 对应的超平面方程是 $(Ma)^\mathrm{T} x = 1$,即 $(a^\mathrm{T}M^\mathrm{T}) x = 1$,即新的超平面和原来的超平面相差一个 $M^\mathrm{T}$,即 $(\mathbf{F}^m)^*$ 与 $(\mathbf{F}^n)^*$ 之间相差了 $M^\mathrm{T}$. 因此,从几何直观上,我们也验证了转置和对偶映射的对应关系. \section{矩阵的共轭} diff --git "a/\350\256\262\344\271\211/\347\272\277\346\200\247\344\273\243\346\225\260\350\215\243\350\252\211\350\257\276\350\276\205\345\255\246\350\256\262\344\271\211.tex" "b/\350\256\262\344\271\211/\347\272\277\346\200\247\344\273\243\346\225\260\350\215\243\350\252\211\350\257\276\350\276\205\345\255\246\350\256\262\344\271\211.tex" index 0bd7c43..449a665 100644 --- "a/\350\256\262\344\271\211/\347\272\277\346\200\247\344\273\243\346\225\260\350\215\243\350\252\211\350\257\276\350\276\205\345\255\246\350\256\262\344\271\211.tex" +++ "b/\350\256\262\344\271\211/\347\272\277\346\200\247\344\273\243\346\225\260\350\215\243\350\252\211\350\257\276\350\276\205\345\255\246\350\256\262\344\271\211.tex" @@ -242,16 +242,17 @@ \input{./专题/19 内积空间.tex} \input{./专题/20 内积空间上的算子.tex} \input{./其它/未竟专题8 希尔伯特空间引论.tex} -\input{./专题/21 线性代数与几何.tex} -\input{./专题/22 二次型.tex} -\input{./专题/23 多重线性映射与张量的计算.tex} +\input{./专题/21 奇异值分解.tex} +\input{./专题/22 线性代数与几何.tex} +\input{./专题/23 二次型.tex} +\input{./专题/24 多重线性映射与张量的计算.tex} \input{./其它/未竟专题9 射影几何的代数方法.tex} \input{./其它/未竟专题10 有限域上的二次型.tex} \input{./其它/未竟专题11 二次型的几何.tex} \input{./其它/未竟专题12 实数域的诸扩域.tex} \input{./其它/未竟专题13 线性动力系统.tex} -\input{./专题/24 奇异值分解.tex} \input{./专题/25 线性代数与微积分.tex} +\input{./专题/26 线性代数与最优化问题.tex} \input{./其它/未竟专题14 范畴论视角下的线性代数.tex} \LUgroupsancheck