数学中国

 找回密码
 注册
搜索
热搜: 活动 交友 discuz
查看: 663|回复: 0

一个数学证明的诞生

[复制链接]
发表于 2023-11-23 00:08 | 显示全部楼层 |阅读模式
一个数学证明的诞生

大数学家外尔(Hermann Weyl,1885-1955)曾说:“我的工作总是设法将真与美统一起来,但如果二者只能择其一,我通常会选择美。”在数学中,美的定理、美的证明,特征之一是“清楚简洁”。本文回顾了作者在十六年前的一篇论文中,对“矩阵行列式引理”的一个简洁优美的证明,介绍了线性代数里用于分块矩阵的高斯行列变换技巧。

撰文 | 丁玖(美国南密西西比大学数学系教授)

相遇“矩阵行列式引理”

半年前,我审读了一篇投往《应用数学快报》(Applied Mathematics Letters)的文章。在这篇关于迭代法的来稿里,有段话引起了我的兴趣:“Before proving the convergence of the new iterative scheme we generalize the so-called matrix determinant lemma of [4] for more general rank-r modifications:”(在证明新的迭代方案的收敛性之前,我们将[4]中的所谓矩阵行列式引理推广到更一般的秩-r 修正)。参考文献[4]正是我以及合作者于十六年前在同一家杂志上发表的论文“Eigenvalues of rank-one updated matrices with some applications”(《秩-1 校正矩阵的特征值及其一些应用》)。

吊起我胃口的是术语“矩阵行列式引理”,听作者的口气,似乎是我们的文章给出了这条“引理”,甚至还将其加以命名。但是,我对这个名称却是一无所知,那一天是第一次见到它,真是孤陋寡闻!



我没有料到自己十六年前受谷歌矩阵激发,为了探讨相关数学问题而想出的矩阵分解,被维基百科条目采纳为“矩阵行列式引理”的标准证明。这让我想起当年写作这篇数学短文的一些细节,在此记录下来,权当是对当年追求简洁美心态的一次回顾,顺便也与读者分享线性代数里用于分块矩阵的高斯行列变换技巧。

论文是怎样炼成的

那年,同之前的十多年一样,我如期访问了中国科学院数学与系统科学研究院。我和其中一个研究所的合作者在计算遍历理论的领域共同耕耘了许多个春秋,合写了不少研究论文,也出版了一本中文合著。这一次,我的合作者告诉我,“谷歌矩阵”这个数学领域的新生事物,由于问世还不到十年的谷歌公司在信息搜索引擎方面的巨大商业成功,尤其是它在“网页排序(PageRank)”算法里的核心地位,正在受到应用和计算数学家们的关注。他觉得我们或许也应该“关注一下”。



广义高斯行变换



还能更简洁吗?

读者可以感觉到上述关于矩阵行列式引理的第二个证明比较精炼,因为只用了两个公式,两步到位就完成了任务。然而,有没有只用到一个等式就可以一步到位的证明呢?这也是当年我在北京的访问学者办公室里对自己的提问。



然而,让我始料未及的是,新定理的另一个直接应用却导致了关于非负矩阵的 Perron-Frobenius 理论里,一个对正矩阵最大特征值代数重数断言的直接证明,这个新证明比我到那时为止在有关非负矩阵的书中见过的证明要短得多。这个断言是:正的方阵的谱半径,即所有特征值的最大绝对值(在非负矩阵理论里称为最大特征值,理由是非负矩阵的谱半径总是一个特征值),是代数重数为 1 的特征值。

书本里给出的这个正矩阵最大特征值为特征多项式简单零点的结果,证明一般很长,有的甚至还借来其他学科的知识。例如,在剑桥大学出版社 1997 年出版的 R. B. Bapat 和 T. E. S. Raghavan 合著的书 Nonnegative Matrices and Applications(《非负矩阵及其应用》)中的定理 1.4.4(v) 的证明,用到了来自博弈论(game theory)的推理;R. Horn 和 C. R. Johnson 于 1985 年经同一出版社推出的教科书 Matrix Analysis(《矩阵分析》),用 Schur 三角化定理证明了定理 8.2.10 ;在 H. Minc 的 1988 年专著 Nonnegative Matrices(《非负矩阵》)中,定理 4.3 的证明是基于微分的思路。这些证明似乎都既不简单,也不简短。

那时,我和我的合作者根据我们多年来对遍历理论中一类正算子数值分析的研究实践,准备写一本英文书《非负矩阵、正算子及其应用》(Nonnegative Matrices, Positive Operators, and Applications)。我一直比较关心有关非负矩阵尤其是随机矩阵的性质,盖因计算遍历理论里著名的乌拉姆方法以及我在博士学位论文中构造的高阶马尔可夫有限维逼近方法,采用的各种映到有限维函数空间上的逼近算子,在密度函数基底下的表示都是随机矩阵。所以,在受谷歌矩阵吸引,碰巧证明出了一个谱摄动定理后,我就好奇它能不能用于简化上一段提到的关于正矩阵最大特征值代数重数好性质的复杂证明。



尾声

十六年的光阴瞬息过去,几年前我注意到,我与合作者这篇 2007 年的论文的引用次数,压过了我们 1996 年发表的一篇计算遍历理论领域的文章,当上了我所有学术论文的“引用数冠军”。我当时以为或许是因为论文中的主要定理应用广泛而荣幸被引。然而,借审稿机会我才获悉,文章的引理证明被维基百科的条目选上,论文是由于这个矩阵行列式引理及其极简证明才受到研究者关注。据说有人统计过,全世界浏览量最大的前十名网页中,维基百科位居其一。

大数学家外尔(Hermann Weyl ,1885-1955)曾有一句名言:“我的工作总是设法将真与美统一起来,但如果二者只能择其一,我通常会选择美。”人们常说“简单就是美”。在数学中,美的定理、美的证明,特征之一是“清楚简洁”。精炼的证明读之令人陶醉,如“根号 2 非有理数”及“素数无穷多”的论证不能再短,所以,它们既被爱戴数学美的哈代(Godfrey Harold Hardy,1877-1947)写进了脍炙人口的 A Mathematician's Apology(《一个数学家的辩白》),也被收进了再版多次的 Proofs from THE BOOK(《数学天书中的证明》)。矩阵行列式引理的最短证明像引理本身一样简洁清晰,人们同时欣赏了公式之雅和推理之妙。在维基百科的数学条目里,我们的的确确体会到了数学美!

写于 2023 年 11 月 12 日星期日

美国哈蒂斯堡夏日山庄

原创 丁玖 返朴 2023-11-22 10:03 发表于俄罗斯

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|数学中国 ( 京ICP备05040119号 )

GMT+8, 2024-5-3 06:09 , Processed in 0.088867 second(s), 16 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表