|
无理数的定义和实数理论的建立
作者:李照
看完本文后你至少会明白如下几个关键问题:
1,无理数最初来源于几何上的发现,那为什么不采用几何的方式来定义无理数呢?是什么原因使得康托(Georg Cantor)和戴德金(Richard Dedekind)的无理数或实数定义都不采用几何的方式?用几何的方式真的不行吗?
2,算术法则或数学是真理吗?
3,什么是数的连续体?实数系为什么是连续的?
4,为什么无理数也有像有理数那样的乘法结合律和分配律等算术法则?如何证明?
5,矩形的面积为什么是两邻边长度的乘积?
无理数在我们的运算使用中常常被认为也满足交换律、结合律、分配律等算术法则,但为什么它们也具备这些性质呢?我们同样需要严谨的证明才能信服,而这首先得从什么是无理数,从无理数的定义谈起。无理数和有理数都被称为实数,所以如果我们有了实数的定义,那么无理数的定义也可以用这个更广泛的实数定义来充当。本文将先带读者领略两种当前盛行但又过于抽象的实数定义方式,对比之下提出一种简单易懂且兼具严谨性的无理数定义,从而与有理数一起组成数的连续体——实数系,然后再严格建立起实数(包括无理数)相关的算术法则和不等关系。文中会有很多英文资料的引证,看不懂没关系,因为对应的主要意思我都在之前用中文表述了。看本文前先看柯朗和罗宾的《什么是数学》2的第二章开头至第二节的第一小节会有更好的效果。
两种定义实数的方式及其成因分析
现在让我们来看两种当今比较盛行且又独具一格3的实数定义——分别由德国数学家康托(Georg Cantor,1845-1918)的和戴德金(Richard Dedekind,1831-1916)提出。
Cantor 对实数的定义4:实数是一个有理数的柯西数列(Cauchy sequence of rational numbers)。其中,是“有理数的柯西数列”的条件是:该数列中的各项都是有理数,并且数列中除有限多项外的其它任意两项的差都小于一个预先任意指定的正有理数。任何一个满足这种条件的数列都是有理数的柯西数列,也是这种定义下的一个实数。
现在大多数教材把 Dedekind 对实数的定义5表述为:实数是一种有理数集的 Dedekind 分割。其中,有理数集的 Dedekind 分割的定义是:把有理数集分成两个非空集合 A1 和 A2 ,对于 a1∈A1 和 a2∈A2 有 a1<a2 。任何一组这样的 A1 和 A2 都是一种有理数集的 Dedekind 分割,也是这种定义下的一个实数。
当第一次看到这类实数定义时,你也许会像我一样很苦恼地感叹道:这是什么东西?如此怪异,完全看不懂!按照他们这些定义来描述实数,那么实数到底是个什么东西?完全没有了我们一开始对实数认识的样子了。之前我们可以直观地认为实数就是数轴上的第一个点,但现在,实数从我们自认为非常熟悉的东西变成了难以捉摸、令人费解的怪物!在这两种定义下,每个无理数已不再是我们之前可能认为的那样是一个单独的个体、是一个无限不循环小数,而是被定义成了和无限个元素的集合相关的东西,令初学者看了有些不知所言为何物(It is apparent from these various approaches that the logical definition of the irrational number is rather sophisticated. Logically an irrational number is not just a single symbol or a pair of symbols, such as a ratio of two integers, but an infinite collection, such as Cantor's fundamental sequence or Dedekind's cut. The irrational number, logically defined, is an intellectual monster, and we can see why the Greeks and so many later generations of mathematicians found such numbers difficult to grasp6)。无理数最初来源于两直角边为 1 的三角形的斜边长,而在这两种无理数的定义中完全看不到几何的影子,这是让初学者觉得给出的无理数定义比较抽象和怪异、难以理解的主要原因。为有理数提供严谨逻辑理论的数学家 Hermann Hankel 对此评论说:“各种抛弃了几何定义出来的无理数尽管有了严谨的基础,但却是极端晦涩难懂、令人反感畏惧的人造物,我们有足够的权利去怀疑这些定义的科学价值(Every attempt to treat the irrational numbers formally and without the concept of (geometric) magnitude must lead to the most abstruse and troublesome artificialities, which, even if they can be carried through with complete rigor, as we have every right to doubt, do not have a higher scientific value7)。”实际上即便是定义创建者之一的 Dedekind 也说自己看不到这种纯抽象的实数定义会带来什么优势(But what advantage will be gained by even a purely abstract definition of real numbers of a higher type, I am as yet unable to see, conceiving as I do of the domain of real numbers as complete in itself8)。抛弃几何后的实数定义可说已经让初学者不知所云了,如果还要按照这种路子走下去,那么后续的学习很大程度上只是应用这些定义目的不明地、淡然无味地去证明一些结论,对于理解背后的数学思想基本没什么实质性的帮助。德国数学家 Paul du Bois-Reymond 也表达了和我同样的观点:剥离了实数和几何关系后建立的分析学将会使得这门学科沦为折腾符号的玩意儿(A purely formalistic-literal framework of analysis which is what the separation of number from (geometric) magnitude amounts to, would degrade this science to a mere game of symbols9)。
那么是什么原因促使数学家们用抛弃几何的方式去定义无理数或实数呢?这得回到数学史,从为什么要为实数提供严谨的逻辑基础谈起。数学分析的严谨化导致了对严谨的实数理论的需要(The rigorization of analysis forced the realization that the lack of clarity in the number system itself had to be remedied10)。数学分析的一个非常基础的概念是极限,而仅仅在有理数集内谈论极限是有限制的,因为有理数组成的数列其极限可能是无理数,只有在有理数和无理数组成的实数系里面谈论极限才是没有限制的。有理数的定义、算术法则、不等关系(具体是哪些请看下文“实数算术法则和不等关系的建立”的后半部分)早已严格建立,而无理数或实数的严格定义及其对应于有理数的这些性质却迟迟未得到严格建立,一直到十九世纪下半叶数学家们对无理数的使用都是凭直觉进行的11,默认它们也有像有理数那样的算术法则。因此,为实数提供严谨逻辑基础的问题变成了如何严谨化无理数相关的理论(By the latter part of the nineteenth century the question of the logical structure of the real number system was faced squarely. The irrational numbers were considered to be the main difficulty12)。
首当其冲的是要明确什么是无理数,要给无理数下个定义。无理数是通过几何发现的,其定义方式就可以考虑基于几何或不基于几何,当今较为盛行的两种定义(如上)皆选择了不基于几何的方式,是什么原因造成了这种选择呢?查阅资料后我找出了如下原因:(1)从公元前200年左右开始到大约1870年,几乎全部数学都建立在直观经验和实用的基础上13,也就难以避免地出现了轻易相信几何直观而得出错误结论的情况,比如曾经出现过依赖于直观的几何经验一度普遍认为连续曲线在除了一些特殊点之外的其它各点处必有切线,直到 Weierstrass 给出了一个处处连续但又处处不可导的函数才终结了这一错误的直观认识。Weierstrass 的这一发现使得数学家们对相信直觉和借助几何辅助思考的不严谨性起了很大的警醒作用14,由于基于几何直观得到的结论有可能(也仅仅只是“可能”,并非“一定”)是不可靠的,为了严谨化数学分析,Weierstrass 等数学家倾向于用数而不是几何来为微积分或数学分析奠定严谨的逻辑基础,进而就没有用几何的方式去定义无理数15,16,17。同样的原因,上述提到的实数定义的创建者 Dedekind 也说自己在教授“连续增长且有上界的变量必然趋近于一个极限值”时也因为一时没有别的办法而不得不通过几何直观来讲解,但他始终觉得这种做法是不严谨的,直到他为数学分析找到了纯算术化且绝对严谨的基础18。至于 Cantor ,他并没有在他给出实数定义的文章 Ueber die Ausdehnung eines Satzes aus der Theorie der Trigonometrischen Reihen 里说明他为什么不选用基于几何的方式定义无理数19,不过 Philip E.B. Jourdain 认为 Cantor 的无理数定义是基于 Weierstrass 的无理数定义修改出来的20,所以我们可以认为其理由和 Weierstrass 的一样,值得一提的是 Cantor 是 Weierstrass 的学生;(2)另外一个 Dedekind 认为无理数的定义应该脱离于几何的理由是:就像负数和分数的定义及其算术法则可以追溯到正整数那样,无理数也应该来源于有理数21;(3)非欧几何的创建和它也能用来像欧几里得几何那样准确地描述物理空间的性质,使得数学家们认识到欧几里得几何并非关于物理空间的绝对真理22,接着数学家们甚至无法确定到底哪种几何或者几何还是不是关于物理空间的绝对真理23(本文未加限定修饰的“几何”均指欧几里得几何或平面几何,但在本观点相关的论述处皆是泛指,下同),而之前创造的数学(包括微积分)却依赖于欧几里得几何,当时的一些数学家(包括高斯24)为了避免数学因此而丧失作为自然界法则方面的真理地位(truth in the sense of laws about the real world25),觉得解决之道在于把数学完全建立在算术(Arithmetic)上,因为他们在某种哲学层面上相信算术才是真理26(Another motivation to erect the foundations of the number system was the desire to secure the truth of mathematics. One consequence of the creation of non-Euclidean geometry was that geometry had lost its status as truth (Chap. 36, sec. 8), but it still seemed that the mathematics built on the ordinary arithmetic must be unquestionable reality in some philosophical sense27)。而数是算术的基础,这种做法就要求数在本质上不能依赖于几何。
现在让我们简短总结一下上述提到的历史上不用几何方式定义无理数的原因:(1)数学家们担心依赖于几何直观性的方式可能导致错误结论;(2)Dedekind 认为就像负数和分数的定义及其算术法则可以追溯到正整数那样,无理数也应该来源于有理数;(3)倾向于认为算术而非几何是真理,这要求作为算术基础的数在本质上不能依赖于几何。然而,我认为这三条理由均不能否决“用几何方式定义无理数”的可行性。对于理由(1),的确,轻易相信几何直观确实很可能产生错误结论,但这并不意味着几何学的方式不严谨(Despite the fact that geometry too had been rigorized, one consequence of the rigorization movement was that number and analysis took precedence over geometry.28),而是人们应用几何的方式是不严谨的——仅仅通过一些个案的直观性,并没有严格的证明,就草率地得出普遍性的结论。一部分数学家只是因为“相信几何直观可能产生错误结论”,为了避免这种“只是可能但并非一定会有”的风险,所以就不选用几何而是用纯数、纯算术的方式为数学奠基。更何况如果几何学是不严谨的,那么它是不是早已退出数学领域了呢?然而并未如此!对于理由(2),虽然说科学理论的发展可以受一些思想观点的指导,但它们绝非科学理论发展的枷锁或准绳,所以 Dedekind 的这个观点我们也就不必视为绝对要遵从的真理;对于理由(3),当时的一些数学家认为算术是真理,但是这种观点也很快受到了质疑。一方面,这种观点仅仅只是来源于有限的实践经验的认识,其正确性并没有一个严格的论证,况且当时数或算术法则连一个严谨的逻辑基础都还没有29(这是本文要建立的一点);另一方面,非交换代数(non-commutative algebras)的产生,尤其是四元数(quaternions)和矩阵(matrices)的产生,让数学家们开始反思“数或算术的应用能够在多大程度上反映客观世界的真实”,Hermann von Helmholtz (1821-1894)指出数的应用结果能符合事实的这一特性虽然不是偶然但也不能证明数的算术法则就是真理30,实际上这后面的本质是:数的算术法则来源于现实生活中的一类实践经验——测量,所以再将这些总结出来的算术法则反过来应用于对应的这些场景时显然就能适用,超出这类场景可能就不适用了。比如说把两个有理数的加法 a/b+c/d 的结果定义成 (ad+bc)/(bd) 而不是 (a+c)/(b+d) 就是出于测量的需要,如果定义成后者就会出现 1/2+1/2=(1+1)/(2+2)=1/2 ,从测量的角度来看这是个荒谬的结果31。另外,超出测量场景算术法则可能就不适用了,比如 Henri Lebesgue 举了个滑稽的例子32:如果你把一只狮子和一只兔子放在同一个笼子里,那么最终从动物数量这个角度来看就无法得出 1+1=2 这个结论,类似的现象在化学里还有很多,所以算术法则的应用范围也是有限的。总的来说,数学或其它自然科学在客观世界的有效应用的本质是:它们来源于现实生活中的一类实践经验,而后再将这些总结出来的规律反过来应用于对应的场景时显然就能适用,超出这类场景可能就不适用了。之所以说是来源于生活中的“一类”或“有限”实践经验,其决定性原因是除非是造物者(God)否则谁都不敢保证自己的理论是在考量完生活中的所有相关情况之后提出的,另一方面,理论提出后谁都不敢说自己核实完世间一切相关情形证明理论总是适用,只能保守地说理论适用于与之相应的场景,更别说生活中已发现理论不再适用的情形了(如上面算术法则失效的例子),所以这些提出来的理论只不过是应用范围有限的经验知识,其应用范围取决于实践认识。此外,当有经验或实验显示另外一种新的理论可以提供更好的解读时,那么旧理论很可能就会被这个新理论取而代之(Some areas of experience suggest particular sets of axioms and to these areas the axioms and their logical consequences apply accurately enough to be taken as a useful description. But if any area is enlarged the applicability may be lost. As far as the study of the physical world is concerned, mathematics offers nothing but theories or models. And new mathematical theories may replace older ones when experience or experiment shows that a new theory provides closer correspondence than an older one.33)。所以,就如休谟(David Hume,1711-1776)所说:一切科学理论都是基于(有限)经验建立起来的(Science is purely empirical34)。所谓的自然法则全是人类创造的,是我们人类而不是造物者给出了这些法则,所以每条自然法则只不过是人类的解读,不见得是造物者的意思——绝对真理(Nature's laws are man's creation. We, not God, are the lawgivers of the universe. A law of nature is man's description and not God's prescription.35)。所以,继几何之后认识到算术也不是关于客观世界的绝对真理36我们就会认识到历史上“让数的定义脱离于几何,然后就相信基于数的算术或数学是真理”的做法便不具备什么意义了,相反我们更应该认识到数和几何的紧密联系,比如有理数的加法和乘法定义实际上是源于(几何)度量的需要定义出来的37,一个更迫切的需求是:我们需要每条线段的长度都要能用一个数去代表、去衡量,这也是分析几何(Analytic geometry)的基本要求。实际上即便是上面这两种实数定义的提出者 Cantor 和 Dedekind ——他们用抛弃了几何的方法去定义实数,但是为了在“数(特指实数集)”和“形(特指直线)”之间建立联系也不得不用公理化的方式说明他们所定义的实数和直线上的每个点是一一对应的38(后世称之为 Cantor-Dedekind 公理39)。正是基于“数”和“形”之间无法割舍的紧密关系,也因为并不是非得用抛弃几何的方式去定义实数,更何况这么定义的实数非常抽象和怪异、不易理解,所以本文将基于几何(直线)建立一种简单易懂且兼具严谨性的无理数定义方式,然后再建立起与之相关的算术法则和不等关系。
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有帐号?注册
x
|