数学中国

 找回密码
 注册
搜索
热搜: 活动 交友 discuz
查看: 1309|回复: 2

专访 Srinivasa S. R. Varadhan 教授

[复制链接]
发表于 2024-2-29 19:14 | 显示全部楼层 |阅读模式
专访 Srinivasa S. R. Varadhan 教授



策划:刘太平

访问:刘太平、黄启瑞、姜祖恕、尤释贤

时间:2007 年 12 月 19 日

地点:中央研究院数学所

整理:焦源鸣、陈与庭、黄建豪

来源:《数学传播》 2008 年第 32 卷第 1 期(125)

Srinivasa S. R. Varadhan 教授 1940 年出生于印度南部 Madras(Chennai),1959年、1960 年分别取得 Madras 大学的荣誉学士及硕士学位,1963 年获得印度统计研究院博士学位。自 1963 年起任教纽约大学 courant 研究所。

Varadhan 教授系近半世纪以来最杰出的或然率学者之一,他在马可夫过程的建构上有重大的贡献,对 Rare Events 的估计在物理、工程及统计上有极深的影响,近年来对于流体力学的基础亦有很深的着墨。Varadhan 教授于 1996 年获得美国数学会的 Steele Prize,在 2007 年受颁挪威文理学院之 Abel Prize ,这是数学界相当于诺贝尔奖的最高荣誉之一。

刘太平(以下简称“刘”):欢迎你来访问。当年在印度的时候,你如何对数学产生兴趣?

Varadhan(以下简称“V”):你知道,小学数学其实就是算术,只要能很快地加减乘除,就是个优秀学生,小学对数学的要求就只是这些,背乘法表。而我能够背起来所以考试考得好,比起那些背不起乘法表的学生,我被认为是数学好的学生。

刘:(笑)我听说印度的乘法表不是九乘以九。

V :不,是十六。(笑)

刘:是十六乘以十六。

V :是的。因为我们是英国货币单位,一卢布(Rupee)等于十六安纳(Anna),一安纳等于十二派(Pie)。因此当你买苹果的时候,十二和十六是很重要的,必须除得很快。(笑)所以有些学校要求背到十二然后跳到十六,所以十三、十四、十五不强迫背,而一到十二,以及十六一定要会。

刘:什么时候你背得起十六乘以十六?

V :大约小学四年级。当然中学就不同了,中学学了不少数学,我们学代数、解方程式、欧氏几何、没有微积分,另外还有三角几何,正余弦函数,这些并不难。

刘:你成绩名列前茅?你们中学不学微积分?

V :学校没有教微积分。

刘:喔,所以你跟班上其他同学上同样的课。

V :没有 honor 课程,自然也没有选修课,同一年级每个人都学一样的东西。但是我有个很好的数学老师。周末他要我们到他家,给我们问题做,像是解几何学中的三角形问题。因此我们养成解决问题的习惯。给我们一个问题,我们知道如何下手:从不同的角度去看它,试着去了解问题的核心,然后想想能否解决它,这是个很好的经验。中学以后,进入两年制学院(junior college)就读,我们学数学跟化学、物理同时也学两种语言。

刘:哪两种语言?

V :英文跟 Tamil 语,Tamil 语是我的母语。物理和化学对我不是问题,数学也没问题,但是数学学得真的不是很多。我们学一点射影几何、圆锥曲线,然后是一点解析几何:直线跟圆这类图形,一点微积分:只有微分、积分、正余弦函数,不包括指数与对数函数。

刘:(笑)让我往前跳过这段时期,你谈到一切一如常人,这些功课对你而言并不困难。但我听 Papanicolau 说,Kolmogorov 在几年后来到印度,见到你。

V :那是我研究生生涯的尾声。

刘:那是好几年后的事。

V :我现在说的是 1956 ,当时我 16 岁刚从两年制学院毕业。

刘:你比同年龄的早了?

V :大约早一、两年。一直到那个时候数学并不那么复杂。那时的数学大概是现在的微积分预备课程,微积分只在最后的两、三个星期上。两年制学院课程不多,只有一门叫做“数学”的课,有一位教授,他教什么我们学什么。第一学期他教射影几何,第二学期教一些其他的东西,第三学期再教另外一些东西,最后一个学期的最后几周才学微积分。微积分是薄薄的小书,大约二十页,十页微分,十页积分。当时我不是真的懂内容,我是说,我知道怎么做(积分、微分)但因为没有实际的应用,我看不出来为什么要做这些;先定义极限,再消去 h ,得到导函数,然后抓抓头想想怎么处理积分,就是这些。然后我进入三年制的大学学程,主修纯数、机率与统计。

刘:是英国的学制。

V :我们是在这里学到不同的东西。我们没有其它的课,没有物理没有化学,除了第一年每周一次英文,三年的时间都在学数学、 机率、统计。数学有几条同时并进的系列,分成三个方面:分析、几何、代数。分析从第一年的微分和积分开始,第二年是多变数微积分、初等实分析,第三年是多重积分、积分变换,还有一点点微分几何;代数有方程式论、行列式、矩阵、线性代数;几何有大量的解析几何、圆锥曲线、刚体几何、射影几何。

刘:所以你全部都学了?

V :全部都学,任何人都没得选择。我们班有 13 个人,三年来的每堂课都一起上,学校告诉你这些课是你们现在该上的,就像中学和小学,从早上九点待到下午四点。同时我们学机率与统计,第一年学基本机率学、极限理论、叙述统计,有点奇怪的是,学这些东西需要一些当时在纯数学课没有教,到后来才学到的东西,像是傅立叶分析。我们读很多理论统计,也有叙述统计,像抽样调查。就这样三年,我完成大学课程。

刘:当时是 18、19 岁?

V :18 岁快到 19 岁的年纪。这三年的学程是为硕士做准备的。此时先授与荣誉学士学位,六个月后自动变成硕士学位。然后,我到加尔各答当研究生。

刘:大学在哪里念的?

V :千奈(Chennai),之前叫做马德拉斯(Madras)。

刘:你当研究生的时候一定有些不寻常的事发生?

V :嗯,我对机率比较熟悉,但那时完全不知道什么测度论。在当时不教现代数学,我们学到扎实的古典分析,可以做估计等等,但没有教抽象思考,或泛函分析,测度论,点集拓朴,这些完全没接触过。当我到加尔各答,研究所没有开任何课。学校给你奖学金,一张桌子,一张椅子,要求你三年内交出论文。(笑)我们只有一些严谨的讨论班,讨论测度论跟点集拓朴,我全程参与。

刘:没有作业?

V :没有,这不是正规的课程,是讨论班,所以如果你不利用它,它就过去了,而差不多也就要这样混过去了。然后有一天有人告诉我为什么测度论是重要的。你看,直到那时候我都不知道有 singular measure ,绝对连续性的概念也不曾被强调。虽然我们学了三年的机率与统计,我们只讨论离散的机率分布或由密度函数定出的机率分布。实际上课堂遇到的问题不是这一类就是那一类,就算有 singular distribution 又如何,你从没看过,谁在乎!所以研究所时有人告诉我确实有这类分布存在,我很惊讶也才了解测度论的重要,我回头再读了 Halmos 的书。原本我想做的不是数学,是统计,我想做应用统计,当个在工业界工作的统计学家,没有人有靠研究数学过活的念头。(笑)但是三四个月后我慢慢的感到失望,现在我们也许会说沮丧,但在印度,周围都是人,我多少有些失落、迷惑。我原以为做工业统计是很有趣的,其实很无聊,当然需要人做工业统计但你不必学些什么,用到的大多只是常识。有人建议我做作业研究,做了一阵,我发现大部分是计算极大极小,不过换个名目而已。我发现自己对应用领域不是很有兴趣,因此开始大打桥牌读推理小说。因为没有必须上的正规课,也没有人要求你做任何事,你可以到办公室到图书馆看推理小说(笑)。我就这样耗了大概四五个月,直到我遇见比我高一两年的研究生 Ranga Rao 和 Parthasarathy 。那时负责主导讨论会的 Varadarajan 去了美国,而他们三人正在探讨将测度论推广到拓朴空间后的极限定理,抽象空间的极限定理,我很感兴趣跃跃欲试。这强迫我学习,学着应用我学到的测度论和拓朴,然后把他们整合到具体的问题上,例如,Donsker 的 invariance principle,Prohorov 和 Skorohod 的弱收敛。接着我们开始自己的讨论班——极限定理定期课程,就是三四个研究生给自己上课。我们同住一个公寓,早上七点到办公室,讨论班从七点到十点,天天如此。在这段期间我学到很多。很快就学会 group theory ,functional analysis 等等。后来我们决定推广 Gnedenko 和 Kolmogorov 的极限定理到 topological groups 。这是我们的出发点。之后,我们讨论在 Hilbert space 之下的现象。这比较复杂,因为如果是 locally compact groups ,特征函数和傅立叶变换是很好的工具,但在 Hilbert space 之下,只有特征函数是不够的,必须发展新的工具,例如 concentration functions 。这是一个很棒的时期,三年就这样过去了而我的论文也完成了。

刘:难以置信!

V: Kolmogorov 来的时候我刚好完成论文。他来我们学校访问,所以跟他有些互动,基本上就是我报告论文做的东西而他是听众之一。他是我的论文的审查委员。

刘:嗯,让我把时间倒退一些。你刚刚谈到你有五到六个月不知道要做什么。起初你想做一些具体可以应用的东西,发现很无趣。之后你决定做抽象的东西,但是之前一段时间并不算浪费,对吧?因为你正在寻找方向。

V :让我这样说吧。学期从八月开始,头几个星期只是让自己在新的地方安顿下来,使用的语言是新的,每件事都是新的。生活中的每样事物都是陌生的,食物不同,很多事情都不同。学校在远离尘嚣的地方,虽然也有南部乡亲居住的小社群,但从学校到那儿要花一个半小时。一月或二月我才开始对数学感兴趣,我们谈的不是一段很长的时间。

刘:不过我想问的是你做的都是抽象的东西,但总是有具体的现象可以描述,这不是一个学纯数的学生遵循着教条进入抽象的森林,继续 …

V :至少从我大学时代和我的第一篇论文开始,都是试着推广在实数线上已解决的问题到 locally compact groups 。当你开始想这些问题,再看看实数上的证明会发现难处在那里。其中之一就是什么叫做集中(centering)。Kolmogorov 已有一些成果。即便你有一个很小的分配,很小的平均值,你仍然需要去修正它,因此你必须定义平均值。在实数线上你可以去掉(truncate)或是积分,但是如何在 locally compact group 中处理?如何定义平均值?不需要精确但是必须够逼近。有一个问题必须解决,如果是 disconnected groups ,不需要去集中,但对于 connected groups 呢?一个 connected group 基本上是一个矢量空间和一个 compact connected group 的直和,而你知道怎么处理向量空间。你要做的事情就是如何在 compact connected group 定义平均(mean)。你有 group 的 character ,再对它取对数,因为取对数之后大概是线性的,因此对这个对数积分就是平均。character 是复数,因此取对数之后是多值的,但是你可以通过一些方法去定义它。它有定义之后,就有集中的概念,依据 Gnedenko 和 Kolmogorov 做的再做一些修正。

刘:身旁没有其他人帮忙?

V :就我们几个研究生。

刘:真不得了。可否请你描述一下你所认识的 Kolmogorov ?

V :我对他认识不深。他来印度一个月,大概每天都看到他。我们还跟他在印度旅行,他很有活力总是这里走走那里走走。他来的时候是 59 岁,我们为他举行 59 岁生日晚会。他总是喜欢年轻人围绕在他身边也喜欢讨论问题,我也请教他一些问题。麻烦在于他说他不会说英文,他只说法文、俄文、德文,但这三种语言我们都不懂。(笑)所以我们得设法沟通,不过数学还能沟通。

刘:之后你到了Courant Institute ?

V :1962 年 4 月,Kolmogorov 来访问,我正好完成论文,但他想把论文带回莫斯科给 Prohorov 看然后再写审查报告。在印度,交出论文之后要等六个月到一年的时间才拿到审查报告,因此在 62 年 - 63 年我当了一年的讲师。

刘:在加尔各答?

V :在加尔各答。就在此时我开始对马可夫过程(Markov processes)感兴趣。我们有个讨论会,学习 Dynkin 跟 Ito 的理论,我觉得要彻底了解这些东西需要学一些微分方程。我们大学有一门 ODE ,没有任何课程谈 elliptic theory ,parabolic equations 或类似题材的 PDE 课程,我对 PDE 一无所知。当你开始研究马可夫过程,你看到 Feller 和其他人的工作,他们写下扩散方程,假设某些可微分性质,然后说此方程有解然后如何如何,但是为什么解存在并且具有可微分性却不清楚,很清楚的是那是已有的定理,因为他们引用一些论文,但是我不知道从何开始。如果我们有时间也许可以学,但是那时讨论会已经开始渐渐解散了。

刘:哪些人组成讨论会?跟你差不多年纪的人?

V :我们一共五个人,但不是同时在一起。

刘:都是年轻的学者?

V :我是讨论会里最年轻的,Varadarajan 最年长,比我大三岁,他现在在 UCLA 。我跟他念相同的两年制学院跟大学。不过他在大学时代就知道他要做什么,因此他准备得很好。讨论会的前三四个月由他主持,然后他去美国,在我在 Calcutta 的最后一年才回来。我们一起做了一年李群。那时 Ranga Rao ,Sethuraman ,Prathasarathy 已经离开。但是在前三年,Rao 参与其中两年,Sethuraman 参与三年后离开,Prathasarathy 参与三年后到俄罗斯一年,所以不同时间不同的人参与。但在第三年之后,我们的讨论会逐渐减少,因为只剩下我。Varadarajan 回来之后我们做了一些不同的东西,Harish-Chandra 的群表现理论。

刘:你是召集人?

V :不,我不会这么说。我想我们每个人都有各自的角色。

刘:但是你是最热诚的成员?

V :不,我不认为。我从他们身上学到很多。例如 Ranga Rao 已经学了group theory ,他知道 topological groups 等等,因为他早先已经跟 Varadarajan 学了,所以他教我们这些。Sethuraman 在学 functional analysis ,读 Dunford 跟 Schwartz 的书,然后讲给我们听。(笑)

刘:真好。(笑)

V : Prathasarathy 正在读 information theory ,所以他讲 entropy 跟动态系统等等。因此我们四个会说:“我读这个,你读那个”分配好然后讲给别人听。好处是即使读不懂也不会因此停下来,你可以在讨论会中表明“这部分我不懂”,然后其他人就开始试着解决。所以即使不是完全精通仍然可以讲。

黄启瑞(以下简称黄):C. R. Rao 是你的指导教授,他对你有什么样的影响?

V :精神上的支持。

黄:精神上的支持,不是统计上?

V :一开始我跟他说我对统计感兴趣,他要我去找做质量控制的某人谈,我去看看,结果发现他们在做的就是作业统计之类的,除此之外我不知道他们在做什么。(笑)我很失望,再去找他,他知道我参加数学讨论会,很高兴。最后一年,某天他要我到他的办公室解释我的论文做些什么,然后我向他报告论文内容。大概就是这样。

刘:哦。那是什么时候?你们讨论会成员各奔东西是哪一年?

V :1962 年终。学期在五六月就结束了。

刘:但是你在加尔各答多待了一些时间。

V :多待一年。Varadarajan 夏天回来,因此我们有两个人,我们学一点群表现理论,我一边也学一些马可夫过程,希望能做这方面的工作。在这之前,Varadarajan 在 Courant 一年,他对我说如果你对微分方程有兴趣,应该去 Courant 。他写信给 Peter Lax 建议让我以访问学者身份去 Courant 。

刘:1963 ?

V : 1963 。

刘:然后你就留下来了?

V :我留下来,到 2008 年夏天将是整整 45 年。

刘:我很想知道你在 Courant 的很多事情,但是我们应该先谈一些数学。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
 楼主| 发表于 2024-2-29 19:15 | 显示全部楼层
姜祖恕(以下简称姜):法国的机率学派,跟美国的很不同,有不同的风格,法国学派对你有什么影响?

V :法国学派这些年来改变了很多。Neveau 的时候,他对具体的问题比较有兴趣。在他之前,Fortet 和 Mourier 对抽象的理论较感兴趣,与具体问题常常没有关联。但在考虑具体问题上,他们有很强的传统,像 Paul Lévy 给 Ito 很大的启发。但是法国数学界,对 Lévy 并不那么重视,他在 Ecole Polytechniques 因此他真正是一个工程师,他做的被认为是工程而不是数学,这是法国人傲慢的观点。这种观点已经不再存在了。Jacques Louis Lions 的出现使微分方程跟应用数学更合理化,更令人重视。法国已经改变了,现在法国机率学家跟我们没什么不同,非常具体而不非常抽象。

姜:全世界渐趋一致。你对俄国学派的看法如何?在 Kolmogorov 、Dynkin 、Prohorov 之后,机率有所谓的俄国学派吗?

V :我想俄国学派在整合拓朴学跟测度论进而发展出一种观点很有贡献。在随机过程的研究上,Kolmogorov 扮演相当重要的角色。马可夫过程的发展,Dynkin 有根本的贡献。在他之前 Feller 在这方面做了些工作,如果你读 Feller 的书,会觉得困惑,这一个定理,那一个定理,却没有一致的观点,我认为一致的观点是Dynkin做的。但是政治来了,70年代发展的排斥犹太人的氛围,基本上将他们分散了。像是 Fredlin,Dynkin,Skorohod,Ventcel,Krylov 都离开了,他们都必须离开,另找栖身之地。90年代早期,苏联解体,生活艰难维生不易,很多数学家可以的话去了美国,但是有些人还是会常回俄国。动态系统的Yakov G. Sinai的学群非常活跃。因此俄国学派的影响是有,但是他们在过去20年有自己的问题,既然现在他们有资源,我相信他们会 …

姜:重组?

V :重新发展。

姜:日本的机率学派呢?Ito , Watanabe , Ikeda …

V :他们有很强的学派。

姜:可否比较日本学派跟其他学派的风格,像是法国学派?

V :我想日本学派很擅长拿到问题做完整的分析,很快地把问题拆解开来,非常胜任。但我认为有时候他们有些呆板。

姜:他们通常跟着大人物的脚步接续他们的工作。

V: Ito 并没有接续别人的工作。(笑)不过我想对他们而言要有弹性或是冒险是困难的,你可以从他们的人与他们的工作看到这点。优秀的学者做优秀的工作,但我认为他们怯于去发掘很多的东西。

姜:你做的东西,我发现你很少引用前人的工作。例如,large deviation ,人们引用你的东西。但是似乎它是从你开始,没有前面的工作,你做的是先驱者的工作。

V :这不很对,这是我的毛病,我读的不多。(笑)而且我认为如果你想做一个问题,去读前人的工作是一个错误。

姜:喔,我们不应该读你的工作。(笑)

V :不,不。读前人的工作让你处于同一思考模式,如果想要跳脱出来,那么看看别人的想法是好的,可是不要去钻研细节。如果你抱着细节不放,会落入相同的思维。如果想尝试不同的方向,我不会建议任何人这么做。因此我很少用别人的结果,我用简单的工具,证明我需要的东西。我不喜欢用别人的大定理,然后说“这是根据某某定理 … ”。

姜:跟一般人做法很不同。

V :因为他们读得很多。

姜:他们读太多了。(笑)

V :有好也有坏。好处是如果有一个别人解决不了的问题,你做出来了,那是和前人非常不同的方法,可以开启一个新的解题的方式。另一方面来说,可能长时间卡在一个地方,非常挫折。如果你读了其他人的工作可能会知道怎么做。

姜:有问题时你会跟其他人谈吗?

V :是的,我会跟人谈,我也听人说。不过我不去看细节,,只试着去了解他们做的。如果不是我正在做的东西而我又有时间,我会去读它,看看他们做了什么,主要的概念是什么。我不必去看所有的细节,主要是关键步骤,或是主要概念。

姜:写论文时你曾经犯错吗?(笑)

V :在我当研究生时发生过。

姜:谁找到错的?

V :我自己。它给了我一些教训。我试着去证明一些定理。我那时很天真,才研一或研二。我试着证明一些东西以为已经证出来了。我把它写了出来给同事看。他说不错,我就投稿了。但是有一天我问自己,为什么我要证它?你知道,一个证明都要有一个想法,你不可能没有想法就去证明一个结果,而我似乎没有想法就证明了它,看起来很奇怪。我回头去看它,到底哪里错了,然后我了解我为什么犯错:有两个预备定理,预备定理 A 以及预备定理 B ,我用预备定理 A 去证明预备定理 B ,再用预备定理 B 去证明预备定理 A 。(笑)。我说:“这不行。” 你知道,如果你要你的证明行的通,在证明它之前要有想法来支持为什么它行的通。所以我立刻写信撤回论文。同时间,审稿人的报告也来了,我那篇论文被拒绝了。退稿的理由并不是因为那个错,而是其他的原因。但是,它给我一个教训。现在如果要写证明,而那个证明是来自拼拼凑凑的,你可能会犯错。如果知道一个证明为什么行得通,你不太可能会犯错。

姜:我记得 Stephen Orey 曾经说过你写证明时很小心。甚至不会有打字错误。你一直都那么小心吗?有人一直帮你校稿吗?

V :不,不是这样的。我想,就某种意义而言,那是一种写作的风格。至于打字错误,我不知道,那是期刊的事,有些期刊的编辑会一行一行地看,实际上是那些编辑们找出错误,特别是如果那个编辑懂数学的话。当我在大学的时候,有一个分析的考试,我没记错的话,有一个问题:如果 θ 是无理数的话,则 n 倍 θ 的小数部分在单位区间里 dense 。所以我大致想出了答案,写下来。我以为我做的不错,觉得那是正确的答案。不过,交上去后却一分都没拿到。我找老师抱怨,她说:“或许你的证明是对的,你自己心里明白,但我看不出为什么它是对的。在数学里,如果你写的让你的读者看不出为什么它是对的,它就不是对的。” 然后她拿给我看她保留的以前学生的卷子,那正是 Varadrajan 三年前的卷子。我看了看,知道哪里不一样了。(笑)

姜:我了解。

V :所以我逐渐了解到 做数学的一部分就是要学着如何写作,写到让你的读者觉得你的论述清楚。你不要试着隐藏复杂的结构,有时,这根本是不可能的,因为有些论文事实上很技术性,所以,你尽力去做。我认为通常很多人不肯花心思在适当地写作上。

刘:你是否能说一下 Large Deviation ,如何开始研究这个问题的?为什么这个问题会如此重要?

V :嗯,为什么 Large Deviation 是重要的?如果你认为机率是重要的 …

刘:(笑)认为机率重要,这容易!

V :然后,你必须要去计算一些东西的机率,不然机率能干么呢?所以,你有一个模型,你有一个事件,你想要去计算在这模型里的一个事件的机率,这就是问题,对吧。所以如果你在业界做事,例如华尔街等等,你不在乎怎么算,你只要一个数字,然后你把这个数字输入电脑。或许这个数字是对的,或许它是错的,那是你的银行要承担这个风险,不是你。(笑)另一方面,如果你是一个应用数学家,你看到问题中的参数而想要看看当参数很大时是否依然能计算这个事件的机率,试试看是否可以估计。有时,当参数变得很大时,这个机率会收敛到一个定值,因为原来的模型已变成不同的模型了,而这个机率在这个新的模型下是可以计算的。这就是极限定理在谈的。所以这问题变成一个可以计算的问题,因为你必须在这个新模型下计算机率,而或许这个新模型比旧模型简单,或许你可以发展一套数值方法或者这个新的模型有时简单到可以让你求精确解。第三件事是,或许当参数变得很大时,这机率收敛到零或一去了。零跟一是同一件事,因为你只要看它的补集就好了,就说它收敛到零好了,然后你问:它收敛到零的速度有多快?在大多数的情形之下,它收敛到零跟如何参数化有关。我们假设它的参数让机率以指数方式收敛到零。你想知道那个指数常数是什么?你要如何计算这个常数?这就是 Large Deviation 的问题了。针对不一样的模型,你可以计算这个指数常数,有一种有系统的方法去计算它。而这就是 Large Deviation 的理论所探讨的。

刘:这就是你所做的。

V :这就是我所做的。不,在我之前,北欧保险界在 1930 年代就开始针对一些特定的模型做这件事了。Cramer 的结果是针对独立随机变量和。所以很多人都已经做了这件事了,研究统计力学的人在不一样的情况下也做了同样的事。事实上,整个均衡统计力学不过就是披着不同外衣的 Large Deviation 。所以,这样的事已经一点一滴的在很多地方做了。有一些是我在开始做这件事时根本就不知道而后来才发现的,有一些是我在大学时学的。

刘:所以,有一个一统的方法,或者,一统的想法啰?

V :是啊!到最后,事实上就只跟一个公式有关,有一个通用的公式可以用在 Large Deviation 上。一个模型,通常有很多的参数,其中某一个参数会越来越大,当这个参数变大时,某些事件的机率就会收敛到零。你问:是否我可以稍稍变动其他的参数使得机率不会收敛到零,而是收敛到一个正数,甚至一。所以你问自己:假设有一组新的参数,其中有一个参数跑到无穷大而有一些参数固定不动。现在,还是让这个会跑到无穷大的参数跑到无穷大,但是让其他原本不动的参数动一点点好让极限机率不为零。如此,你就有两个不同的模型,你可以计算后面这个模型相对于当参数跑到无穷大时会有特定行为的模型的相对 entropy 。通常它对参数是线性的,有一个可计算的常数。不同的扰动通常会产生同样的答案。你如能找到具有避开零机率的最小相对 entropy 的最佳扰动,这个常数就是指数率的常数。这是 Large Deviation 的基本哲学。

刘:可以说一说你是如何得到这样的方法的吗?

V :喔,你知道的,算大量的例子。我试过不一样的例子,而最终我有办法了解这些东西的共通点。有一些已知道的,我就做一些计算而得到的答案让我吃惊。这样其实是合理的,因为它是一个一统的原则。
回复 支持 反对

使用道具 举报

 楼主| 发表于 2024-2-29 19:16 | 显示全部楼层
尤释贤(以下简称“尤”):我可以问一个问题吗?互动粒子系统与 Large Deviation 的关系是什么?你如何看待机率与物理,我是指,把它们放在一起?

V :大部分的物理,当然了,除非你有不确定性或者一些不确定的东西,否则你不能用机率。如果你给我一个动态系统和一些初始条件,那只是一堆我需要去解的常微分方程 … 这样会牵扯到混沌理论,我完全不懂,这与 hyperbolicity 以及拓朴动态有关,是不同的东西。所以我考虑有噪音的模型,噪音越多越好。我探讨的那类互动粒子系统里的问题称为 Hydrodynamic Scaling Limits 。它是什么呢,它是一个非常复杂且非常庞大的交互粒子系统,但有守恒量。所以这个系统可以有一个大域的均衡,因为守恒-因为互动是局部的。所以,要达到全局的均衡是需要花相当长的一段时间的。所以呢,在某种时间尺度下,我们应该可以藉由某种大的空间尺度所表达的局部均衡去解释,描述这个系统的状态。因之会有一个尺度的议题。如果你的时间尺度是某一种而你的基准尺度是另一种,那么你就是以一种新的尺度来描述这个系统。这样就有巨观与微观二种位置。所以,巨观而言,你的空间可以是一个连续的紧致空间。但是 如果你很仔细地看,你就可以看到里面有格子,在格子里有个东西恼人地上下跳动着。但是从很远的地方看,你看不到这些波动。你只会看到一些很平滑的东西,因为那些波动都被平均抵销掉了。这些波动的东西会处在某种的局部均衡里。而你从很远的地方看到的是那种均衡的平均。这个局部均衡可能会逐点改变。所以你用以描述的系统状态正是一个位置函数。这个函数的值域就是描述均衡的参数。也就是说,这是流体的样子。然后你要做的是:让时间移动得够快,这个流体的样子将会随之改变最终得到一个常数,而这将是全局均衡。所以,你想要描述这种改变的方程,我们有偏微分方程来描述这些。而这里原本就有一个马可夫过程来描述这个交互作用粒子系统。从这里,你想要推得一个偏微分方程。这就是 Hydrodynamic Scaling Limits 探讨的问题。如果把机率去掉,得到描述气体的Hamiltonian 系统。你得导出尤拉方程(Euler equation)并且将压力借由一个依赖交互势能的状态方程表示成密度与温度的函数。这就是最终求得的方程。五个方程以及五个未知数:密度,三维空间的速度以及温度。这是 deterministic 的情形,没有人会做。但是如果你有噪音,这些噪音所能的功用在迫使系统达到局部均衡。首先当你知道你有噪音,至少在某些条件某种意义下你可以证明局部均衡。这个问题事实上就是要证明局部均衡不会波动。对于那些比你有兴趣的尺度要低的尺度,因为系统是非线性的而且如果波动确实存在,你没办法知道什么是极限方程。所以,建立局部均衡并且证明没有不必要的波动。你必须要确定没有任何不必要的波动,这是问题的一部分。你需要做两件事:你必须要建立局部均衡,接下来你要证明没有不必要的波动,通常导出来的方程将会以 weak form 呈现。这里有三个步骤要做,而且有一个系统性的做法。你有一个可逆系统,例如说,一个处于均衡的粒子系统。跟那些完全不可逆的动态系统全然不同。如果你写下算子,其中一个是 self adjoint ,另一个是 skew adjoint ,所以它们是极端。有一些粒子系统模型在均衡之下有可逆动态。然后,你可以引入Dirichlet form 的技巧。瞧,问题的一部分是你的初始状态是远离均衡的。因为如果你从均衡出发,你就会一直处于均衡,而偏微分方程就是:量的微分为零,因为在均衡状态下所有参数都是常数,所以你把它们带入得到零等于零,因此常数是无聊解。所以从均衡出发,得到无聊解,那是无趣的。如果从不均衡出发探讨趋于均衡是如何发生的,这就是整个布局了。所以如果从不均衡出发,这代表初始状态是一团乱,你就无法解出 Kolmogorov forward equation 并且说:在时间t,我的状态是如此,而针对这个状态我试着证明各种的性质等等。所以你必须有一个间接的证明,你没办法给一个直接的证明。

尤:所以你需要准备初始状态。

V :不!你必须针对它处理它。纵使你准备了初始状态,它很快就会改变。除非你将它准备为常态的均衡,否则它不会传播。记住,时间的尺度是很大的。所以你要有方法去控制它,而你用 Large Deviation 去控制它。用 Large Deviation 去控制它的原因在于,不管初始状态是什么,它相对于均衡的 entropy 将会与体积成比例,因为 entropy 是把每一个地方的量都加起来。所以无论初始状态为何,不失一般性,你永远可以假设,相对于均衡的 entropy 与体积成比例。Boltzmann 的 H 定理说,相对 entropy 是会递减的。你可以计算相对 entropy 的递减率,用状态表示它,对它微分,再用 Kolomogorov 方程,然后做部分积分,这事可行因为它是可逆,最后你得到 Dirichlet form ,事实上是稍微修正的 Dirichlet form 。这个 Dirichlet form 与 gradient 的平方有关。既然密度是正函数,而且你有 gradient 的平方除以密度函数。所以,这就是 Dirichlet form 。entropy 也是正的,你知道开始的 entropy ,然后一路递减,你必须保持它是正的,所以就给了 Dirichlet form 的控制,有了 Dirichlet form 的控制,再看看针对某个函数积分的指数的期望值的 Feynman-Kac formula 。Feynman-Kac formula 给你一个藉由主固有值(principal eigenvalue)表达的 variational bound 。对于一个可加泛涵(additive functional)的马可夫过程由 0 积分到 t ,取指数,再看它的成长速率,在可逆的情形,这个速率借由主固有值实际上是可以控制的。这个主固有值有个变分的公式,是以 Dirichlet form 来表示的。所以,如果你能控制 Dirichlet form ,就可以控制这些东西。但是,这些都在均衡里了。所以,如果你先掌控好均衡,坏东西会出现,你证明坏东西出现的机率很小,多小呢?必须是某一个很大的常数乘上体积的负指数。所以这个误差率甚至会比体积大很多。

尤:但是误差是?

V :误差机率的倒数取对数,其值大于体积。大得很多,比体积大了一个次方。这称为 super exponential estimate 。你可以用变分法,用 Dirichlet form 来证明这些。这不过是变分法,是可以做的,一旦做了,则在均衡下的误差机率是很小的。由于不均衡下的相对 entropy 只跟体积成比例,加上在均衡里的误差是 super-exponentially 微小,所以 Jensen 不等式告诉你误差在均衡下是小的。就只用到 Jensen 不等式,一个简单的不等式。所以这就是如何在不均衡状态下控制误差的机率,一旦能控制误差的机率,问题就解决啦,< 停顿>  因为我从未说过误差是什么!由定义来看,误差是:你想要的减掉你有的。(笑)

刘:你想要的是局部均衡吗?

V :没有波动的局部均衡。针对每一个情形你必须用不一样的估计。但是一样的都用 Dirichlet form 去控制它。所以,这个方法对可逆的情形,或者一般的扩散的情形都相当管用。但是还有一些其他的问题,事实上这是我最喜欢的。瞧,在扩散问题里若空间的大小是 n 。则时间是以 n 平方加速。如果要计算 hydrodynamic limit ,基本上那是 transport 的问题。你得到 current 。由于守恒律可以计算 current ,得到两项的差。所以你必须要吃掉 n 的 2 次方。因为守恒而且电流是差,可以做部分积分或部分加法一次去掉一个 n 。另一个 n 去不掉,除非在某些模型里,计算的结果意外地得到两项的差。你有的是零平均(mean zero)。因为根据定义,在均衡状态之下平均(mean)必须为零。一个在所有均衡状态之下平均都是零的物体不见得是两样东西的差。这是什么意思呢?瞧,在方格里,如果有在位移下不变的东西,位移再加上测度也是不变的,那么一个像 f(x) 减掉 f(Tx) 的东西其平均永远都是零,因为位移不变的结果 f(x) 与 f(Tx) 有一样的平均值。但在另一方面,这对部分加法是好的。因为如果你积了它,将它拿去与一个缓慢变化的函数作测试,则重新调整尺度代表测试的函数(test function)也将在原子的尺度下,缓慢变化。所以在原子尺度下它是两样东西的差。针对测试函数把它平滑化,不费力就得到部分加法,这会带出一个多的 1/n 的倍数。有这类性质的模型称为 gradient 模型。所以如果你有一个 gradient 模型,我刚刚描述的模型很管用。但是有时你得到的函数不是两样东西的差,你就必须去做不同的处理,基本上是无穷维的 Hodge 预备定理。所以你定义一个抽象的希尔伯特空间(Hilbert space),你的物件是那些相对于每个均衡状态平均都为零的函数。一个这样的例子是电流。因为在均衡之下电流是没有净流的。我们的系统在均衡下是可逆的,在两个不同地方的密度的平均也是零。所以如果你想要知道传输,那就是你想要处理的:两点之间密度的差。因为当你把它代入,你会得到 dp ,就是密度差(gradient)。所以你想要解的是如何用密度差去置换一个平均为零的函数。你必须要证明这个差在某种意义上是可以被忽略的。没有黑板、粉笔描述起来有点复杂。

刘:这没关系的。(笑)你描述了好多。我们谈点轻松的好了。你在 Courant 待了好多年。说说那里的人,谈谈那个地方好吗?

V :喔,我认为 … 嗯 … 你曾经去过那里,你知道那边的情形。

刘:只有你待在那里的百分之十的时间。   

V :嗯,那是一个很好的地方,因为就某种意义而言那里就像个家庭。他们会好好照顾,教育年轻人。资深的教授一直很愿意照顾下面的人。另一件事是那里的人总是在那里让你可以接近。任何时间我想要问什么问题,我可以找任何人,他们每天都在。我知道一些地方,想要见某人,必须在一个月前事先预约。(笑)而在Courant,人们天天在那里,在喝茶,在吃午餐,你问一些问题,你加入谈话。另外,这个学院的运作长久以来独立于大学之外,所以他们的运作少了很多官僚气。然而,现在有些改变,就像美国很多大学,纽约大学也变得比较像公司。校长们喜欢把自己想成公司里的总裁,变得比较像一个生意。我不责怪他们,因为政府对教育的补助正在减少,所以他们必须像经营生意一样的经营学校,这样才能募到钱来支持各种的活动。

刘:另外 Courant 学术上的重点也在改变。

V :那是因为数学的演化。三四十年前,研究椭圆方程,pseudo-differential operator 等等是很重要的。现在,比较非线性,非线性双曲线方程是人们注意的。我认为现在数学里流行的也在改变,希望我们也随之与时俱进,不然到后来我们就落后了。还有,现在的数学变的比较重视计算。大尺度计算已经成为数学里重要的工具。随着电脑越来越大,你可以做的事也越来越多了。谁知道呢,当量子计算出现的时候,你可以做得更多!

刘:我听说这不会很快发生。(笑)

V :以前说到上月球人们也是这样讲的。(笑)

刘:好吧,我了解。(笑)你现在跟印度还有很多联系吗?

V :是的,我试着一年左右回去一次。不见得是回去待在那里,而是去度假,去拜访不一样的地方。今年的二月,我或许会在 Chennai 的机构一个月。我想,他们对办一些机率的课程有兴趣。Stroock 上个月待在那里一个月,我二月要去接续他所留下的课。希望他明年秋天会再去,我在接下来的春天又会回去。所以将有四个为期一个月的课程,那是一连串的计划。

刘:随着印度的经济变好,印度的科学也会上来。

V :我希望如此,希望如此,但是那不是必然的,因为很不幸的印度的科学教育很糟。大学的教育是由州政府所控制,而州政府又有各自的规划。虽然不少人有意愿,他们没办法每一件事都做。你需要各阶层的人合作。这很难。所以接下来中央政府将在一些地方开始一些新的机构,它们会很好,因为州政府不会介入。但是,一旦州政府插手了,一切将变的乱七八糟。

刘:但是在你年轻时,你在那里 …

V :那些都还没有被泛政治化。你知道,到后来,如果你是某一州出身的,你没办法在另一州找到教授的位置。如果你没办法从同一所大学拿到博士学位,你就不会被雇用。同血系繁殖的情形很严重。

刘:但是印度文化,是看重追求知识的,对吧?

V :那是我们一直在说的。(笑)事情是这样的。是的,但是人们 … 嗯,大部分的人来自中产阶级。你所看到的这样的富裕是最近才有的。所以当你是出身于中产阶级的,你对教育的第一个重点就是教育是一个能让你致富的方法,或者能提高你的财富阶级。所以经济上的利益是你对教育的期盼。所以你左看看右看看发现 IIT(India Institute of Technology)是你可以押的宝。所以最好的学生参加竞争激烈的考试,通过考试进入 IIT ,他们得到学位,表现得很好,他们之中最好的,去美国拿一个博士或硕士学位,然后在硅谷工作。有一些当到公司的高层管理。有一些人到印度,我并没有说他们不会回来。但是,我想说的是最好的人没有回印度做基础科学研究。当然有例外,有一些人。但是那一点点的例外不足以填满教育下一代所需的大学教职。所以如果政府明天希望在印度办二十个崭新而且棒极了的大学,教职员哪里来呢?

刘:那是一个很慢的过程。

V :需要两代或三代来的时间来建立。

刘:似乎已经开始发生了。

V :它会发生的!我确定它会发生,因为美国的经济没办法来养活这些人。(笑)美国的经济也许正在走下坡,除非政府改变政策而且负责任地做事。国家的负债以兆在成长。现在的领导阶层不用偿还。但是子孙们会付出代价!

刘:(笑)好。这问题比数学问题更难。

V :我刚刚说的是有一些力量吸引人让人想回印度。这就是我要说的。

刘:是啊。认为有必要背十六十六乘法表的文化终究是可以的。(笑)

黄:我刚刚在想,因为你才得到 Abel 奖,有了影响力,你是否可以跟印度的首相谈谈,试着去影响一些事?

V :不,我不会。

姜:或许在 Chennai 。

黄:你可以做一些事情。

V :不,不,或许我可以做一些局部的事情。他们会要求我去当一些委员会的成员等等,而我愿意尽我微薄的力量。如果他们愿意,他们可以采纳我的建议,不然他们也可以忽略它。(笑)就以游说美国关于核计划的简单议题来说好了。很清楚地,能源对印度将是很重要的,你不能预期成长率是像我们现在一般。他们说每年要让一百万台车上路。(笑)当然,有很多人有车,也有很多人没有车,没车的人也想要有车的人有的特权。而且如果经济上,他们付的起,谁能阻止他们?应该是由台当局来决定有核子反应炉,发展核能是好的吗?你必须要很小心。但是我认为那是每一个国家都要面对的另一个选择。法国做这件事已经很久了。不知道台湾是否也是如此?

刘:嗯,有很多争论。但我认为很多人觉得那是唯一的一条路。

V :对,对。你负担不起能源不足的损失,否则你不过是很辛苦的工作把钱拱手送给别人。

姜:迪拜。

V :俄国这几年也是。但是另一方面,印度政治体系中掌权的是联合政府,而左翼也在。左翼分子就是印度共产党。他们想超越毛泽东。(笑)

刘:那不可能的。(笑)

V :所以他们依然坚持印度与美国联手是不可行的。他们拒绝让政府谈判,所以我认为这个计划会告吹。他们在乎印度即将面临的能源问题吗?不,他们不在乎。他们在乎的不过是他们的意识形态。而他们想要保持他们的意识形态。所以他们会去告诉国会议员说他们击败异教的美国从中介入,然后他们会拿到选票,并且当选连任。那就是他们所关心的,从头到尾都是这样的心态。除非这个改变了,否则只靠经济的成长并不能根本地改变结果。有些人会发财而且过的很好,但是那实质上没有解决问题。

姜:这和台湾很不一样。如果你拿了 Abel 奖,你就可以直接和总统谈了。

黄:你是指行政院长吧,因为 …

V :不,好吧,那些人都不错。首相立刻发了一封贺电给我。那里面 … 你知道的,说些好听的话,“下次你回印度,…”等等,但是也就只有这样。(笑)

刘:就某种意义上来看,他们是有一些考量的。经营一个国家不是一件简单的事。

V :是,是。当然,当然!

刘:就那方面而言,台湾也是如此。他们会对你很有礼貌,把你的想法纳入考量,但是 …

V :到头来他们还是得做他们必须要做的事。

刘:台湾也是如此。不过,尊重知识分子,无论结果为何,或者无论事情到最后变得怎样,是一回事,而对知识分子的尊重就在那儿,尊重知识分子,我认为那是可贵的。

V :有个看法是,既然现在中产阶级富有了,他们付的起了,或许你可以要求外国到印度办私立大学。但是我认为会有很多反对的声浪。他们不想见到文化的帝国主义。

刘:我了解。

V :嗯,我想这个问题到头来还是会被解决的,对吧?会有足够的需求给 … 我认为那会发生,因为印度的工业,资讯科技行业等等,还依赖西方的研发,他们对从中取得原型很在行的,也能做一些事。但钱不是从那里赚的。真正赚钱的是专利。那需要自己的研发,否则你不过是个赚血汗钱的工厂。我认为大家了解这个的重要性。所以有些实业家也开始有他们自己的研发实验室。随着这样的风气开始盛行,他们会开始要求人们为他们而工作。然后政府会回应:“喔喔,你需要更多生物学家,好,那我们来训练生物学家好了。” 此时,你不能只训练四个顶尖的专家来做研究,因为 要有四百个科学家才会产生四个顶尖研究人才。但是,有四百个科学家却没有那么多工作!没有工作他们就不会加入了,这就是我们现在所处的阶段。所以我认为第一件事就是一般企业一定要有科学家的需求,然后基础科学的进展就会实现了。

刘:研发先决条件是研究,对吧?谢谢你,我了解你对社会的各层面都非常的关心。真好!希望你常常回来台湾。

V :谢谢!

注:本文访问者刘太平、黄启瑞、姜祖恕任职于中央研究院数学所,尤释贤任教于新加坡大学,整理者焦源鸣、陈与庭、黄建豪为中央研究院数学所助理

来源:好玩的数学

中国科学院数学与系统科学研究院 2024-02-29 15:01 北京
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|数学中国 ( 京ICP备05040119号 )

GMT+8, 2024-12-22 20:54 , Processed in 0.093750 second(s), 16 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表