钱钟书的数学

核心提示1980年代末,钱锺书 与栾贵明在钱 锺书寓所。摄影/杨绛本刊记者/鲍安琪在因涉嫌“贪污罪”取保候审的五年中,栾贵明常常想起钱锺书1985年夏给他的那封信。在信中,钱锺书告诫他,项目做好了,很多人会高兴,也有很多人会生气,他有可能成为众矢之

80年代后期,钱钟书和栾桂明住在钱钟书。摄影/江洋

本报记者/包安琪

因“贪污”被取保候审的5年间,栾桂明时常想起1985年夏天钱钟书给他的那封信。

在信中,钱钟书警告他,工程完工后会有很多人又喜又怒,他可能会成为众矢之的。钱钟书让他十年后回来读这封信。

事故发生时,时间刚好近十年。

这个项目是“中国古典文献数据库”,现在叫“中国古典数字工程”。从1984年钱钟书布置这个任务开始,35年过去了,栾桂明和后来加入的田义只做了这一件事,直到今天。

由于缺乏资金,该公司不断西迁。现在“扫叶”公司位于北京西南五环外房山区一个名为“扫叶园”的平房院内。“扫落叶”这个名字来源于一个知情人的说法:校对书籍就像扫落叶。

田义告诉《中国新闻周刊》,截至目前,中国古典文学从上古到北宋的输入和整理工作已经完成,共计十几亿字。预计再过5年,将完成1912年以前的主要文献书籍的数字化,共计15亿字。

忘年之交

1964年9月的一个星期二早晨,栾桂明在6号楼一楼的大书库最后一排书架旁,第一次见到了钱钟书。

当时,栾桂明刚刚从北京大学中文系古典文学专业毕业,被分配到中国科学院哲学社会科学部文学研究所。出于对钱钟书在大学时代的推崇,他一到就四处打听哪里能见到钱钟书,从钱钟书那里得到各单位都会去书库看书的“情报”。

栾桂明记得,钱钟书当时读的是一本不引人注目的丛书《集成》。他去打了个招呼,简单介绍了一下自己。令他惊讶的是,钱对他的家庭来说并不陌生。

栾桂明是名门望族的儿子。他的祖父曾经拥有很多产业,包括著名的北京双合盛啤酒厂。高中的时候,他就开始帮奶奶打理家里的财产。钱钟书认识他的叔叔王济宪,他研究过茅盾。

从此以后,栾桂明经常帮钱钟书做一些琐碎的事情,比如向研究所借书、带信、拿工资、报销医药费等。,两人渐渐成了忘年交。

1972年3月,钱钟书从河南“五七”干校回京后,开始写《管锥编》。他非常需要书。栾桂明用钢管和钢板焊了一辆车给他运书。

曾任中国社会科学院副秘书长的杨润说,当时北京的贵族子弟中有一批“戏子”,栾桂明就有这种“戏子”风范。他喜欢摆弄晶体管收音机、电视机等。虽然外表简单,但听得见,看得见;自学成才,他成为我们部门第一个持有国家颁发的证书的放映员。渐渐地,到了六七十年代,很多人都知道栾桂明是个爱玩的人,能“玩”出点名堂。

一道数学分数为15的计算机题。

1982年,在胡乔木的邀请下,钱钟书被任命为中国社会科学院副院长,条件是不分管行政工作,不需要办公室和工作人员。

当时,钱钟书已经开始了《宋诗年谱》的研究。这是一部由清代人编辑的宋代诗集。他计划在其作者李鹗的基础上对其进行修订和补充,形成《宋代年谱补校》。在他的指导下,栾桂明利用下班后的时间进行了具体的编辑和整理。

工作两年后,栾桂明发现这部作品需要补充宋代3800多位诗人,工作量巨大。比如在一个地方发现了某首诗,就要手动把这首诗拿到作者的作品集里去查。很少有作品是好处理的。比如陆游的诗就有一万多首,很难找到。钱钟书对自己的工作进度很不满意,经常说自己“太瘦”。栾桂明提出加研究所两个人一起做,被拒绝了。

1984年的一天,他去钱钟书家,钱钟书告诉他,给他找了一个“好工具”:电脑。他问,什么是电脑?钱钟书的女儿钱媛被叫了过来,钱媛开玩笑地说:“所有的秘密都会透露给别人。”

原来钱媛刚从英国做访问学者回来,有一次跟钱钟书提到英国学者在用计算机辅助研究莎翁的戏剧。这提醒了钱钟书,中国也可以用计算机来研究古籍。

他让栾桂明放下手头的工作,先学习计算机,当场给了他8000元。当时,钱钟书的月薪是365元,而江洋的工资略少。

栾桂明说,钱钟书告诉他的事情,从来没有在他那里过夜。他从北京西三环南沙沟钱钟书家出来,沿着三环骑行,寻找哪里有卖电脑的。

说来也巧,骑车到东三环,在人民日报社附近的路口,他看到保定电脑厂正在举办小规模的电脑展销会,就进去打听了半天,留下了联系方式。当他那天晚上回到家时,制造商的推销员已经在他的楼梯上等着了。

双方达成协议,电脑可以先免费试用。那时候还没有PC。那是一台Mac,硬盘只有10兆,价格五六万。它被放在他的家里。

栾桂明向钱钟书报告,借了一台电脑,还了8000元。他把电脑说明书给钱钟书看,钱钟书觉得中文翻译的不好,就直接看英文原文。

栾桂明回忆,当时社科院很多人都有疑问,说钱老师一个数学只考了15分的人,怎么可能想出一个关于计算机的项目?栾桂明说,做过文献整理的人太清楚了,电脑可以帮到他们。

1984年至1985年,栾桂明自己买书,自学计算机basic语言。因为钱钟书说过,不懂德语怎么学习马克思主义,不懂文言文怎么学习中国古典文化?计算机技术就像一个工具,你不能向别人求助,你必须自己学习。

在他拿着电脑摸索着走出房门后,钱钟书指派他拿着电脑输入《论语》。

栾桂明告诉《中国新闻周刊》,一开始他并不知道可以用电脑做《宋诗年谱》的补充。后来随着输入文献的增多,他也能做到了。这是一个逐渐了解的过程。但是使用计算机学习中国古典文学时,必须输入一些文献,《论语》就是其中之一。

电脑的一个大问题就是烧钱。存储代码的软盘是一张30元的,不稳定,容易损坏。电费也成了每月的一大支出。栾桂明每月工资60元,经常感到经济压力。

虽然他总是晚上在家做,但文学院的同事渐渐听说了这件事,有时会让他去查《论语》。

1985年夏天,时任文学研究所所长的刘在富带着党委书记朱斋来到栾桂明家,再三劝说,把这个项目转到研究所,作为研究所的机房。栾桂明打电话给钱钟书,钱钟书让他说好。他开玩笑说:“你背叛了我。”

第二天,栾桂明在院子里收到了钱钟书的一封信。这是十年后让他再读的信。

信中写道:“我很高兴昨天接到你的电话。我一开始就告诉过你,如果你一个人做,你做不到,你也很难做到。如果这件事是官方的,就不允许你打头阵,只允许你边缘化。你得把你辛苦积累的一部分交给大众。正如我所料,因为你的品牌还不够领先,而且这个业务是个好兆头。你和我一样,只是一个动手的苦力,不是组织人事、控制财务、调度运营的领导。我修行多年,可以挂名,你还得做苦力。”

钱钟书亲自给这个项目命名为“中国古典文学数据库”。

该所将中国社会科学院大楼一楼的一个房间分配给栾桂明,作为机房办公用房。从保定电脑厂借来的电脑也是研究所出钱,加了额外的设备。

电脑开始招了。首批14人,几乎都是高中毕业生,并不是中国社科院的正式职工。当初他们连合同工都算不上,只是“实习生”。

整个机房没有一个计算机专业的毕业生。栾桂明带头研究,机房的人跟风。栾桂明几乎住在机房。他曾经连续在电脑前工作40多个小时,以至于手脚僵硬。最后,他不得不从椅子上被抬起来,放到床上休息。

钱钟书还亲自为栾桂明挑选了一名助手。

1986年初春的一个早晨,他和江洋一起来到微机室,让栾桂明把新招收的学生叫进来,分别与他们谈话。当晚,他向栾桂明描述了一个练习生的外貌和服装特征。这个学生是田义。

田义高中毕业时生病了,没有参加高考,在社会上打零工。当时光明日报举办了一个十天左右的电脑培训班,她是出于兴趣去上课的。栾桂明也被邀请来教这个班,她得知社科院的机房在招人。

田义向《中国新闻周刊》回忆说,那天钱钟书打扮成英国绅士,戴着白围巾。时至今日,她仍然清楚地记得两件事。握手时,钱钟书的手像面条一样柔软。后来,她经常去钱钟书家,并与钱钟书和江洋熟悉起来。江洋开玩笑说,这是因为钱钟书的“十指不沾春水”。

第二,钱钟书的皮鞋特别好看。它们是棕色的,上面有图案,充满了皮革本身的光泽。田义后来知道,这是钱媛在义大利买给他的。钱钟书去世后,江洋特意将这双皮鞋送给她作为纪念。

谈话中,江洋没有说话,但钱钟书却在提问。田义不记得那次谈话,只知道很快就结束了。

钱钟书告诉栾桂明,“聪明的孩子不可靠,可靠的孩子不聪明。她两个优点都有,她会帮助我们完成这个项目。”

你是裁缝,不是外科医生

钱钟书拒绝担任除机房以外的任何单位的“顾问”。他开玩笑说,机房的年轻人都是他的“孩子”。

他来学院开会,往往先呆在机房。每年,我在生日那天都会收到很多蛋糕和鲜花。我叫出租车去机房,或者叫学生去他家接他们。花放在瓶子里,蛋糕分开吃。

研究、规划、方案都是钱钟书自己制定的。

在80年代中期,使用繁体字是一件敏感的事情,但钱钟书要求他们尊重作品的原貌,必须使用繁体字。

在进入《论语》之前,栾桂明使用的是电脑自带的输入法,导致严重缺字。他们收集了近十种中文输入系统的数据,请钱钟书挑选。钱钟书在台湾省敲定了朱邦复创造的“仓颉输入法”。

这种输入法以单词的第一笔作为分类,以单词的正文作为补充,可以随时添加新单词。钱钟书给了栾桂明一万多块钱,买了仓颉输入法的硬卡。至今《中国古典数字工程》一直在用这种输入法。

在仓颉输入法的框架下,他们开发了一个“全汉字库”,拥有近3万个汉字,可以自动生成繁体字。

钱钟书要求数据库只收录民国建国前的古籍。他提出打破经史子集的传统分类,用作者统一著作,是古籍整理领域的创举。

他还亲自指定了用于入境的原始文件。他认为,由于时代的局限和政治上的考虑,《文远馆四库全书》成书于乾隆年间,存在大量的讹误和疏漏,应予以避免。在《全唐诗》版本的选择上,他指定使用乾隆江南诗局的原版。

至于《史记》版本的选择,则采用张元济编撰的宋版《百书》。钱钟书认为这些版本比较全面,比较准确,可以避免侵犯中华书局的权利。当时社会上没有版权意识,《中华人民共和国著作权法》直到1990年才第一次颁布。

现代汉语中慎用标点符号,不把文字和后人的评论混为一谈,也是一大规范。钱钟书告诫课题组,“你们是裁缝。你只能量体裁衣,不能外科医生。”

1986年,栾桂明和他的团队对《论语》进行了重新加工和整理。第一部由计算机编制的《论语》数据库于1987年由人民日报出版社正式出版,钱钟书题写了书名。

钱钟书在为栾桂明修改该书“序”时,曾写下评语:“以纸、墨、笔、砚‘文房四宝’,必仍有刀、笔、竹简之人;有了汽车,有了飞机,有了电报,有了电话,也有了不遗余力,不遗余力,不遗余力的保守派。抵制新事物是历史上的普遍现象,抵制新事物最后失败也是历史经常给我们的教训。”

按照“文”“诗”再“经”的顺序,钱钟书给课题组布置的第二项任务是完成唐诗。

与《论语》相比,《唐诗全集》可谓卷帙浩繁,需要额外的设备和投入人员,这些都需要资金。栾桂明找也解决不了。不能在院里立项。他一次又一次地跑到科学研究所,所长王环宇决定冒一次险。他同意从研究所科研经费中以借款方式拨付10万元给栾桂明,并约定了还款时间。

研究团队花了近三年的时间,输入了27卷《全唐诗》的所有文本、不同语言、补遗和注释。经过11次校对,《全唐诗数据库》于1988年出版。

《全唐诗》数据库通过计算,确定诗歌53035首,作者3276人,修正了4万多首,2000多人的传统说法。

1988年10月的一天,栾桂明到研究院办公室找到当时主管人事的中国社会科学院副秘书长、新闻发言人杨润石,要求以新闻发布会的形式向社会公布“全唐诗数据库”的成果。并说明其此前向该所科研局借款10万元,机房现有设备足以覆盖这10万元,故要求其以实物抵债,后将机房工作人员辞退。

听了这话,杨润石觉得“借钱搞科研”在社科院是闻所未闻的,也不符合规定。“拆庙还债”更是讽刺,他说要先了解情况。

经过调查,他核实了栾桂明所说的,觉得现在的关键是对完整的唐诗数据库做一个评价。向时任中国社会科学院院长胡绳、常务副院长丁汇报后,邀请中国社会科学院计算技术研究所专家和古典文献研究学者组织评审会。

评审会上,一位红学专家要求现场搜索《红楼梦》这个词在全唐诗中是否出现过,出现了多少次。两分钟后,电脑给出了答案:在总计340多万字的唐诗全集中,《红楼梦》出现在472卷蔡京《徐子归》中:“紫暴前泪,撼红楼梦心。”

有老学者激动地说,做学术研究的时候,查书抄牌很辛苦,所以经常会有“穷经”的感觉。有了这种数据库,研究人员的学术寿命大大延长。大家都认为,如果数据库得到广泛应用,社会科学研究在手段、工具、方式上会有革命性的变化。

1989年3月下旬,“中国古典文学计算机处理技术成就”新闻发布会在中国社会科学院学术报告厅举行,各大媒体均发来消息。按照钱钟书的要求,他与数据库的关系只字未提,也没有对数据库进行公开评论。杨润石后来猜测是为了避免把注意力转向他。

直到两个月后,钱钟书才给杨润石写了一封信,祝贺他取得这一“可喜的成绩”,并感谢医院领导的支持。信中写道:“作为一个对全唐诗感兴趣的人,我常常发现难以搜索词语和短语,我更为这一成就所提供的巨大便利感到由衷的高兴。这是人工知识对中国古典文学研究的重要贡献。”

5月下旬,在胡绳院长的主持下,中国社会科学院初步同意将当时属于文学院的机房改建为研究院的机房,同时将这一项目确立为研究院的重点科研项目。

那段时间机房上电视,参加广交会,被境外媒体报道。1990年,“中国古典文献计算机处理技术”获国家科技进步三等奖。这是中国社科院人文研究成果首次获得该奖项,是一个很有分量的奖项。

杨润石告诉《中国新闻周刊》,上世纪80年代,“三论”是一种学术时尚。他在担任胡乔木社会科学院院长时,曾作出指示,鼓励运用“三论”丰富和改进社会科学研究方法。所以社科院领导一直支持这个项目。1989年调查组进驻后,对该项目的支持力度不变。

1990年底,中国社会科学院计算机室正式成立,栾桂明任室主任。田义以《全宋词数据库》研究通过论文答辩,获得中国社会科学院中文系古典文学硕士学位。17名一直在机房工作的学生被转为社科院正式员工,震惊了社科院所有办公室。

那时候的小机房,每天都洋溢着节日的气氛。谁也没想到一场大灾难正向他们袭来。

“我把栾桂明托付给你了”

社科院计算机室组建后,院里加大了投入,拨付了数额较大的经费。栾贵明不满于个别领导在购买设备等事情上有侵占行为,忍不住跟钱锺书提起,钱锺书严命他如实向院领导汇报,并亲自起草了

 
友情链接
鄂ICP备19019357号-22