中南民族大学中文系教授王兆鹏做《唐宋文学编年地图的现在时与将来时——从文学地图到文学图谱》的分享
李白、王维等诗人为何都去襄阳,是去拜会孟浩然吗?苏轼两次回乡为何选择不同的路线?韩愈819年从长安被贬至潮州,途中有“雪拥蓝关马不前”的诗句,当时的马车如何攀越1000米山顶?在看过很多穿越剧后,回答这些疑问可无法用穿越剧的思维,但是数字人文下的文学地图却可以给你一个清晰的答案或线索。
日前,中南民族大学中文系王兆鹏教授带着他的数字人文研究最新成果——唐宋文学地图平台(Literature Chronogical Map,简称LCM),在华东师大思勉人文高等研究院做了《唐宋文学编年地图的现在时与将来时——从文学地图到文学图谱》的学术报告,神奇地展现了我们所不了解的唐宋文学图景,介绍了数字人文在数据、平台、团队方面的优势。2009年,中国数字人文研究才正式起步,作为非常突出的平台设计者,王兆鹏展望,目前的文学地图将会向文学知识图谱迈进,“以后文学地图平台,不止是研究古典文学的辅助手段,而是一种刚需。”
与唐朝诗人共时空的四个维度
王兆鹏这次来上海讲学,是应华东师范大学的邀请,但受到整个上海高校古代文学界的关注。在主持人、思勉人文高等研究院副院长方笑一眼中,上个世纪90年代,已是唐宋词研究专家的王兆鹏,就凭着前瞻研判,涉足数字人文的前身,以定量分析、数据统计方式研究唐诗、宋词排行榜,令同行十分震惊。20年后,王兆鹏带来的LCM更是一份魔术般的先进成果。王兆鹏将编年事迹和编年作品转化为“关系型结构化数据”,以历史地图为平台,可视化呈现诗人一生的活动轨迹。
他建设的地图平台(https://sou-yun.cn/poetlifemap.aspx)上传了160多位唐宋诗词名家的数据(后续会扩展到400家),数据库里还有80多万诗词作为支撑。地图平台可以从地理、人名、时间、作品四个维度来查找和显示相关结果,王兆鹏在现场做了操作展示。
华东师大思勉人文高等研究院副院长方笑一(右)主持讲座 ,盛赞王兆鹏的前瞻性
当输入“襄阳”这个地名时,页面上会跳出多名去过襄阳的诗人,有卢照邻、宋之问、沈佺期等。以卢照邻为例,显示他是在公元658年-661年,即24岁至27岁期间去过襄阳,其中第一次是公元658年1月,寿州刺史邓王李元裕被封为襄州刺史,卢照邻随这位邓王从寿州前往襄州,这则信息来源于张志烈的《初唐四杰年谱》,地图提供的信息数据都有学术依据。到了公元661年,卢照邻奉使西行,行前还写有《西使兼送孟学士》诗。
当输入“李白”这个人名时,诗仙作为资深驴友的足迹赫然呈现。李白一生走遍祖国大江南北。地图显示,0-18岁,托克马克-江油-平武;23-25岁,峨眉山-键为-重庆-岳阳-九江-当涂;35-37岁,登封-洛阳-襄阳-开封。李白行迹图显示,李白是25岁时南游浙江之后,再西上襄阳,拜访孟浩然。
当输入“公元755年”安史之乱爆发年份时,会跳出王昌龄、高适、李白、杜甫、王维、刘长卿、韦应物、孟郊等十多个人名。安史之乱发生时,著名的边塞诗人岑参在新疆做“随军记者”,王维和杜甫在首都长安(西安),李白则在江淮带漫游。杜甫曾有诗回忆说“不见高人王右丞”,那他是什么时候见过王维呢?数据显示,安史之乱前几年,杜甫和王维都在长安,这段时间,他俩应该见过面。
当输入“《登柳州》”这个题目时,立即会弹出柳宗元的《登柳州城楼寄漳汀封连四州》诗的全文,还有吟唱的音频可听,同时会出现诗歌所描绘地点的地图和卫星图。诗中有“江流曲似九回肠”句,王兆鹏指着卫星图上曲曲折折的“几”字型河流,感佩地说:“唐代人没有现代化的设备,却能完整地想象和描绘出柳江‘九回肠’的景象,可见其想象力、表现力和宏观把控力之强大。”
1000多年前“江流曲似九回肠”,在今天的卫星地图上呈现“几字”状(李念摄于现场PPT)
学科研究和普及的新组合视角
美国著名的科学哲学家库恩在1970年代曾提出科学革命的本质就是“范式转换”,工具和方法论往往是给人崭新的视角,也会带来一个学科的新视域。早年就娴熟掌握唐宋文学界470多种考据成果的王兆鹏,对历史地理非常娴熟,依靠科技新技术,尝试了一种新的唐宋文学研究范式。
*全景呈现一个时代作家的活动、文坛图景
以往对一个作家的研究非常深入,但对一个时代的全部作家却不很了解;在一个地点,知道某一特定时间内有某人活动,但很少知道所有时间段里作家在此地的行迹。过去就像有一道道地墙幕,把同一时间里作家的活动轨迹隔断,而唐宋文学地图平台,就像有了“天眼”,可以同时看到同一时间里很多作家在不同地理空间的活动轨迹。比如1083年,我们从地图地可以知道苏轼在湖北黄州,他的弟弟苏辙在江西高安,而黄庭坚、秦观、晁补之等人在江西泰和、河北大名、江苏高邮等地活动。数据还显示,唐代很多诗人前往襄阳,其实都和孟浩然有关,王维、李白都去探望了孟浩然。“孟浩然的朋友圈显然十分广泛。”
*改变文学地理空间的认知方式
LCM可以清晰地呈现动态的地域文学、流域文学,而并非按照籍贯来划分作家群。比如,在唐代诗人的籍贯里,大多是聚集在中原的陕西、河南、河北、山西,南方籍贯的作家比较少。但唐朝很多诗人被贬谪流放到湖南、广西、广东,在流放地写了很多优秀诗作,比如柳宗元和刘禹锡在湖南永州、常德写了很多诗篇。诗人的活动改变了籍贯的分布。以往研究文学史,只能根据作家的籍贯来村观察作家的地理分布,而有了文学编年地图,就可能考察作家的活动地理和创作地理的分布。王兆鹏反举现代文学中上海文学的例子,上海文学,有上海人在上海写的作品,也有外地人在上海写的作品,还有上海人在外地写的作品。这样,对于一个地方的文学版图就可以全方位的认识和了解。
输入“襄阳”这个地名时,页面上会跳出多有唐朝去过襄阳的诗人
*细化文学史的时间粒度
以往的文学史研究,时间信息往往比较模糊,只能考察大时段的文学现象。而文学编年地图,可以呈现每一年度的作家活动和创作情况。因此,以后的文学史研究,不再只有断代史,还可以有年度文学史、小时段的文学史研究,比如安史之乱期间的诗歌研究,就可以考察每一年的诗歌创作情况。又如,唐宋诗歌史上,上元开元、中元元和、下元元祐的“三元”说,这三个时期,诗歌变化 的节点究竟在哪一年,以前无法知晓。如今可以用数据来描绘。王兆鹏又用具体数据例举了20世纪古代文学研究的发展情况数据显示,1949年到1951年古代文学研究的成果并无多少变化。1956年“双百方针”发布后,文学研究成果才逐步增多。也就是说,政治大变化的1949年,并不是学术变化的关键时间节点。王兆鹏预测,“唐宋文学地图平台”将会带来研究视角和研究范式的新变化。
*展开历史交通图线
台湾中研院院士严耕望先生著有《唐代交通图考》,令学界羡慕不已。严先生从1946年开始,以考释唐代交通路线和制度为目标,累积的资料超过十万件,全书原定十卷,依次出版了《京都关内区》《河陇碛西区》《秦岭仇池区》《山剑滇黔区》《河东河北区》五卷,共1792页,超过二百万字,被公认是一部学术巨著。直至他逝世,整个计划仍未完成。但是有了新技术,可以非常容易地验证严老的交通图,也可以考订宋代交通图。以苏轼为例,苏轼第一次从蜀地进京,是走了唐宋时的驿路;第二次是沿江而下,顺着宜宾-重庆-襄州-唐州-洛阳-开封走。王兆鹏举证杜甫诗《闻官军收河南河北》“即从巴峡穿巫峡,便下襄阳向洛阳”,也是规划走这条路线。但苏轼第三次返乡时却从南京到淮阴再至扬州。“因为这一次苏轼兄弟俩是扶着父亲苏洵的灵柩回乡的。”至此,四川到汴京有三条路线清晰可见。
另有一件令后人大跌眼镜的事,也是从路线中考察出来。辛弃疾自镇江回到铅(yan)山。本来可以走京杭运河,行程790里路,但辛弃疾偏偏避开杭州绕道而行,结果走了900多里。《宋会要辑稿》中有记录,当时任镇江知府辛弃疾因为“好色贪财、淫刑聚敛”而被罢官。弹劾者在杭州,杭州是他心头之痛。
苏轼进京回乡路线图(李念摄于现场PPT)
*助探文学现场
如果能够还原唐朝诗人的行走路径,对理解唐朝的制度、诗人心情都有很大益处。
王兆鹏以韩愈两次被贬经过今天西安的蓝田县为例,演绎了唐朝的律法。在唐朝,贬罚的法律非常严格,要求必须在规定期限内到达被贬地。贞元十九年(803年)十二月,韩愈被贬到连州阳山县,他经过蓝田县武关驿,《南山诗》回忆道:“初从蓝田入,顾盻劳颈脰”,山坡非常险峻,“峻涂拖长冰,直上若悬溜。蹇衣步推马,颠蹶退且复”。朝前走几步,因为结冰太滑,马车无法前行,只能下去推行,常常推了又滑回去。王兆鹏介绍,唐朝人如有马车上这样的山巅,一般是拆卸了,过山顶后再拼装。第二次是在元和十四年(819年),也就是16年后,韩愈又被贬至潮州。照例经过蓝田县,他在诗作中写道:“一封朝奏九重天,夕贬潮阳路八千。云横秦岭家何在,雪拥蓝关马不前”,那年冬天,韩愈的小女儿在路途中被冻死,他悲愤交加。
而这条路白居易也曾走过,并留有诗句“下视千万峰,峰头如浪起,朝经韩公坡,夕次蓝桥水。浔阳近四千,始行七十里。”记者在去年、今年清明节两次徒步走商鞅路,也曾路过诗作中所说的蓝田县的秦岭山峰,对白居易诗中另一句“绝顶忽上盘,众山皆下视”有深刻体会,文学地图上显示了蓝田“绝顶忽上盘”的地理说明——从蓝田县城出发,第五公里开始上坡,第六公里到第一层棱线,第七公里到第二层棱线,快速攀援,上盘绝顶,实际海拔为1041米。至于在风雪中,还要日行70里,记者也深有体会。两次徒步行走中,日行30公里一般需要6-7小时,如果70里,正常速度也要8个多小时,虽有马匹,但遇到过“绝顶”山,难度可想而知。“每首诗就是一部微电影!”王兆鹏的形容非常贴切。
白居易、韩愈多次走过的蓝田县的秦岭山峰(李念摄于现场PPT)
全球“数字人文”图谱下的展望
这些非传统的功能带来了崭新的视角,对唐宋文学的研究颇有裨益,即便是文史爱好者、旅游爱好者、教育游戏开发等都是宝贵的资源。王兆鹏为此普及了“数字人文”概念和海内外发展生态。
*国际元年为2008年,中国2009年起步
与《国学宝典》《四库全书》等数字化文献资源库不同,唐宋文学编年地图平台是活态化数据,这意味着数据可以任意重新组合关联,形成新知识,发现新问题;数据还可以进行语义检索和时空定位,且可以可视化。由此可以理解维基百科上“数字人文”的定义:电脑运算或信息科技与人文学的交叉学科。数字人文是数据、平台、团队三方面的结合。2011年开始筹划、2017年正式上线的唐宋文学编年地图平台,就是典型的数字人文项目,有数据,有平台,有团队。
举目海内外,“数字人文”源于“人文计算”。1960年代的《计算机与人文科学》杂志和1970-1980年代的人文计算机研究中心是其标志。进入新世纪后,2004年,John Unsworth等人所编的文选A Companion to Digital Humanities中强调,数字人文领域非仅仅数字化,而是以现代人文方法来研究数字化对象,以信息科学方法来研究传统人文问题。2006年,美国人文学科国家基金发起成立“数字人文倡议组织”,2008年改名为“数字人文办公室”,从此,“数字人文”就在美国传开了。
随后,斯坦福大学、伦敦大学、弗吉尼亚大学、英国国王学院纷纷成立了“数字人文”研究机构。截至2019年4月20日,在数字人文组织下登记的数字人文研究中心已经达201个,大多在美国、加拿大和欧洲。目前世界上最大的协会组织是国家数字人文联盟。《数字人文季刊》和《数字人文学刊》是两大学术杂志。
中国在“数字人文”方面也不落伍。2009年,武汉大学信息管理学院王晓光教授在个人博客上发表《“数字人文”的产生、发展与前沿》,被学界视为国内数字人文正式起步。目前,大陆拥有数字人文研究中心的有武汉大学、北京大学、南京大学和王兆鹏所在的中南民族大学等。
国外数字人文的进展标志之一是研究机构遍布全球(李念摄于现场PPT)
*LCM十年磨一剑,目标是建成知识图谱
在唐宋文学编年地图平台上线之前,已经有两家同行。一是2007年上线的中国历代人物传记资料数据库(CBDB),是由哈佛大学费正清中国研究中心、台湾中研院和北京大学中国古代史研究中心共同研发。这是一个非常专业的平台,使用比较复杂 ,普通人不容易记住查询方式;第二家是中国历史地理信息系统(CHGIS),由哈佛大学和复旦大学共同研发,2016年12月上线了第六版。
王兆鹏的目标,没有止步于文学编年地图,而是以文学地图为平台,建构文学知识图谱,他总结了三句话:“智能集成文史资源,构建文学知识图谱,还原文学历史现场”。与当下的数字化资源库不同,今后的结构化数据库,可以“一键生成、个性定制”。文学知识图谱,集纳了时、地、人、文、事、物。他举例,可以把《全唐诗》《全宋诗》里诗歌进行语义分类。如果要研究唐宋时期诗人笔下的动物和植物,就非常容易。他的数据里,可以查出每年从中央到地方哪年人做什么官,各个地方有哪些人中进士,哪个时间段作家出生最多。每个人可以形成一个自主的资源库。
中国文学编年地图知识图谱,将集纳时、地、人、文、事、物六个维度(李念摄于现场PPT)
2017年3月,唐宋文学地图平台刚上线时,一夜之间的流量就突破了110万,平日有时空距离和语言距离的唐宋诗人们在便捷的搜索功能下,如同“千树万树梨花开”般呈现在当代人视野中;朋友圈,旅游线路图等和当代人共时空的话题,也如同“百舸争流”般涌入了寻常百姓家。如今,LCM还是免费网站,“用户是最好的老师”,王兆鹏自称十年中自己已经变成半个工程师了,“寻找既懂点文史又懂技术的复合人才确实是不太容易,只好自己赤膊上阵。”然而,就是这样的敢于吃螃蟹者,赢得了国内外同行的无限尊重,而6月刚到花甲的他丝毫没有生理年龄之状,或许,LCM这样的项目前景本身就具有基因编辑里的“增长功能”,只不过是精神助推而非生理改变。
作者:李念
编辑:袁琭璐
责任编辑:李念
*文汇独家稿件,转载请注明出处。