数字人文视角下论《雪国》文本中的悲与美

2022-08-02 07:46陶建明
文化创新比较研究 2022年17期
关键词:雪国脉络章节

陶建明

(武汉文理学院,湖北武汉 430345)

1 研究背景

《雪国》是一部将日本的传统美学与现代西方文学创作手法巧妙结合的经典文学作品。文本内容以岛村两次前往雪国为主线,描述了这位来自东京的已婚成年男子在雪国与两位女性的感情羁绊,以及其在雪国的所见所闻。主线内容简单,却以生动细腻的人物形象刻画、巧妙的故事情节构造,成为川端康成获奖代表作品之一,具有极高的美学与艺术欣赏价值,深受海内外文学爱好研究者的追捧。因此国内外针对《雪国》文学作品的研究热度极高,层出不穷,硕果累累。尤其是在《雪国》文学作品呈现出的悲与美方面,积淀了大量的先行研究成果,然而,历来的先行研究,多倾向于主观方面判断,客观实证研究较少。

近年来,数字人文研究方法在文学领域的广泛应用与开展,为研究者采用新的手段方式解读研究文学作品提供了可能性。该文结合研究发展新趋势,基于数字人文视角,采用KH Coder 文本分析软件,对标记后的整篇文本文档进行了相关系列数据挖掘,并以数据图的形式重新解读《雪国》文本内容,把握文本内容发展主线。结合建立起的网络效果分析图,整合相关数据,进一步对《雪国》文本内容及高频词汇进行数字编码分析,为开展文本内容呈现的悲与美的系列研究提供数据支撑,以期丰富发展先行研究中的实证研究成果[1]。

2 文本导入与预前处理

2.1 文本内容txt 形式保存

将《雪国》日语原版文本内容,输入整理成txt 文档形式进行保存。采用HTML 形式,对保存好的txt文档,依次进行部分章节的归纳划分。将文档划分成上下两部分,以<H1>形式进行标记,上部分进一步细分为01~04,四大章节,下部分进一步细分为01~05,五大章节,以<H2>形式对上下两部分中的各个章节进行区分标记,以便将处理好的文本文档顺利导入分析软件KH Coder,方便其进行后续的操作使用以及相关数据的统计处理[2]。

2.2 数字编码文档设定

该文是基于数字人文视角下,针对《雪国》文本中悲与美的数字化实证研究,因此,为结合对应文本内容的数据挖掘,需要提前做好编码文档的相关内容设定。即将文本主线脉络中,高频出现的“人の死”“病気”“美しい”作为悲与美的代表性因素,以各自形式,提前做好编码内容设定,并单独以txt 形式进行文本保存,方便后续编码文档的导入和相关数据的挖掘分析[3]。

2.3 预前处理结果检测

将整理好的《雪国》文本文档内容手动导入KH Coder 中,运用其文件预处理功能,自动进行对象文件的检测。如果检测过程中出现无法识别或者乱码等现象提示,亦可采取自动处理方式进行修复。系统检测无误,即可执行预处理,处理结果会自动展示汇总单元即H1、H2、段落、字数的相关数据[4]。

3 文本内容分析

3.1 文本词频统计分析

利用KH Coder,对预前处理好的《雪国》文本进行数据挖掘与统计分析。首先,在不进行词汇类别详细区分的条件下,对文本内容中的高频词汇进行筛查统计。由KH Coder 自动导出的文本高频词汇Excel 表格中,可明显统计出“岛村”(位次1,频率370)、“驹子”(位次2,频率263 次)、“雪”(位次9,频率106)、“叶子”(位次16,频率81)等涉及文本内容主线发展的高频词汇及相关出现频率数据。除此之外,还可清晰直观看出形容词“美しい”在整个文本中,共计出现频次26 次,在前150 个高频词汇统计图中位居第71 位。而在对“美しい”相关词汇搜索统计中(见图1),形容词“悲しい”的Jaccard 值最高,位居第一位。为进一步验证上述搜索数据,对“悲しい”的相关词汇进行KWICK 索引统计,部分结果如图1所示,很明显可看出,在索引图中“美しい”位于右2 位置上,共计出现4 次,分值居于索引图首位[5]。

图1 相关词汇搜索效果部分图

结合统计数据,亦可明显发现,不管是针对“美しい”的相关词汇搜索,还是对“悲しい”的相关词汇进行KWICK 索引统计,双方都在彼此统计数据的首要位置。因此,单从《雪国》文本内容中的高频词汇数据的初步统计方面,便可发现“悲”与“美”存在的影子,为该研究主题开展的必要性提供了一定的数据支撑,同时,也进一步推动了后续文本主题脉络走向方面的数据挖掘及相关研究的开展[6]。

此外,通过对图1的相关数据进一步分析比较,还可明显发现,“葉子”“声”等词,同时存在于彼此关联的词汇表格中,且统计数据均位居前列。而在完整效果图中,不管是“美しい”的相关词汇搜索,还是对“悲しい”的相关词汇进行KWICK 索引统计,亦可发现与之关联的名词中,除了典型人物及人物特征词汇外,同时,还出现的有“木”“花”“山”“船”“雪”“虫”等物象的词汇。基于以上数据结果统计,文本内容中,除了以叶子为代表的主要人物形象设定外,文本类构造出的动植物等物象同样也赋予了悲与美的系列特征[7]。

3.2 文本内容编码分析

基于以上针对《雪国》文本中高频词汇初步分析结果,为进一步挖掘该研究主题在文本主线脉络走向方面的相关数据,利用KH Coder 对文本内容进行编码分析。将提前准备好的编码文档手动导入,制作出对应因素的热力图与曲线分布图(见图2)。

图2 文本内容编码分析效果图

图2更加直观地展示了“悲”与“美”相关因素在《雪国》文本内容中的整体走向,以及具体章节分布情况。通过图2左侧的热力分布图可以看出,“美しい”贯穿于整个文本,除文本下-03 部分之外,在其他各个章节内容中均较广分布,“人の死”“病気”这些悲伤因素的典型代表性词度,同样贯穿于整个文本中。且“人の死”在整个文本主题脉络发展中,出现频率波动较大,而“病気”则呈现出逐渐缩小的变化趋势。再结合右侧折线图的分布情况,从整体上把握悲与美的发展趋势。代表“悲しい”的红色折线和代表“美しい”的蓝色折线,交叉分布在整个文本内容中,两者均在文本开端出现一个高峰值分布。而代表“悲しい” 的红色折线在整个文本脉络中波动性较大,代表“美しい”的蓝色折线则整体呈现下降趋势,且在文本下部分后一直低于红色折线的数值。两者在文本内容中的上-03,上-05,以及下-02 部分均出现交集,且在文本结尾处,再一次出现集体上升趋势。

结合对应文本内容进行验证分析,作者在文本开端,无论是对雪国环境的描述,还是以岛村视角,在火车上对初次遇见陪伴照顾疾病缠身的叶子的相关系列描写,均包含了“悲”与“美”的情节设定,由此可见,从一开始作者便赋予了文本内容悲与美的感情色彩基调,所以两条曲线在文本开端便呈现了高峰值。文本上半部分,在对驹子以及雪国美丽环境刻画的同时,伴随文本内容发展需要,还有对相关物景以及人物际遇的悲惨刻画,其中便包括驹子成为艺伎的无奈,纯洁美丽的叶子悉心照顾行男,而行男却最终难以避免死亡命运的安排。而下半部分当中,纵然行男去世,美丽的驹子不用再为医药费而奔波劳累,却依旧难以摆脱残酷的现实,继续生活在灯红酒绿之中,因此,整个文本内容交织着悲与美的客观存在,两条曲线也多次出现交集点。而叶子之死作为文本结尾设定,实际是在一个悲惨火灾结局中,重新塑造了超脱现实、实现自由的美丽叶子形象,即文本结尾是悲与美的再次交织,所以两条曲线再次呈现上升趋势。

3.3 文本数据结果分析

基于以上针对《雪国》 文本内容得出的数据分析,结合文本内容主题脉络走向的相关图例证明,《雪国》中的悲与美是广泛存在的。从文本高频词汇统计数据,可以看出,其不仅存在于像对叶子这种典型的文本人物形象的细节刻画中,而且还存在于如飞蛾、蝉、树木、雪、村落等自然景物的描写中。结合主题脉络走向的相关图例证明,亦可明显发现,作者从一开始便奠定了悲与美的感情基调,且贯穿于整篇文本内容,虽未达到逐字逐段的地步,但是在各个章节中均广泛呈现。在文本内容结尾,从岛村视角出发,以叶子惨死于火灾结局,塑造了美的永恒,首尾呼应,再次实现了悲与美的完美交织。

4 结语

该文基于数字人文视角,采用文本分析软件KH Coder,对《雪国》文本内容进行数据挖掘与相关分析。通过文本高频词汇的数据统计,发现形容词“美しい”存在于整个文本前150 个高频词汇中,“悲しい”位居“美しい”的相关词汇搜索表中的首位,相关数据进一步挖掘后,发现这两个形容词在文本内容中的互关性很高,且文本内容中具有悲与美的特征词汇,除了对文本人物形象描述外,众多物象的描写同时兼具,也从一定程度上,侧面反映了文本内容悲与美的客观存在。该文基于以上数据挖掘,进一步对文本内容进行编码分析,从宏观角度把握文本主题脉络走向,基于制作出的相关效果图例,把握各个因素在文本章节中的分布情况,结合文本内容验证后,直观证明出悲与美贯穿于文本始终,作者在一开始便奠定了悲与美的感情基调,并在文章结尾处,再次实现了悲与美的完美交织。

猜你喜欢
雪国脉络章节
串联知识脉络 巧用动态资源
冬牧
福州吟诵调留存脉络梳理
雪国的炊事班
延安时期的党建“脉络”
党的建设学术脉络与前沿动态——基于CiteSpace的知识图谱
高中数学章节易错点提前干预的策略研究
利用“骨架突破法”,提高复习效率
八仙过海,各显神通
《烃》一章中的实验考点大扫描