学术期刊
学术期刊

文章荐读 |赵玉蕙: 多形态史料的互相勾连——NARA所藏东京审判史料的整理与数据库建设

发布时间:2024/1/29 14:29:00

【内容提要】美国国家档案馆(NARA)所藏东京审判相关历史文献具有保存状况好、完备度高的特点。除了文本资料外,该馆还保存有数千张图片和超过8000分钟的原始庭审视频资料。如何基于这些历史资料的特征进行整理编纂,并通过技术手段更好地呈现文本、图像、声音等不同形态,使之得以互相联结,实现高效便捷地研究利用是数据库建设过程中需要关注和解决的问题。

【关键词】东京审判;历史文献;数据库


引言


东京审判(远东国际军事法庭审判,1946-1948)是二战结束后同盟国家在东京举行的清算日本战争责任的国际刑事审判。这场审判是人类历史上第一次通过司法方式确立和追究侵略战争的犯罪性并追究个人刑事责任,对于战后东亚地区新秩序的建立和国际刑法的犯罪都具有重要的意义,近年来也日益为学界所重视。不过长期以来国内关于这一领域的文献材料匮乏,又兼缺少相应的整理和编纂,对研究造成了不小的阻碍。

随着近年来相关学术机构和个人对国内外相关史料的积极发掘和整理,这一局面已得到较大改善。这其中尤以对美国国家档案馆(NARA)所藏东京审判相关历史文献的征集、整理和数据库建设取得了较大的进展。本文梳理了该馆所藏东京审判史料的主要内容、研究价值及其多样化的形态特征,并论述了对它们进行数据库建设时如何通过技术手段更好地呈现文本、视频等不同形态的史料,使之得以互相联结,并能够高效便捷地进行研究利用。


一、东京审判的历史文献


(一)战争史与审判史

东京审判的持续时间长达两年半,仅庭审记录就长达5万页。其他的如证据文献以及法庭各方内部资料的数量更是数倍乃至十数倍于此。不同于法学家所关注的东京审判如何对国际刑法、国际人道法进行的推动,历史学者在审视这些历史文献时具有不同的视角。具体来说它们可以分为两种类型:

一是对战争的叙事。由审判所集结的文献资料对于研究日本当代史具有丰富与珍贵的价值。正如东京审判的助理检察官刘子健所说:“国际检察局和辩方都只感兴趣于对各自立证有利的材料,自然地就会遗漏记录和证物中的许多历史性证据,何况不是所有的律师都熟悉日本各类政策的背景,因此许多本应被囊括进证据的文件都被排除在外……总之,东京审判的记录和证物为公众展示了大量的史料,许多研究都可基于此展开。而要进行彻底的历史研究,学者们必须走到那些律师们的前头去。”主持编写《东京战争罪行审判:索引与指南》(加兰德出版社,1987年)的英国历史学家沃特亦将审判本身看作“20世纪最重要和最有意义的历史资料库”。

第二种则是对法庭和审判历史的记录。鉴于东京审判在国际法发展上具有开创性的意义,即与纽伦堡审判一同确立的反和平罪的先例,因此审判本身即是一件极具研究价值的对象。勾勒这一历史事件的文献除了庭审期间连续的官方记录、不能忽略的还有法庭设立之前同盟国关于审判构想和建立的系列文件,主要由同盟国战争罪行委员会(UNWCC)及其远东小委员会(FEC)的工作及会议记录以及同盟各国相关的外交档案构成。此外还有法官、检察官、辩护人们关于审判的而产生的通信、电报、日记、回忆录、著作等等。这些作者多半是杰出的法律工作者,他们的文字跳出了审判的内部框架,打上了个人立场的烙印,同样是研究东京审判本身及其重要的历史文献。沃特也指出“通过它们可以作成一部完整的审判史,即东京审判作为20世纪前半叶这段风云变幻的历史进程中的一个重要节点如何在各方势力角逐之下一步一步形成和发展。”

围绕东京审判产生的历史文献丰富而具有研究价值,目前被保存于世界各地数十家档案馆和图书馆。按收藏类型来看,可分为综合性收藏和个人文书收藏两种类型。前者以国家档案馆和综合性图书馆的馆藏为代表,后者多为当事者及后人个人捐赠为主,多藏于高校图书馆。而就完整性和绝对数量而言,则当推美国国家档案馆(NARA)为首。

(二)NARA所藏的东京审判史料

美国是远东国际军事法庭的实际主导方。法庭结束审判之后,相关的一系列资料都被移交给美国国家档案馆保存。毫无疑问,该馆是收藏东京审判相关档案最为系统、完备和丰富的机构。美国国家档案馆所藏东京审判相关资料主要归在编号RG43、RG125、RG153、RG238和RG331几组文献中,内容涵盖远东委员会、盟军最高司令部及其下属国际检察局、远东国际军事法庭等相关机构的庞大文献。在此对几组重要的文献组稍作展开介绍:

  • 远东委员会相关
远东顾问委员会(FEAC)由澳、加、中、法、印、荷、新、菲、英、美各国代表组成,作用是为占领日本期间的各种政策提供咨询。1946年莫斯科会议后苏联加入,远东委员会(FEC)代替了远东顾问委员会。远东委员会的重要职能之一就是考虑对日本战争犯罪嫌疑人确认、逮捕、审判的一系列问题,并授权盟军最高司令部建立军事法庭。同时该委员会对战争犯罪(反和平罪和反人道罪)的概念及范畴也进行了广泛和详细的说明。

在RG43组文献“Records of International Conferences, Commissions, and Expositions”下保存有大量(约150包)远东委员会及其前身远东顾问委员会的相关资料。包括1946-1951的会议记录、备忘录、政策文件、侦办战争犯罪的探员名单、由盟军最高司令部法律部和国际检察局搜集的各种档案,以及大量的附录清单。

  • 远东国际军事法庭(IMTFE)相关
与远东国际军事法庭审判即东京审判的档案主要保存在RG153和RG238组档案中,前者题为“Records of the Judge Advocate General (Army) →War Crimes Branch”,后者题为“National Archives Collection of World War II War Crimes Records→Records of the International Military Tribunal for the Far East (IMTFE) 1946-1948”。主要内容有:

·起诉书、全部公开庭审的逐字记录、判决书和最终判决。

·五名法官的少数意见书。·庭长办公室审理记录。

·法庭证据文献。

·法庭驳回证据,包含检、辩双方被驳回的证据文件。

·辩方文书,即所有辩方文书中没有被作为证据提出的部分。

·1948年宣判后给麦克阿瑟的要求重新考虑判决和量刑的请愿书。

·关于麦克阿瑟将军对法庭判决的评估记录。

·1946年3月18日-1948年11月9日法庭的官方照片,共750张。包括法官、检察团和辩护团成员、被告、证人、其他法庭工作人员、来访者、法庭场景和部分证据的照片。

·法庭公文,包含被告方的动议和请愿书文件、法官、律师及证人的宣誓文件、被告健康状况证明、文件的提出、撤回及修正等申请。

·其他各式记录,包含庭审记录部分概要、修订记录、法庭宪章副本、法庭成员宣誓不对外泄露庭审情况的文件、辩护律师个人简历等等。

·法庭日报,内容包括每天的公开庭审摘要和庭长办公室记录摘要,以及庭长与最高司令部、国际检察局代表之间的会议。

·各类索引和列表。包括检、辩双方案件的人名及主题索引、证人人名索引、诉讼案件索引、证据列表等。

  • 驻日盟军司令部相关
盟军最高司令部经美、英、苏、中四国政府协商,按当时美国总统杜鲁门的指示于1945年8月14日指派麦克阿瑟将军为驻日盟军最高司令官,对日本实施间接统治,迫使其遵守投降文书中的款项,于1952年旧金山和约签署之后解散。

该机构相关资料集中保存于RG331组文献“Records of the Allied Operational and Occupation Headquarters, World War II”中,对于了解美国对占领日本时期的政策倾向、各国对于惩办战争犯罪的态度、协商和后来的实施情况非常重要。其中主要包含三个部门的资料:

法务部记录:法务部主要负责制定一般性法律事务的政策和工作准则,因此其内容范围包含了A、B、C级审判,除了荒木贞夫、东条英机等A级被告的卷宗、东京审判庭长办公室审理记录、东京审判判决书之外,还有田村浩、丰田副武两个B级审判的记录以及不少个人口供书和声明。

行政部记录:该条目下相关记录包括1945-1948年的战争罪犯的调查(2包)和讯问报告(1包)。不过通过与粟屋的《国际检察局讯问记录》中的名单对比,此处的讯问名单与同组“IPS记录”条目下的相关内容有很大的出入,且体量也小很多。在进一步探明之前,尚不能确定两者之间的关系。

国际检察局记录:内容包括1946-1948年间首席检察官季南的往来信函、检察局工作人员记录、经过编号的案宗、证人和嫌疑人文件、作为证据而搜集的各式文件、证据分析报告、辩方文书、重要嫌疑人的日记、法庭各式公文、英日两种语言的庭审记录、法庭证据文件、判决书、媒体相关报道的副本以及其它各式文件等等。此外,在另外两组文献中也保存一部分国际检察局的部分文,分别是RG 125“海军军法处记录-战争犯罪”和RG 153“陆军军法处记录-战争犯罪”。

可以看出,以远东国际军事法庭为专题的RG238组文献在数量和文献完备性上显然都胜于其它编组,它与以盟军最高司令部(国际检察局)为专题的RG331组文献一起组成了东京审判的重要史料群。

(三)多形态的史料及其价值

可以说,围绕东京审判主题的史料形态大部分以纸质文献为主要载体,为了更好地保存,这些珍贵的原始资料陆续被制作成缩微胶卷。前文所提及之NARA的RG331组档案大部分亦制成了缩微胶卷,总计超过1000卷。同样RG238制作了61卷35毫米缩微胶卷的副本。出于保护原始档案的目的,目前对外开放的大多以缩微胶卷形式呈现,大多数人需要到馆借助机器阅读浏览。而除了传统的文本史料,需要关注的还有其他形态的史料。在东京审判的年代已经有了成熟的摄影和摄像手段,因此照片乃至动态影像也成为事实记录的手段之一。例如法庭证据第148号便是一部12卷的电影资料,为1933年日本拍摄的“紧急关头的日本”。至于法庭本身也安排了摄像师对每日的庭审进行录像,此外还有摄影师及当事人个人拍摄了众多反映法庭内外情形的照片。故而除了传统的文字记载,记录审判的史料还包括相当数量的照片和视频。

法庭的官方摄影师均来自美国陆军,该系列照片集中保存在WPA-46编号下,共1508张。此外还有不少照片资料散见于各类官方和个人文书当中。每张照片附有备注说明拍摄时间以及内容。视频资料集中在ADC/111LC系列档案下。编号自ADC5882(1946年5月3日)~ADC7423(1948年11月12日)为止,除去中间编号缺漏的部分,总计约有893卷,单个视频时长约在6~11分钟左右,其内容均为某日法庭庭审实录,总时长共约8400分钟。

照片与视频作为新形态的历史资料,在东京审判史料中只占据很小的比例,但它们却集成了传统文本史料所无法记录的声音与图像信息,极大地丰富了特定场景的历史细节。例如日本学者武田珂代子在研究东京审判的法庭翻译时,通过大量梳理英、日文两种庭审记录并结合当事人记述等来还原和评价法庭翻译工作的制度、结构和实际运作效果。也许是囿于当时的条件,武田并未利用到庭审原始视频。倘若将视频所体现的信息与各类文本史料结合,想必能够对东京审判法庭翻译工作的运作情况有更加直接和真实地还原,更深入和生动地阐释翻译工作对于审理的推进产生影响。



不过,就NARA所藏照片和视频资料来看,要对它们进行利用来帮助研究还存在不少障碍。照片的问题在于其备注信息涉及大量非英语人名,其中错误较多。如非掌握英日两种语言,信息容易混淆和出错。视频的问题则是缺少背景信息,每个视频没有配备字幕和说明,由于其内容通常是当天庭审中所截取的一小段,若非十分熟悉庭审的观者往往对其中的人物和内容不得而知。因此,对于这类新形态的史料如何进行整理,使之在最大程度上为研究者所用也成为相关数据库建设的一个课题。


二、数据库建设:联结不同的史料形式


(一)东京审判数据库的类型及发展趋势

目前世界各地已有十数家机构将其部分甚至全部的东京审判相关的馆藏文献进行数字化处理并面向公众开放。包括美国国家档案馆、日本国立公文书馆、哈佛大学法学院图书馆、国际刑事法院、弗吉尼亚大学法学院图书馆、中国国家图书馆等等,其内容既有综合性文献库也有东京审判当事个人专题文献库。

1.约瑟夫·贝瑞·季南数字文献(Joseph Berry Keenan Digital Collection)

东京审判首席检察官季南的个人文书系哈佛大学法学院图书馆特色馆藏之一,其内容包括:季南在担任国际检察局局长期间的各类往来书信以及1945-1947年间他在日本拍摄的黑白照片。

2.国际刑事法院法律工具数据库(Legal Tools Database)

该数据库自2003年开始建设,其目的是建立一个面向公众的国际刑法资源库。包括中国在内的14个国家参与了数据库的内容建设。在“联合国家战争罪行委员会”、“国际(化)刑事法庭(基本文件)”、“国际(化)刑事法庭判决”三个分类下收纳了包括东京审判在内的战后审判有关文献,包括同盟国战争罪行委员会远东和太平洋地区分会的38次会议记录、东京审判的法庭文件和澳大利亚、中国、美国、英国的部分BC级战犯审判的判决书。

3.远东国际军事法庭个人数字馆藏

该数据库系美国弗吉尼亚大学法学院图书馆与弗吉尼亚历史学会图书馆合作的成果。内容包含五名远东国际军事法庭当事人的个人文书,分别是弗兰克·S·塔夫纳、大卫·尼尔森·萨顿、罗伊·L·摩根、G·卡林顿·威廉姆斯、卡尔霍恩·W·J·菲尔普斯。内容均为各当事人在东京审判中担任助理检察官期间积累的各类调查报告、法庭文件和私人信函照片等等。

4.东京审判资源库

该资源库由中国国家图书馆开发,内容基于国家图书馆近年来广泛征集东京审判海内外文献的成果。目前上线的主要档案均来自于美国国家档案馆,包括东京审判英文庭审记录全文和一部分庭审原始照片。

总的来说,这一类开放在线资源的本质是将缩微胶卷、纸张等线下资料经过电子扫描之后按内容、时间等分类排序制成线上资源。它们所解决的最大一个问题在于读者不必亲身到馆,通过网络即可获得资料,从而大大扩展了资源共享的范围。但这种史料处理方法仍然可以看作是传统纸质出版的简单延伸,两者具有相同的局限性:1.限于顺序浏览检索,难以进行主题乃至全文检索,仍不得不借助于传统的纸质工具书;2.在史料的形式上,多数在线资源还没有对视频等多媒体资料给予足够的重视。显然,要突破这两点局限对数据库建设提出了更高的要求,需要运用更多的技术手段和知识储备来完成。

(二)整理NARA东京审判史料:文本、图像与声音

历史文献数据库在内容建设上的导向之一应当是如何借助数字技术手段,根据史料本身的特点进行整理和编纂,使得史料有更佳的呈现方式,从而达到更高效的利用和研究。如前文所述,NARA所藏的东京审判文本史料具有保存状况好、完备度高的特点,而超过8000分钟的视频资料则是具备独一性的新型态史料,却是缺乏背景信息、未经整理的“璞玉”。基于这些特点,对它们的数字化编纂目前进行了如下工作:

1.文献全文检索功能

相较于单一的顺序浏览,全文检索的功能可以大幅提高文献资源的利用效率。只需在数字化扫描档案的基础上增加一道OCR(Optical Character Recognition)工序,使得扫描后的文献处于文字可编辑状态便能进行关键词的提取和检索。然而是否能够实现这一功能要视原始档案文字的语言及形态等要素情况,这是因为现有的识别技术对于小语种和手写体文字往往无能为力。具体到东京审判的史料,大量的个人文书信函均为手写体文字,同时兼有英、日两种语言,再加上部分原始档案质量较差,字迹模糊,这些都对文字识别的处理带来极高的难度。尽管如此,一些条件较好的档案资料仍然可以成为探索的第一步,比如法庭的庭审记录。

《远东国际军事法庭宪章》规定审判语言为英语和日语,故东京审判的庭审记录也存在英文和日文的两种文本。每天的庭审均配有专门速记员进行记录,从1946年4月29日检方向法庭正式提交起诉书开始,直至1948年11月12日宣判结束。在审判期间,英文的记录由法庭事务局逐日印刷并在第二天分发给法官、检察官、辩护律师等相关人员,而日文记录完成的速度要慢很多,经常要拖后一个月左右的时间。两种文字记录在内容上有细微差异,但忠实地还原了庭审原貌。不仅包括各方当事人——庭长、检察官、辩护人、证人——在法庭上的一切正式发言,包括举证、作证、质询、辩论乃至围绕法庭程序进行的激烈争吵,同时也事无巨细地留下了支撑法庭运作的秘书处、文件部、行政部、语言部等机构的工作痕迹。可以说庭审记录是了解东京审判最基本的文献。



英文庭审记录格式规整,以英文印刷体为统一字体,且NARA所藏版本图像质量较高。这些前提保证了文字识别技术的可行和结果的相对可靠。目前已实现的是总共49858页的英文庭审记录的全文检索,具体包括:

·字段检索:检索某个字段的内容

·智能检索:根据检索词智能扩展检索结果

·组合检索:多个条件组合检索

·二次检索:在检索结果中再次检索

·相似性检索:提供相似检索结果

·同句/同段检索:在文献的同一句/同一段检索

·翻译检索:中英文翻译检索

·精确/模糊检索:检索词精确/模糊匹配检索

·混合字段检索:多个字段统一检索

对使用者而言,可以不再囿于顺序检索庭审内容,以关键词为线索聚集庭审内容,大大提高了史料利用程度。相比于简单地扫描上线,可以说这一功能的实现才真正体现了较之传统整理编纂方法的优势,也标志了东京审判研究从此迈入了数字化研究的阶段。



2.视频的双语字幕制作

在实现了庭审记录的全文检索后,对8000余分钟庭审视频的编辑加工也因此有了良好的基础。原本这批视频除了开头简单标示日期和拍摄者之外,再无与庭审有关的其他信息。不光无法定位每个视频在这一天庭审中的具体时间,更难以弄清视频中走马观花似的证人和律师。因此,要使得视频资料有效地传达信息和正确地被利用,必须补充完整背景信息——配上字幕是最清晰明了的做法。为了做到这一点,必须以文字的庭审记录为支撑。

而当法庭庭审记录实现了全文检索之后,便可以通过每段视频开头所提供的日期信息定位至某天的庭审记录,再根据视频中出现的对话作为检索条件,对当日庭审记录进行全文检索,最终确定视频在庭审记录中的精确位置,从而匹配英文字幕。此后,再以日文庭审记录的印证和校对基础上,完成中文字幕的翻译,以保证视频中大量人名、地名、机构名等专业名词的准确性。在这些信息添加完成之后后,再为每个视频重新编目,如此所有的视频便能通过关键词检索而得。




对于东京审判视频资料的处理典型地说明了在史料数据库建设的过程中,需要对不同形态的史料进行互相贯通和补足,进而实现高效便捷的利用。


结语


相比于传统的史料整理方法,利用数字手段来处理史料显然具有明显的优势。全文检索功能的文献数据库不但能够实现对大规模史料的集中灵活检索,更能将不同形态的史料相互贯通,形成多媒体史料库。不过,数据库建设的背后仍然需要传统史料整理工作的成果积累和支撑。

此外,目前已进行数字化整理的史料主要为英文语种。尚有大量的日文、中文乃至小语种史料还未纳入数字化整理的范畴。如何处理和实现非标准字体的文字检索功能,如何贯通不同语言之间的史料,都对未来的史料整理和数据库建设工作和提出了更高的要求。


作者:赵玉蕙,上海交通大学战争审判与世界和平研究院副研究员

来源:《战争审判研究》第一辑