
一、就算是翻拍、掃瞄的史料,在印製成紙本時,我們還得看這些檔案有沒有色差、雜點,或是其他印製錯誤,這些的校對都是很微細的工夫,隨便一本都必須花上三天到一周以上,而且為保正確,還得經過多次校對。
二、影印史料的索引,特別是人名、地名、單位名、….等,是不可能仰賴電腦的,因此這都是純人工作業,比如說蔣介石的檔案好了,單以蔣介石這個人,在原件中就有可能以蔣介石、蔣中正、蔣公、介公、校長、委員長、蔣委員長、….等名字出現,在製作人名索引時,就必須靠人力一個個地挑出來,標上頁碼,彙整起來,這種工夫不但考驗耐力、眼力,更考驗學者的腦力(得搞懂史料提及者的字號、化名、職銜)。而且,檔案或日記往往只寫官稱與姓氏(劉指揮官、李軍長之類的),或是寫地名縮寫+姓氏(桂李、粵陳之類的),研究者必然要花不少時間推敲,到底原件講得是誰。就算國史館出版的史料彙編,我也見過不少判斷錯誤的例子。甚至還有把地名判讀為人名,或是一個人被分列到兩個索引底下的。
三、史料時間的判別。一份史料有的有標明產生時間,有的則是使用其他代碼(韻目代日)來標明時間,為求了解史事,在注解時,仍得將之還原。有時用韻目代日時,只能知道是某日,但不知年月,這就得靠內文考證,才能確定這份史料的時間點。在編成史料彙編時,才可能放在正確的時間點,否則學者引用時,很容易就誤判了史料所傳達的訊息。四、如果史料全文送打,那打字稿送回時,往往是慘不忍睹的。這是因為原始文件的文字未必都是很好認的,而且每個人的字跡都十分不同。加上接案的打字者,也未必就有歷史背景(其實有沒有這個背景只是要猜比較好猜)。以我個人接案的經驗來說,我到打字行接這案子時,也有另一位中文系的學生也要接,但他一翻開影印本,二話不說就放棄了。而我因為所學的領域,所以我還是接下來,不過剛開始認字時,就很頭痛,特別是某些特定的人物,他們的字真的就超難認的。至於,打字檔送回史政單位時,首先自然就是先校對,因為這種事關重大,所以鐵定不能抽校,只是全校。如果發現有錯誤就必須標出,送回打字商修改,通常經過三校就差不多(是「通常」)。完成後,如確認無誤,才會開始之後的步驟,比如說編索引。
五、替史料加注解是為了方便讀者了解史料的背景,而這如果對史料產生的時空背景沒半點了解,那就會出現很慘的情況。這部分就算是研究這方面的高手,也不敢說兩三天就能寫出來。此外,加注有很大的部分是介紹原件提及的人事物,這些人物縱然真的很出名,編著者大概也沒幾個人敢說抄抄維基就了事的(當然這也不是沒有過,不過這樣的品質想當然爾,會是十分糟糕的)。
六、如果電子化的檔案要上線,那後端著錄的工夫也不是簡單的上傳而已。檔案的系統因我沒參與設計、製作,就不提了(畢竟這是網頁工程師的專業),單以著錄時下關鍵字、人名、地名索引,還有權威資料庫對專有名詞的控管,都不是一個簡單的上傳就能搞定的。更何況,光剪貼文字檔,也還得順道檢查是否與原件相合,有沒有錯漏字之類的。另外,也得注意到附件是否送打,表格是否是以表格的型式呈現,缺的要補打,表格不以表格型式打字的,要還原為表格製成附件上傳。以我之前曾經手的行政院檔案,光其中一個議案的預算表,我只單單打字就花去一整周(當然這屬於最龐大的),而一卷當中的至少有20-30個議案,整個著錄花起來也絕非一時半刻能解決的。
七、每個史政單位、研究單位的人力也滿有限的,相關於某些主題的研究人員也就那麼幾個,要他們整理檔案自然不成問題,但他們的工作從來不是只有這一項,比如說自己從事的研究、日常的工作、研討會的參與、瑣碎的行政工作,或者倒楣一點得上法院(近代史、台灣史學者很常被告),這些都會分掉他們的時間,就算是不要命地工作,也很難能快得起來。或許有人認為多找幾個助理就好,但要找堪用的碩士生、碩士很容易嗎?有的是領域差太遠的,要重新訓練;有的是領域相合,能力卻不足的。不太合用的助理再多,也不濟事,更何況多一個人就要多一份薪水。
八、最後一個就是錢的問題。每個史政單位、研究單位的預算都有限,要增加人力就要人事支出。而出版這種沒人看的史料彙編(別告訴我這種書出版就會很多人買,如果真這樣,中研院台史所、近史所、國史館、台灣文獻館歷年出版了那麼多史料彙編,告訴我你看過幾本、買過幾本,或者是有哪一本是暢銷的),只是單方面的消耗預算,根本不可能回收。不過所有的史政單位、研究單位還是基於推廣的原則,不斷地加以出版。也正因為投注的資金無法回收,這種傻事也只能透過官方單位才能進行。但是,這類書的出版,在編列預算時往往會成為立法院砍錢的對象。此外,這些單位也不是只有這些書要出版,其他學術性的書籍(一樣賣不出去),也要分這個大餅。而國庫顯然不可能為此特別撥一筆巨款來支持這些書的出版,那自然是有多少錢,做多少事,逐年補完。否則在學者自己眼中,哪個不願意一次就通通出版完成。


















