20210424「Seal缺字字型製作生成」的新方法暨最新版本釋出

更新於 發佈於 閱讀時間約 10 分鐘
blog:https://ebag2007.blogspot.com/2021/04/20210424seal.html
知乎:https://zhuanlan.zhihu.com/p/367471915


二話不說先【填寫表單】

Google表單https://forms.gle/ss9TbHtQJDi6N2xm7
騰訊問卷https://wj.qq.com/s2/8216629/4766/

【前言】

引得市最重要的資料庫:「古文字缺字資料庫」多年所累積的缺字,一段時間都會整理成一個字型檔,公開提供下載,最近的一個版本是(seal v2.3.3),於2019年12月14日發布,以往都是仰賴瑾昀兄的協助,將筆者在「字型維基」匯出的多個檔案再合併成單一字型,並調整高度,以適應細明體或宋體。
近日經過瑾昀兄的特別研究,改良缺字製作的方法,透過「TeamViewer」全部教授筆者過程方法。
今年四月初,「部件檢索」與「古文字缺字資料庫」都已經提供使用者自動把文字轉成圖形字並下載的功能(後有文章連結),因此每次字型更新時,附帶缺字png圖檔的慣例就暫時取消。使用者平時就可以自己下載需要的擴充字或缺字圖形,缺字圖檔的使用,讓撰寫的文章,不論從那一台電腦開啟都能完整正常的顯示文字。
或許有人也有疑問,既然有圖形缺字檔,那麼「Seal字型」存在的意義為何?是這樣的:字型文字具備有「複製」與「檢索」的功能,在缺字庫整理時,校正內容、對照圖檔會用到,而且是缺字庫的圖檔SVG與「字型維基」連動的,當「字型維基」網站當機或無法連線時,圖檔就看不到,這時「Seal字」就發揮作用,讓使用者還能顯示缺字字型。因此希望使用者安裝下載最新的缺字字型,現階段兩種缺字型式的並存似乎還是有其必要。
今天,就把字型產生的過程稍微的紀錄一下,和前一個版本差距也有一年多,期間又增加許多缺字(如《戰國文字字形表》等文獻索引),因此也順便開放最新的版本。

【Seal缺字字型的製作過程紀錄】A~B~C三階段

※急著安裝字型的朋友,就拉到文章最後,有下載點。

【A階段(缺字編號與Seal字的對應列表)】

打開缺字庫的excel檔,選擇1的部份,0是暫時無缺字的編號。
方式一:複製缺字編號,貼到「自動填Seal字」。這個Excel檔,能夠把缺字編號和「Seal字」自動對應。過去使用自動產生筆畫,或自動產生說文字號,都是一樣的原理,其實就是一段函數如:=VLOOKUP(B2,x!$A:$B,2,FALSE)
方式二:另外一種對應方式,個人認為比較複雜,也是學起來備用,是瑾昀兄傳授的,把兩個列表放在「EmEditor」,點選「製表符分隔」(這樣才能使用CSV→合併),選擇「唯一索引鍵」,將兩個csv合併,執行需要一段時間,合併後就成為我們需要的對應表。對缺字編碼有疑問的,可以複習一下以前的文章「引得市缺字字體編碼方案說明」(最下方)。
我們需要的結果是前列是「缺字編號」後一列是「Seal字」,這樣再執行尋找取代:
(.+)\t(.+)
替換成
[[\2 ebag_\1]]
完成後的結果,我們下一個階段就會用到。

【B階段(缺字字型分區段與缺字內容對應表貼入)】

瑾昀兄建議s215沒必要製作seal字型,從此次版本開始這樣處理,於「字型維基」預先把缺字編號001-214分成五個區間,這是因為一個表大概只能貼4700行。
*缺字區間 s001~s039
[[字表:ebag_seal-1]]

*缺字區間 s040~s071
[[字表:ebag_seal-2]]

*缺字區間 s072~s112
[[字表:ebag_seal-3]]

*缺字區間 s113~s149
[[字表:ebag_seal-4]]

*缺字區間 s150~s214
[[字表:ebag_seal-5]]
從A階段製作產生的文字檔,分批貼入「字型維基」,五種區間內容裡,最上方有「__no_font__」表示說,這個字表,暫時不需要匯集成為字形。每一個表在送出時,都要檢查看看「作字率」,是否達到100%,如果沒有,表示可能有對應不到的情形,需要個別檢查處理。目前若看到遺漏字,解決方式是前往造字編輯界面,把字形拆解,不套用unicode原字,無法對應的原因,還得再了解。我們最後再設立一個總表(ebag_seal)將這五區間的內容合併。
如果內容無誤,我們就點選「執行字體文件生成」,過程大約3分鐘,點選「下載」。gw3228092.ttf這個檔案雖然可以安裝使用,但是還有最後一步驟要執行…。

【C階段(缺字字型高度調整)】

由glyphwiki生成的字型,使用前需要再經過調整才能與細明體或宋體左右高度一致。這裡調整Seal字型,我們使用的軟體是「High-Logic FontCreator 11」
1.開啟軟體後,我們把glyphwiki生成的字體「gw3228092.ttf」拖拉進來。
2.全選字(點第一個到最後一個,按住shift)
3.選單「tools→Transform Wizard→outlines→ move」
在vertical(垂直高度)數值上調整。
宋體(simsun)調整-35,表示向下35
細明體(pmingliu)調整-80,表示向下80
最後,把高度調整後的字型分二批匯出,選單「File→Export Font→Export TrueType/OpenTrueType Font(Shift+Ctrl+E)」
我們調整製作了二個Seal字型版本。適合宋體命名為「seal-simsun」,適合細明體的命名為「seal-pmingliu」,還有原來匯出的版本適合「花園明朝」,命名為「seal-HanaMin」,讓使用者自行選擇需要的版本。

【說明】

本「缺字字型」是筆者自2004年起,為「古文字缺字資料庫」的檢索顯示,和古文字文獻中電腦無法輸入/顯示的缺字,於「glyphwiki」網站造字,所累積衍生的內容。以一般可安裝字型檔(*.ttf)及PNG圖檔兩種形式呈現,多年來提供各界免費下載使用。
上一個版本是seal v2.3.3,在2019年12月14日所發布(17423字)。目前版本seal_20210424新增1752字,共19175字。前後版本相隔一年多,新增的缺字包含:《秦印文字彙編(增訂本)》、《戰國文字字形表》、《清華大學藏戰國竹簡(拾)》、《金文大字典》、《馬王堆漢墓簡帛文字全編》、《古代漢語通假字大字典》、《長沙五一廣場東漢簡牘(肆)異體字表》、《長沙五一廣場東漢簡牘(參)異體字表》、《東周鳥篆文字編》、《字辨百題》、《秦漢印章封泥文字編》、《郭店楚簡文字編》、《楚帛書詁林》、《說文部首通解》、《古字通假會典》、《《干祿字書》、《商代文字字形表》、《古音匯纂》、《增訂漢印文字徵》、《秦封泥集存》、《商周古文字源流疏證》、《說文解字句讀》、《甲骨文常用字字典》、《侯馬盟書字表_2016》、《聲韻語源字彙》、《肩水金關漢簡(貳)(參)文字編》、《漢隸異體字表》、《秦簡字形表》、《漢字源流字典》、《高麗大藏經異體字典》、《新出土戰國楚竹書研究》、《漢字學新論》、《戰國文字通論(訂補)》、《章草大字典》、《爨寶子碑》、《怎樣學習《說文解字》、《新編說文解字》、《說文》、《嶽麓書院藏秦簡》、《漢語變調構詞考辨》、《漢語大字典》、《漢語大詞典》、《辭源》、《山東出土金文字形全編》、《上博楚簡儒學文獻校理》、《嶽麓書院藏秦簡(壹)~(伍)》等四十六種文獻。

★注意事項★

1. 「seal-MingLiU.ttf」、「seal-SimSun.ttf」以及「seal-HanaMin.ttf」font-face均爲seal,三者分別適配了「細明體」、「宋体」與「花園明朝」的高度,除此之外完全一致。用戶只須安裝其中一種即可。
2. 若之前曾執行過SurrogateFallback.reg,後就不必再執行一次。
3. 若之前曾安裝過seal字型,請確保移除舊版字型檔後再安裝該版字型檔。若無法移除舊版請重新開機或者進入安全模式後刪除,以解除程式對字型檔的佔用。

★內容說明★

資料夾中包含:一個說明檔,一個reg檔,三個字型檔。
seal_20210424.xlsx:該版字型檔的清單,列有缺字編號、Seal字、構字式和Unicode編碼。
seal-MingLiU.ttf:適配「細明體」字型高度的Seal字型。
seal-SimSun.ttf:適配「宋体」字型高度的Seal字型。
seal-HanaMin.ttf:適配「花園明朝」字型高度的Seal字型。SurrogateFallback.reg:機碼,進行字型串接的註冊設定。務必執行一次,這樣才能在其他文書程式中顯示缺字字型。



【seal_20210424下載處】

⊙下載點A(Google雲端硬碟):https://reurl.cc/4yzX8j
⊙下載點B(騰訊微雲):https://share.weiyun.com/3Ih6gqsR

二話不說先【填寫表單】

【小額贊助】

如果「引得市」曾經幫助到您、而您想以實際行動支持我們的話,歡迎透過以下小額贊助的方式表達支持與鼓勵。無論金額多少都足夠表達您的一份心意。謝謝!

【延伸閱讀】

20191214最新缺字字型發布(seal v2.3.3)
|知乎:https://zhuanlan.zhihu.com/p/97419643
Blog:https://ebag2007.blogspot.com/2019/12/20191214seal-v233.html
20210409〈引得市〉新版部件檢索的更新與介紹
Blog:https://ebag2007.blogspot.com/2021/04/20210409.html
知乎:https://zhuanlan.zhihu.com/p/363774635
引得市缺字字體編碼方案說明
https://zhuanlan.zhihu.com/p/34081721
avatar-img
2會員
12內容數
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
陳信良的沙龍 的其他內容
「字形構造」與「規整化」的象限 這個「象限圖」,是筆者用於分類解析《說文解字》構形與規整化的方式。源自好友廣島大學的鈴木博士,我們的緣份是從一封EMAIL開始。 當年鈴木博士使用「引得市」的信箱聯繫我,邀請我去京都大學參加研討會,題目是「引得市的研究應用」,平常很少開這個信箱,但那時候莫名的打開
《說文解字》篆文的考察(1/4) 《說文解字》篆文的考察(2/4) 《說文解字》篆文的考察(3/4) 第四節 說文小篆構形的規整化 在字形分析的研究中,我們將字體有明顯規律的安排或調整,通稱為「規整化」或是「美化」,這裡的「美」並不是美學、美感中個人所認知的「美」或「醜」,而是為了研究構形分類,作為
《說文解字》篆文的考察(1/4) 《說文解字》篆文的考察(2/4) 第三節 《說文解字》小篆字形考察 一、「重複字」與「重文」 本節的小篆字形考察,討論範圍基本以「篆文」為主,而籀文與古文不在此範圍內。在字形考察之前,我們先介紹『說文解字』「重複字」與「重文」。「重複字」是說字頭重複,一樣的字編列放
《說文解字》篆文的考察(1/4)  第二節 《說文解字》篆文部首的相關考察  前面一節,我們比較了十種版本說文部首的構形差異,此節將就『陳氏一篆一行本說文解字』單一版本進行詳細的構形分析考察。以下開始的說文小篆形體,都是此版本,不再另外註明。 凡例 .本次考察『說文解字』部首構形使用『陳氏一篆一行本
第一節 《說文解字》的體例與刊印版本 篆書是漢字當中,年代最早的字體,廣義的篆書包括秦代以前所書寫使用的文字。因古代簡牘材質易於腐朽,不易保存,故秦以前的篆書,原始墨跡傳世甚少。所幸在紙張普及應用廣泛的時代,古文字透過描摹得以傳佈流傳,尤其紙張在青銅器或刻石等拓印的應用上,起了很大的作用。  青銅銘
簡牘名蹟選1 湖南篇(一)-68頁 釋文: 卅四年十月以 盡四月、吏曹 如果把這樣的字稱為「篆書」,而其他同時期的文字稱為「古隸」或「隸書」其實是錯誤的。兩者其實並無差別,差別只有大小,會形成粗細一致的線條,也祇是相同毛筆書寫大字的物理特性。而且這樣「大字」在秦漢墨跡文字上並不多,若用「特例」來代
「字形構造」與「規整化」的象限 這個「象限圖」,是筆者用於分類解析《說文解字》構形與規整化的方式。源自好友廣島大學的鈴木博士,我們的緣份是從一封EMAIL開始。 當年鈴木博士使用「引得市」的信箱聯繫我,邀請我去京都大學參加研討會,題目是「引得市的研究應用」,平常很少開這個信箱,但那時候莫名的打開
《說文解字》篆文的考察(1/4) 《說文解字》篆文的考察(2/4) 《說文解字》篆文的考察(3/4) 第四節 說文小篆構形的規整化 在字形分析的研究中,我們將字體有明顯規律的安排或調整,通稱為「規整化」或是「美化」,這裡的「美」並不是美學、美感中個人所認知的「美」或「醜」,而是為了研究構形分類,作為
《說文解字》篆文的考察(1/4) 《說文解字》篆文的考察(2/4) 第三節 《說文解字》小篆字形考察 一、「重複字」與「重文」 本節的小篆字形考察,討論範圍基本以「篆文」為主,而籀文與古文不在此範圍內。在字形考察之前,我們先介紹『說文解字』「重複字」與「重文」。「重複字」是說字頭重複,一樣的字編列放
《說文解字》篆文的考察(1/4)  第二節 《說文解字》篆文部首的相關考察  前面一節,我們比較了十種版本說文部首的構形差異,此節將就『陳氏一篆一行本說文解字』單一版本進行詳細的構形分析考察。以下開始的說文小篆形體,都是此版本,不再另外註明。 凡例 .本次考察『說文解字』部首構形使用『陳氏一篆一行本
第一節 《說文解字》的體例與刊印版本 篆書是漢字當中,年代最早的字體,廣義的篆書包括秦代以前所書寫使用的文字。因古代簡牘材質易於腐朽,不易保存,故秦以前的篆書,原始墨跡傳世甚少。所幸在紙張普及應用廣泛的時代,古文字透過描摹得以傳佈流傳,尤其紙張在青銅器或刻石等拓印的應用上,起了很大的作用。  青銅銘
簡牘名蹟選1 湖南篇(一)-68頁 釋文: 卅四年十月以 盡四月、吏曹 如果把這樣的字稱為「篆書」,而其他同時期的文字稱為「古隸」或「隸書」其實是錯誤的。兩者其實並無差別,差別只有大小,會形成粗細一致的線條,也祇是相同毛筆書寫大字的物理特性。而且這樣「大字」在秦漢墨跡文字上並不多,若用「特例」來代
你可能也想看
Google News 追蹤
Thumbnail
大家好,我是woody,是一名料理創作者,非常努力地在嘗試將複雜的料理簡單化,讓大家也可以體驗到料理的樂趣而我也非常享受料理的過程,今天想跟大家聊聊,除了料理本身,料理創作背後的成本。
Thumbnail
哈囉~很久沒跟各位自我介紹一下了~ 大家好~我是爺恩 我是一名圖文插畫家,有追蹤我一段時間的應該有發現爺恩這個品牌經營了好像.....快五年了(汗)時間過得真快!隨著時間過去,創作這件事好像變得更忙碌了,也很開心跟很多厲害的創作者以及廠商互相合作幫忙,還有最重要的是大家的支持與陪伴🥹。  
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
台文書的出版越來越熱烈;電子書的市場也一直在成長。技術上不論是平台、作者、編輯、排版與設計,以及「字體的開發」上,都需要不斷地學習、精進。願大家做書、讀書、賣書都開心!
Thumbnail
成功加入Anytype之後就可以開始探索這一個開源的筆記軟體了^_^ 開始Anytype之前..... 1.刪除所有初始物件 2.思考自己的使用需求 3.不著急學會所有功能
Thumbnail
這邊統整了過往喜特先生發布過的「資料驗證」系列文! 資料驗證是個「驗證資料是否符合某條件的機制」,我們通常會用它來避免別人輸入無效的值,減少錯誤的發生。你可以按照順序慢慢學習,把資料驗證這功能一次搞懂!
  接著我們繼續來談「整合式大綱」、「編劇式大綱」。 ❈❈❈   ※整合式:   結合「表格式」、「鬆散式」兩者,依劇情片段的份量,或作者是否熟悉該段落,決定是否要寫細節。總之,相當自由!   不過這有點像把大綱當成一種工具書使用,花樣非常多,甚至可以設連結跳轉頁面啊,多半需要一點文書處理的
Thumbnail
這篇文章介紹了幾種漢字轉拼音、拼音轉換工具的使用方法,並提供了簡單的操作步驟。工具包括漢字轉換、漢字拼音處理、臺羅POJ轉換器和讀音選擇工具。閱讀本文將有助於瞭解這些工具的使用方式,並學習如何在文書處理軟體中應用拼音標註。
※ 什麼是資料庫正規化?為什麼需要正規化? 什麼是資料庫正規化? 資料庫正規化是一種設計關聯式資料庫的方法,目的是建立良好結構的關聯表,主要目的有二: 去除重複性:建立沒有重複的關聯表。因為重複資料不只浪費資料庫的儲存空間,而且會產生資料維護上的問題。 去除不一致的相依性:資料相依是指關聯表
Thumbnail
題目敘述 題目會給定我們兩個字串。 第一個是指定順序的字串order。 第二個是輸入字串s。 要求我們依據order給定的順序,重新排列s。 如果出現order中沒有出現的字母,任意位置皆可。 合法答案可能不只一組,輸出其中一種即可。 題目的原文敘述 測試範例 Example
Thumbnail
印刷世界的轉變 - 從傳統裁切標記到數位時代的突破 在印刷世界的迷宮中,我們經常遇到一種神秘的存在——無裁切標記的PDF完稿檔案。這種檔案,就像一座未揭開面紗的古老城堡,讓人既好奇又略帶擔憂。想像一下,當你用Adobe Acrobat Pro打開一個預期中應該擁有明確界限的PDF檔案時,卻發現裁切
Thumbnail
創作邦創作邦精選工具資源-第 32 期,我們每週分享創作邦精選的工具資源合集,從設計資源、AI 工具、生產力工具、影像後製等等內容都涵蓋,如果你想找好用資源或工具,追蹤我們的內容準沒錯。
Thumbnail
大家好,我是woody,是一名料理創作者,非常努力地在嘗試將複雜的料理簡單化,讓大家也可以體驗到料理的樂趣而我也非常享受料理的過程,今天想跟大家聊聊,除了料理本身,料理創作背後的成本。
Thumbnail
哈囉~很久沒跟各位自我介紹一下了~ 大家好~我是爺恩 我是一名圖文插畫家,有追蹤我一段時間的應該有發現爺恩這個品牌經營了好像.....快五年了(汗)時間過得真快!隨著時間過去,創作這件事好像變得更忙碌了,也很開心跟很多厲害的創作者以及廠商互相合作幫忙,還有最重要的是大家的支持與陪伴🥹。  
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
台文書的出版越來越熱烈;電子書的市場也一直在成長。技術上不論是平台、作者、編輯、排版與設計,以及「字體的開發」上,都需要不斷地學習、精進。願大家做書、讀書、賣書都開心!
Thumbnail
成功加入Anytype之後就可以開始探索這一個開源的筆記軟體了^_^ 開始Anytype之前..... 1.刪除所有初始物件 2.思考自己的使用需求 3.不著急學會所有功能
Thumbnail
這邊統整了過往喜特先生發布過的「資料驗證」系列文! 資料驗證是個「驗證資料是否符合某條件的機制」,我們通常會用它來避免別人輸入無效的值,減少錯誤的發生。你可以按照順序慢慢學習,把資料驗證這功能一次搞懂!
  接著我們繼續來談「整合式大綱」、「編劇式大綱」。 ❈❈❈   ※整合式:   結合「表格式」、「鬆散式」兩者,依劇情片段的份量,或作者是否熟悉該段落,決定是否要寫細節。總之,相當自由!   不過這有點像把大綱當成一種工具書使用,花樣非常多,甚至可以設連結跳轉頁面啊,多半需要一點文書處理的
Thumbnail
這篇文章介紹了幾種漢字轉拼音、拼音轉換工具的使用方法,並提供了簡單的操作步驟。工具包括漢字轉換、漢字拼音處理、臺羅POJ轉換器和讀音選擇工具。閱讀本文將有助於瞭解這些工具的使用方式,並學習如何在文書處理軟體中應用拼音標註。
※ 什麼是資料庫正規化?為什麼需要正規化? 什麼是資料庫正規化? 資料庫正規化是一種設計關聯式資料庫的方法,目的是建立良好結構的關聯表,主要目的有二: 去除重複性:建立沒有重複的關聯表。因為重複資料不只浪費資料庫的儲存空間,而且會產生資料維護上的問題。 去除不一致的相依性:資料相依是指關聯表
Thumbnail
題目敘述 題目會給定我們兩個字串。 第一個是指定順序的字串order。 第二個是輸入字串s。 要求我們依據order給定的順序,重新排列s。 如果出現order中沒有出現的字母,任意位置皆可。 合法答案可能不只一組,輸出其中一種即可。 題目的原文敘述 測試範例 Example
Thumbnail
印刷世界的轉變 - 從傳統裁切標記到數位時代的突破 在印刷世界的迷宮中,我們經常遇到一種神秘的存在——無裁切標記的PDF完稿檔案。這種檔案,就像一座未揭開面紗的古老城堡,讓人既好奇又略帶擔憂。想像一下,當你用Adobe Acrobat Pro打開一個預期中應該擁有明確界限的PDF檔案時,卻發現裁切
Thumbnail
創作邦創作邦精選工具資源-第 32 期,我們每週分享創作邦精選的工具資源合集,從設計資源、AI 工具、生產力工具、影像後製等等內容都涵蓋,如果你想找好用資源或工具,追蹤我們的內容準沒錯。