二子從周提示您:看後求收藏(第七百零三章 字型檔,重生之乘風而起,二子從周,試讀吧),接著再看更方便。
請關閉瀏覽器的閱讀/暢讀/小說模式並且關閉廣告遮蔽過濾功能,避免出現內容無法顯示或者段落錯亂。
“我們所有人裡,還真就只有你能幹,”周至說道:“你知道現在已經可以用電腦列印書籍了吧?”
“嗯,知道,局裡現在都有電腦打字員了,聽說那機器很貴,領導都不讓一般人碰。”
“那你知道你們局裡那機器,現在一共能夠列印多少個字嗎?”
“不是所有漢字都能打嗎?”
“當然不是,現在大家使用的,還是由中國國家標準總局八零年釋出,八一年實施的一套國家標準,標準號是GB2312—1980。基本集一共收入漢字六千七百六十三個。”
“那我們國家一共有多少漢字啊?”
“不算簡化後的簡體漢字,《康熙字典》裡邊收錄的漢字,一共是四萬七千零三十五個。”
“差這麼多?”馮雪珊感到十分震驚:“連零頭都不到?”
“是啊。”周至說道:“當然這和現在儲存單元昂貴,簡化字推行方便都有關係,但是將來圖書實現電腦排版,要用電腦整理古籍的話,目前所用的字型檔是絕對不行的。”
“所以……”
“所以我有一個想法,設計一套《康熙字型檔》出來,用於將來的古籍電腦排版工作。”
“不行不行,我不認識那麼多的字……”馮雪珊一聽就覺得頭大。
“不用你認識它們,會照著描寫就行了。”周至笑了:“字型檔設計的一個重要工作,首先就是單字和筆畫、部首設計;”
“之後透過掃描裝置將設計圖稿轉化為數字化影象,儲存於計算機中;再透過數字化擬合,得到字形的向量輪廓。”
“接下來就是擴充套件設計,以拼合的方式設計其他單字。”
“最後再將所有得到的字賦予編碼,將其轉換成特定數學函式描述字形輪廓的檔案格式,再加以指令,控制其字形的顯示效果和排版效果,就形成字型檔了。”
“我越聽越聽不懂了……”
“聽不懂也沒關係,單字和筆畫、部首我會找齊,然後就要拜託你用仿宋體、宋體、楷體和黑體,在我給你提供給你的柵格紙上,將它們描繪出來。”
“鑑於我們現在還沒有相關的電腦裝置和字型設計軟體,因此之後的擴充套件設計工作,我們也只能先透過手工來完成。”
“也就要是將所有的字一一地寫出來。”
“你要做的,就是這些,剩下的校對、檢測,我會來完成。”
“最後我會將所有的字稿帶去蜀都,帶去首都,透過最原始的掃描匹配方式,生成我們需要的字型檔。”
“咱們這麼做的目的,是設計出一個能夠涵蓋所有已知的繁體漢字和簡化漢字的大字型檔出來,從而一勞永逸。”
“而今後的事情就簡單了,我們可以做做減法,搞出一些刪減版來,供人自由選擇,以解決字型檔過於龐大和電腦儲存資源不足的矛盾。”
“雪珊你說,將電腦字型檔從六千多字擴充到四萬七千多字,這是不是關係我們國家國計民生的大事兒?”
“只是寫字那我還行。”馮雪珊知道自己要幹什麼之後,倒是放鬆了下來:“就算五萬個字,我一天寫一百個,用不了兩年也能夠完成。”
“嗯,現在睡覺,等回去我們就開始這項工作。”
“好。”
這項工作是周至答應過辜老的,當時周至曾經跟辜老說過,如果等到他進入大學,國家依舊沒有推出相應的字型檔的話,那這項工作便由他來完成。
當然在沒有設計軟體的情況下,前期的準備工作只能用手工,那註定將是繁瑣的。
僅僅是將近五萬個漢字復刻到十六乘十六的三十二位元資訊量的柵格當中去,在沒有軟體輔助的情況下,會是非常耗時且枯燥的工程。
這項工作還相對簡單,且只是基礎。
有了基準字模之後,才談得到利用軟體和基礎字型設計,透過數字化擬合,自動生成不同的字型。
但是隻要將基礎工作做好,剩下的就可以透過計算機軟體來完成了。
周至在前期已經做了一些工作,主要就是將GB2312—1980的簡化字和康熙字典繁體字結合到一起,構成這個字型檔所需的全部漢字。
至於附加的英文字母和常用字元,已經不屬於他的專業了,將來讓別人補充就好。
兩相結合再去除重複,馮雪珊信口說的五萬字,其實和事實非常接近。
周至之所以想要插手這件事兒,是因為現在的國人對這個事情沒有什麼經驗,因此走入了一個誤區。
漢字是象形文字,和拉丁字母的區別就在於字碼太多。
如今主流的做法,就是簡化,只將常用字列入輸入法中,以應對絕大多數時候的需要。
但是周至認為,這樣的做法並不太好,因為佔用儲存空間的其實是五萬個字的字模,而並非代表它們的編碼。
因此大可以一步到位,將大中華區包括港島、寶島、新馬、島國、朝國等依舊在使用漢字的地方,以及使用大量漢字元號的地方,將所有字型都收集起來,先將大字型檔編好。
具體到再上一層的應用,則可以透過從基準字型檔中提取子集的方式來完成。
一開始的時候大字型檔肯定只有專業的印刷廠,出版社才用得上,今後隨著儲存裝置價格的狂降和裝置容量的指數級擴充,儲存空間不再是卡個人電腦價格的瓶頸後,最終這套字型檔還是能夠走入千家萬戶。
這個設計思路就從傳統西方的設計思路當中跳了出來,也不再僅僅是頭痛醫頭腳痛醫腳,而是一步到位,以免在今後不斷再升級調優換版本。
然而搞笑的是,這件事情即便在周至重生之前,國家都沒有完成。
這就是工科典型的實用主義和文科典型的理想主義之間的思路差異,也是國人在設計字型檔的時候,少了文科學者跨學科參與聯動發揮影響力造成的。
不能不說最終這成了一個遺憾,將華夏所有文字納入一個電腦字型檔,這件事情值不值得做呢?
答案是顯而易見的,只不過急於追趕世界文明數字技術大發展的華夏一族,現在還一切從實際出發,腦子裡想的就倆字——“能用”,還顧不到這上頭來。
如今甚至已經有了一種預言,那就是未來的資訊化世界裡,將沒有漢字的存在;這門美好的語言,最終會在資訊世界裡消失;而華夏民族,也會因為使用如此複雜的象形化文字,在資訊科技的大發展中,再次淪為落後民族。
而周至想要告訴那些人的,是你們全特麼在放屁。
(本章完)
本章未完,點選下一頁繼續閱讀。