二子從周提示您:看後求收藏(第七百四十三章 我也用得,重生之乘風而起,二子從周,試讀吧),接著再看更方便。

請關閉瀏覽器的閱讀/暢讀/小說模式並且關閉廣告遮蔽過濾功能,避免出現內容無法顯示或者段落錯亂。

但是上一世的漢字編碼也有問題,那就是unicode編碼問世得太晚,導致了微軟不得不採用一套基於gb13000的拓展編碼,又因為這個原因,導致國家標準又不得不在gb13000編碼基礎上打了個打補丁,拓展出gbk,然後又拓展出gb18030。

最終得到的gb18030-2005,全稱為國家標準gb18030-2005《資訊科技中文編碼字符集》,與gb2312-1980完全相容,與gbk基本相容,支援gb13000及unicode的全部統一漢字,共收錄漢字70244個。

而在那個時候,unicode的漢字收錄得還沒有gb18030-2005多,雖然理論上隨便裝得下所有漢字,但是無數的碼位都是空的。

最後的現狀,就搞成了一箇舊系統補丁累補丁,而一個新系統空著大量碼位沒人去做填充工作,造成了數十年後資訊系統當中,依然存在漢字轉碼不全相容的大問題。

後世作為國企程式設計師的周至可謂深受其害,因此他認為解決這個問題的關鍵,就是國家從一開始就應該放棄侷促的iso/iec1064,先去把unicode標準中的漢字空間搶得夠夠的,起碼先搶十萬個碼位填充上,並且將之作為唯一強制標準,全球就用這一套。

於是說道:“八字沒一撇不是正好嗎?八字沒一撇,我們才能夠深度參與啊。只要能佔有三段碼位空間留給我們,就能容納十萬漢字。”

“而且unicode只有編碼的概念,其設計的目的本身就是裝下全世界的各種文字。”

“漢字編碼,無疑是全世界文字編碼工作當中最繁複的,我們將這個工作做下來,在組織裡也能擁有充分的話語權,將來還能指導其他國家和組織工作,對我們編寫其餘民族文字,也有奠基作用。”

現在周至和李紅江討論的內容,又輪到辜老這邊的文史專家們聽不懂了。

辜老打斷了兩人的熱烈討論:“肘子,小李,你們誰先用我們老頭們聽得懂的話解釋一番?”

麥明川笑道:“大概的意思我明白了,我先來解釋一下看看對不對,不對小李和周至同學再來補充。”

“現在的話有兩套標準,一套是iso/iec1064,這套體系已經成熟,雖然之頒佈了第一部分,但是我們國家已經據此開發出gb13000,可以快速推行。”

“但是這套系統有個大毛病,就是碼位太少,只能容納下兩萬一千零三個漢字,現在看來離完全滿足需要,還有一段相當大的距離。”

“另外還有一套標準,就是unicode。”

“這套標準只要分配給漢字的編碼區間足夠,就能夠容納下我們所有的漢字,而且今後還可以繼續拿下更多的編碼區間,進行進一步的拓展,或者用於給其餘少數民族文字編碼所用。”

“從設計原理來看,unicode標準其實是優於iso/iec1064的,然而這個標準現在還只是一個半吊子,第一版都還沒有推出來,如果我們要使用unicode標準的話,先得將標準完善,之後才談得到區間分配和下一步的工作。”

“小李的意思,是咱們先將gb13000用起來,之前已經有了搞gb2312的基礎,搞這個路子熟,見效快。”

“而肘子的意思,是我們一開始就搞unicode,一步到位,既然unicode標準還沒拍板,那我們就積極參與進去,連標準一起搞!”

“要是真的能夠做到肘子所說的這樣當然是最好的結果。可是,我們有那個實力嗎?”辜老對國家資訊產業起步勐追的印象還是有的,擔心的是憑藉國家現在的技術力量,完不成這項工作。

“其實這項工作他們基本已經完成了的。”李紅江說道:“大多數計算機採用米國標準資訊交換碼也就是ascii碼,它是表示所有大小寫字母、數字、標點符號和控制字元的7位編碼方案。統一碼已經給ascii碼完成了編制,將\u0000到\u007f對應全部128個acsii字元。”

“也就是說,計算機系統其實已經可以使用unicode編碼了,只是還沒有形成大的標準而已?”

“需要完善的地方還有很多。”李紅江說道:“當然既然acsii問題都解決了,至少架構是已經成熟了,其餘都是小問題。”

“如果,我是說如果,我們能夠擁有一個十萬級的碼位空間內容供他們填充的話,我相信聯盟是會非常感興趣的。”

後世有一句話,叫做“一流企業做標準,二流企業做品牌,三流企業做產品”,現在的gbk和unicode,其實就是標準之爭。

周至補充道:“這是牽一髮而動全身的大事兒,說白了就是標準之爭。”

“我們中國如今在世界資訊產業裡邊的話語權,可以說是微不足道,但是漢字字型檔,完全可以稱得上是特殊資源。”

“只怕是全世界所有字母語系的國家,將全部符號加起來,都還沒有中國的漢字多。”

“如果我們先完成了這個字型檔,那麼對於unicode來說,就可以作為其其絕對優勢成果像世界展示。”

“就好比gbk還在使用坦克加農炮,而unicode,已經引爆了一顆氫彈。”

“我們完全可以拿著自己的成果,支付會費,成為組織會員。”

李紅江對這個組織做過一些研究,說道:“統一碼聯盟,是位於米國加州的unicode組織,他們其實是允許任何願意支付會費的公司和個人加入的。”

“八十年代末成立了兩個機構,一個是unicode組織的商業機構,一個是和國際合作的國際標準化組織。在計算機普及和資訊國際化的需求下,他們分別各自成立了unicode組織和iso-10646工作小組。“”

“他們不久便發現對方的存在,大家為著相同的目的而工作,於是兩個組織便共同合作開發適用於各國語言的通用碼,而且相當有默契地各自發表unicode和iso-10646字集。雖然實際上兩者的字集編碼相同,但實質上兩者確實為兩個不同的標準。”

“統一碼聯盟在前年年首次釋出了thede的開發結合了國際標準化組織所制定的iso/iec10646,即通用字符集。兩者在編碼的運作原理上其實是相同的。”

“但theuandard包含了更詳盡的實現資訊、涵蓋了更細節的主題,諸如位元編碼、校對以及呈現等。甚至還列舉了諸多的字元特性,包含了那些必須支援兩種閱讀方向的文字,比如普通閱讀的由左至右方向,和阿拉伯文那樣由右至左的方向。”

我的個去!周至的眼神和辜開來,旦增的眼神在空中瞬間交匯,中國古代典籍的閱讀習慣,也是從右到左的!

阿拉伯語用得,我華夏典籍也用得!

本章未完,點選下一頁繼續閱讀。

都市小說相關閱讀More+

養成系男神:聽勸後,我成了頂流

蠢蠢凡愚QD

我在北美撿寶的日子

我是懶姑娘

陸總別裝了,太太又跟人去約會了

夏筱夢

參加戀綜,你把國民女兒拐跑了?

法外狂徒程五

工業摸底:才31馬赫,鷹醬你急啥?

長風吹度

全球高武:重生後,我殺瘋了

歲月兒