現在常用字字型始於西元2世紀,漢朝王次仲創立楷書時趨於,其中大部分寫法、造字方式和字意在這後歷史中很少發生改變,是漢朝中華民國中國通行字型,是現今台灣、香港、澳門標準字[4][5][6]。
漢字簡化運動後,「字」一詞於簡化漢字對應。
1932年中華民國教育部公佈《國音常用字彙》(見現代標準漢語),確定了現代中國國語標準音系,收錄了部分「破體」、「小字」宋元以來「通俗字」。
中國正式國家體制推行字是民國二十四年(1935年)六月發佈《字推行法令案》(編號001090002A008),1935年8月21日,教育部以部令11400號正式公佈《第一批字表》,公佈推行字324個。
1936年1月15日國民黨中央召開第五次政治會議,會上國民黨中央委員和考試院長戴季陶提交字緩行提案,《第一批字表》於是執行。
[11][12]
1956年中華人民共和國政府頒布《漢字簡化方案》,希望簡化漢字方式達成掃除文盲目標,是掃盲運動伊始。
1964年《簡化字總表》共收2274個簡化字及14個簡化偏旁[註 2],簡化字形很多來草書楷化[註 3]或文獻中筆畫俗字[註 4]、異體字、古字、假借字[註 5],有當代人創造[註 6]。
該方案簡化前漢字叫作「字」,並簡化後漢字叫作「簡化字」[註 7]。
另外,省略部首並「規範漢字」(通行文字體)中沿用下來漢字稱為「傳承字」。
此前,毛澤東學蔣竹如一封函件中曾提到:「拼音文字是一種文字形式。
漢字,目前只作簡化改革,來總有一天要作改革[13]。
」隨後,中華人民共和國國務院成立「漢字簡化方案審訂委員會」,並董必武、郭沫若人主持上述文字改革工作。
文字現代化基礎工具標準化[14][15],而於各地政府漢字標準之間存在各種差異,以致「正體字」與「字」常有著意涵。
傳統權威字書,如《康熙》《説文》,編撰者是文字訓詁學者,並基於文字學原編定字樣作為字頭。
、起匠體字印刷這種字樣,傳承現代金屬字模、植字排版以至電腦字型,稱作字形、傳承字形或傳統字形。
星馬地區字寫法中國書寫方式雷同,右到左。
有上到下。
沒有左到右。
台灣沿用傳統漢字,同時稱字,其起始標準中華民國教育部頒布《常用國字標準字體表》(俗稱「甲表」)收錄4808個常用字、《次常用國字標準字體表》(俗稱「乙表」)所錄6334個常用字(外加9個單位詞,合計6343字)、《罕用字體表》(俗稱「丙表」)所錄18388個罕用字、以及《原異體字表》(俗稱「丁表」)收錄18588個異體字(補遺22字),並以此四表收錄字現行中華民國國家標準中文標準交換碼納編(CNS11643)編碼。
2004年,中華民國政府公佈《異體字表》,計收70833字;而此第五表連同前四表組為當前中華民國正體字標準,總計收錄105051字[16][17][18][19]。
老師教導學童書寫時,多以《常用字字形表》作主要參考,但不是唯一標準[52];印刷時使用傳承字形(舊字形)和儷式蒙納式字形。
字體選用,官方聲稱乃現有字形加以挑選,並非另創新形,字體研訂或古,或,符合六書原理原則,字體選取具教育意義,所以通行字體具原有字構者,優先考慮[20][21],部分標準字體採用原則而例外,例如「裏」俗作「裡」,「眾」認為是俗寫而「眾」才是寫[22]。
香港及澳門字,香港小學和初中課本《常用字字形表》標準,其他情況使用沒有硬性限制。
書刊出版印刷、宣傳單張、電視字幕、路牌招牌而言,傳承字形和儷式蒙納式字形活躍出現。
港澳和台灣差異整體來説並不算多,像「攜」字。
但有些字,如港澳「衞」和「着」[23],台灣雖然用過「着」[24],但現在教育部只用「衞」和「著」。
情況下,中國大陸簡化字和傳承字規範漢字。
目前,中國大陸出版社中文印刷品大多使用宋體新字形,《簡化字總表》和《通用規範漢字表》附件《規範字字、異體字照表》[25]收錄字宋體新字形,於傳統(宋體),港、澳、台使用字有些差異(例如香港、台灣「呂」,中國大陸「呂」)。
另外,各地異體字認定並不相同,例如中國大陸,認為「強」是字,「強」是異體字,但港、澳、台恰好相反。
中國大陸,字和異體字、二簡字、錯別字、生造字規範漢字[26];《中華人民共和國國家通用語言文字法》第二、三條規定,「國家通用語言文字」為普通話和規範漢字,國家推廣普通話,推行規範漢字;第九、十、十一、十三條規定,公務、教學、出版物、公共服務行業中使用規範漢字;第十七條規定下列情形可以保留或使用字、異體字:
回應錄入古籍和現代書刊版出版印刷規範化需要,2021年10月11日,國家市場監督管理總局、國家標準化管理委員會發布國家標準《古籍印刷通用字規範字形表》(GB/Z 40637-2021)[30]。
該標準於2022年5月1日開始實施。
[31]
註:實際上,兩岸三地中文出版物並不拘泥於本地標準,有時使用其他字形和異體字是。
於台灣是使用正體中文地區中發展中文電腦者,且近年經濟發達,電腦中「國際中文」長期以來,其指(正體)中文,意即絕大部分軟體國際中文版使用是台灣用語和翻譯,此等軟體通行於港,澳地區或其他使用(正體)中文社羣。
於台灣和香港一些用語上,開放原始碼軟體,例如GNOME和KDE中文版分拆為「中文(台灣)」和「中文(香港)」兩個版本,使用於台灣或港、澳地區流行翻譯詞。
現今,軟體中,中文分拆,例如蘋果公司iOS中文版拆分為「中文(台灣)」、「中文(香港)」、「中文(澳門)」和「中文」。
(正體)中文自1980年代以來使用Big5中文編碼,中華民國經濟部標準檢驗局公佈一套名「中文標準交換碼」CNS 11643官方編碼,並普遍於台灣户政、役政資訊系統中,而國立台灣大學圖書館使用CCCII 編碼。
中華人民共和國於1993年GB 2312編碼擴展得到GBK編碼,以及於2000年提出、2005年修訂GB 18030編碼中,採用字形和字形共存方式,佔編碼位置。
近年來,Unicode跨語言編碼集出現,得到了使用。
香港所使用即為採用UnicodeUTF-8編碼,同時港、澳地區使用一些粵語字,其政府UTF-8發行香港增補字符集。
回顧漢字發展史,目前認可漢字源流是甲骨文,於當時創造文字多,同一個字表達多種意思[34],所謂「通叚字」。
接著經歷了金文與甲骨文竝存時代,後來金文取代了甲骨文,成為了文字,然而甲骨文與金文字形多變,同一箇字往往有多種寫法[34],類似於今日異體字。
到了春秋戰國時期,每一個國家有自己一套文字系統,然而各國文字字形上存在著關聯性。
到了秦國統一六國後,官方卽著手於統一文字,「異體字」開始大量減少,字形接近於圖畫過渡到了筆畫拉直方正小篆,筆畫減少[35]。
及至漢朝,文字進一步趨於方正字形,發展成了隸書,筆畫減少。
後來,隨著社會風氣嬗變,文學藝術發展,發展出了草書及楷書,文字形態開始趨於,其中出現了「異體字」,而武則天臨時期,創製了「天文字」,於是一批「異體字」流入漢字體系當中[36]。
接著朝代當中,雖然使用趨於字形,然而歷朝歷代用字標準不相同,且因為事物顯現,有字創造出來用於表示概念,漢字分化中增加文字數量,於是有了「本義」與「引申義」、「本字」與「後起字」概念了,如古籍中「於」與「於」[37]、「後」與「後」、「慧」與「惠」是通用,於歷代官方規範而選用字作為「正字」,而其它字形排它地視「異體字」;而引申義方面,「灋」、「從」(或作「𢓅」)[38]、「為」字有造字時本義「刑法」[39]、「二人相隨」[40]、「左邊有一隻手牽著右鼻大象」[41]以外,引申出了「方灋」、「參與」、「做」意思。
字形上,造形,有「法」、「從」、「為」寫法,不過表達義項上有分工之用。
時空流轉,許多字本義不可考,直到近代發現甲骨文後,部分字本義破譯。
因為近代西學東,中國文化影響力式微情況下,一些知識分子提出廢除漢字或簡化漢字,這樣呼聲1949年以前已有,且清末中華民國成立這段時間,用字標準發生了變化。
待中華人民共和國成立後開始著手於漢字簡化,其簡化是「六書」造字原則,其中有字是於近代用字而言古代「異體字」,如「韻」與「韻」、「沖」與「衝」、「廠」(另有字形「厰」)與「廠」[42]、「聖」與「聖」[43]、「畱」(另有後起字形「留」)與「畄」(二簡字)[44],這些字形收錄於《康熙字典》。
另外許多部首草書演變而來,如「訁」、「車」、「釒」,另外有整個字草書變來字,如「應」、「與」、「發」。
另外,有甲骨文演變而來字形,如「鳥」,而再有字採用了其本字而非後起字達到簡化目的,如「採」本已有「手採摘樹上之果」意[45],因為「採」與「為」字部首「爪」,是象形字,已有「手採摘」含義,甲骨文及金文中見手部,後世文字分化後,造出了有手部「採」,分工表達義項。
其他類例子有「雲」、「氣」,這些字後世加上部件「雨」與「米」後分化出了其它字形意義。
雖然目前字是一些説規則去進行簡化,然而可否認是,台灣、香港及澳門用字標準保留了大部分傳統字形,且符合造字原理(不過認識字並不能解讀古文字,因為古今文字變化,有一些字脱離了原有造字原理)。
文字歷史發展過程中,繁化簡化並存,但每個國家官方選字,或者該地區民眾定成習慣別地方,造成了字形。
這正如中華文化多樣化,若找一種標準是十分困難。
中國大陸簡化字和簡化傳承字「規範漢字」[46],中華人民共和國官方文件中「字」是簡化字反義詞,「正體字」是異體字反義詞,體字標準是《簡化字總表》,如「護」是簡化字,「護」是「字」,而體字標準是《第一批異體字整理表》[47][48][49],如「堤」是字,「隄」是異體字[50]。
《通用規範漢字表》於2013年6月5日正式頒佈,該字表整合了《第一批異體字整理表》(1955年)、《簡化字總表》(1964年初發表,後修訂於1986年)、《印刷通用漢字字形表》(1965年)、《現代漢語常用字表》(1988年)以及《現代漢語通用字表》(1988年),成為社會應用領域漢字規範,原有相關字表從即日停止使用。
香港和澳門稱傳統漢字「字」,但有人認為「字」「繁」含「」貶義,所以發起「字」改稱「正體字」運動,稱為「字申遺」(申遺:申請世界遺產)[51]。
現時香港,稱作「字」、「正體字」人有,而且並會像台灣字形化國字標準字體奉為「標準」或「正體」。
第三是字庫容量問題,比如《康熙字典》中有些文字不能電腦上顯示。
這些是香港人眼中「字」或「正體字」。
台灣官方文字中華民國教育部所制定國字標準字體標準,稱為「國字」、「正體字」或「標準字」[53],並整理歷史文獻上各種簡筆字、異體字、俗體字,歸納統合異體字[16],用字和香港、澳門大致相同,但有例外(如「裡」和「裏」字、「線」和「綫」字)。
俗字在台灣出現,例如「台」寫作「台」、「台灣」寫作「台灣」或「台灣」(後者接受,兩種於正式文件)、「鏽」寫作「銹」[54],有些變體字方面,如「體」與「辭」,中華民國教育部雖承認但視為異體字[55]。
是台北市政府馬英九任職市長期間推行正體字運動,內外文宣作「台北市」而非「台北市」。
[56]
本文要指出兩點:第一,中國大陸出產字形,若有和台灣標準不一致,其實絕大多數只是在異體字上選擇有所不同。
第二,台灣官方所定標準字形見得如許多人想「正統」。
GB 18030漢字具有歷史,許多字發展出多個字形但用法異體,而且有些字擁有數個異體通行。
某些人認為「」例,「」字過是「」字異體,另外「麪」字形見,台灣教育部文件指出「麪」字才是本來寫法,只是避免人們「丏」(ㄇㄧㄢˇ)誤作「丐」,規定採用「麵」字形。
而「」或「」不但並非,還是台灣庶民文化一部分:台灣教育部和中國大陸字體做,只是各種通行異體中選擇一個,以便字形統一,但這代表其他異體是錯或「假」。
各地字形標準不一致,只是反映他們於異體取捨有所不同而己,這點而論,並沒有哪一方或能代表「字文化」。
情形發生「冊」與「冊」、「啟」與「啓」、「產」與「産」、「裡」和「裏」、「峯」和「峯」字形上,只是於 Unicode 區分了這些異體而混淆,因此即使使用台灣以外字體,文章中看不到這些於台灣標準字形。
而且,這幾組字中,有些字體中字形反而歷史上見或小篆字形(例如「裏」、「峯」),沒有什麼文化入侵問題。
以下中國陸製繁體(Droid Sans Fallback 字體)和台灣標準字形(體)並列,同時歷史上寫法,看出這些所謂「」和台灣標準字形是漢字歷史一部分:另一方面,如果「道統」角度來看待,台灣標準字形有許多其實稱「正統」。
我們是誰寫錯字(二)裡提過,台灣教育部規定「寺」字是違背楷書歷史。
以下是各書家「寺」或「時」字,「寸」之上部分全都作「土」。
然而教育部意見,這個部分並非源自「土」字,所以要改成「士」。
這個説法有問題,第一,「寺」上半部不是「士」,而是「ㄓ」(「」字)。
若説寫成「土」是錯,那麼「士」一樣是錯。
第二,教育部説許多其他非源自「土」字形變成「士」(例如「吉」字),所以「寺」上方要寫成「士」,然而「去」上方和「封」左上作「土」,《説文》這些部件並非源自「土」字,何以教育部字形作「土」形?第三,「寺」字隸書、楷書,字形定型,當代各國漢字標準採取「土」形,台灣。
教育部自己《異體字典》列出古今各種異體,不見任何上方為「士」寫法。
如果談「字文化」,那麼台灣教育部字形有失?我看到很多人建議先學,然後認識字。
我想其中一個原因是字人多。
不管如何,學其中一種後多了,文章中猜到意思。
如果你覺得字記憶先學啊! 雖然學習資源,但是我可以幫你。
My first ideas is you can write short articles on Lang-8, then I can correct them and record them. I’ve always want to find a person can exchange the recording service.可以字啊,我想字和字存在官方上區,我認為這兩種字體民間是通用。
因為字人認識字,字人認識字,只是自己習慣其中一種字體而已。
如果你掌握了字,會認識字了,因為你掌握了這門語言規則,反之亦然。
字體只是它穿著衣服罷了。
假如你認識一個人,熟悉他,瞭解他,那會因為他穿了另外一件衣服而認識他嗎?我不是中國人。
我是美國人 (我不是 ABC, 我祖先是英國)。
我以前香港住過兩年。
我會説廣東話, 不是, 我會寫中文字。
我識説有些普通話, 但是, 我寫中文字文法。
我來希望認識多些。
現在我學緊 西班牙文。
我學完西班牙文後 ,會開始學習中文字。
我接見好多未識字中國人。
我有些北京大學畢業朋友。
他們識字, 但是, 我知道關於其他普通中國人。
我覺得,如果你是外中國中國人, 字字 學習。
延伸閱讀…
Edward…Replying in English is faster for me :), and I want to respond to your offer to help, with the limited time I have.Thanks for your offer to help. While I’m not actively studying Chinese…I plan to start back in the very near future. In the past I have not written in Chinese very actively, and in fact my knowledge of Characters is very limited. I think I now have a basic understanding, even if my Chinese looks something a 6 year old might write!Wolf…thanks for your reply as well. I just wasn’t sure if Traditional Characters were okay, since Mandarin is the only supported Chinese Language, and many Mandarin Language sites strictly use 字. The last part of my message posted above, mainly relates to your point about the interchangeability of the different writing systems.Did I understand correctly, that you believe most people read 字 can also read 字?Most of the people that I have met that know 字, can also read 字, to some degree or another. I have found, however that many of the folks I have met from Mainland China, are unable to read 字, The conversion back to 字 is just harder for some reason.I think most people from Mainland China read traditional characters. It wasn’t until the 1950s that we began to use simplified ones, so older people must read the traditional version as long as they are literate. For those in middle age, they must have been exposured to traditional characters a lot. There are many activities such as calligraphy involve tranditional characters.Many young people don’t read them that well, but with the relationship between the mainland and Taiwan getting better and better, the connection getting closer and closer,(some would protest) there will be enough opportunities for us to get used to each other’s version.I can’t read that many traditional characters in isolation, but in combinations like 北京大學, 中國, 美國, 他們 et.c. the meaning is quite clear. In my bookshelf there is at least one reader with traditional characters (it’s from the early 1950s) and with a bit of guesswork I can get through the sentences.Years ago, I was stuck with readers and a Character dictionary. It was very frustrating to be able to look up a single Chinese Character, but not be able to understand it’s meaning in context.政治上觀點,是打壓字。
不然它幹嘛改成呢?雖然我是寫字,但我字未來充滿了看法。
學字會市場,會變成區域性語言。
這世界是有十多億人用是。
如果我是老外,我幹嘛學兩種字體?這不是自找麻煩嗎?aboto1,我覺得你是過度政治化了。
如果照你這麼説,那香港澳門字算甚麼?
我看來,推廣字主要原因是舊時中國文盲多,因為漢字(字)繁複,老百姓學習,所以推廣字,這是官方説法。
(這講得)
可能是島國心態吧,我知道在台灣人眼中,中共很多作為是打壓他們,我個人政治並,所以此以然。
,如果要陰謀論話,沒有東西不是,但是而論,有這麼做嗎?
另外,我認為這算甚麼學兩種字體,我是香港人,本身會字,來我説,字不用怎麼學,多看幾本大陸出版書,猜個兩三回會了。
吧,不是全會,不過會寫會看就是了。
To Shon_t,
Yet, most of the people who know traditional characters can understand simplified one. The reason is simple–simplified one is come from traditional one.
But in contrast, people who know simplified characters may not be able to read traditional one – especially farmer, worker and villager etc. At least, my relatives who live in China cannot read traditional characters.
So, I think it is not exactly interchangeable.
Personally, I would recommend you to study traditional characters, because if you familiar with traditional characters, it is not difficult to learn simplified one. Also, it is easier to get a feeling in Chinese Culture from using traditional characters – the more complete one. But I wouldn’t suggest you to learn Cantonese style Writing, because it is totally local style. You can’t apply it so often. And as you mentioned above, the meaning of the characters is often lost, that is exactly true. That’s also why I recommend you to study traditional characters. You may easier to guess the meaning in traditional one after you know it.
Hence, if you feel good in using traditional characters, use it.I think this is a matter of personal choice. I am glad that I can read traditional characters. As LKH says, if you know the traditional the simplified are easy. The reverse is not necessarily so, but with will and and a little effort it an be done. I do not think it is a big deal, as LKH says.有人問我為何使用字,無非是「是不是港澳台」「會會寫『台灣烏龜』」「寫字肯定是為了裝毴」之類的説辭。
此我想聲明:有不習慣看朋友,私下交流我切換成完全可以,但我保留回答中使用。
説:本文《簡化字總表》、《第一批異體字整理表》和《印刷通用漢字字形表》基礎標準,簡化整理過程中確定、正體或字形漢字,稱為新式漢字;新式漢字,即簡化整理過程中確定、異體或字形,但現今港澳台地通行或讀書時需要使用漢字,稱為老式漢字。
制定《規範漢字表》,應以大陸現行新式漢字,這本該是毫無疑問。
但是,面某些企圖推倒新式漢字,主張恢復到20世紀50年代以前狀態各種觀點,説上幾句。
⑴新式漢字通行了半個世紀,深深紮根於廣民眾之中,成為了12億民眾日常生活習慣一部分,要讓他們放棄這種習慣,肯定會不得民心。
⑵新式漢字完全能夠勝任書寫現代漢語白話文職責,並像某些人認為那樣,妨礙了文學思想發展和發揮。
⑶半個世紀以來,新式漢字書寫、印刷各種文化成果,成為眾多圖書館主流館藏,廢除,其代價無法估量。
⑷如果整理,能夠老式漢字一一應話,新式漢字既會成為繼承古代文化遺產障礙,會成為兩岸文化交流障礙,會成為漢字信息化處理障礙。
字形整理是一項系統工程,需要考慮問題很多,漢字“一一應”問題,其中之一。
以往於沒有“一一應”作為字形整理目標之一,造成了數量“簡字”和“稱異體字”(“成因”之一),從而當前漢字信息處理和漢字使用帶來了許多不便。
徹底消除異體字和繁簡字,建立一個既沒有異體無所謂繁簡漢字字形規範,是我們目標,然而當前我們面許多人使用老式漢字情況下,清除那些嚴重影響對應轉換簡字和稱異體字,進而打通新式漢字老式漢字應關係,才是要緊事情。
⑴一一應,是我們面“一國兩制”社會現實需要。
有香港人士認為,簡化字不便學習主要原因,字不能一一應。
如果能夠一一應,熟悉了字港澳台同胞,學會字。
因此,只有一一應,才能照顧到港澳台同胞用字習慣,才能地進行兩種文本轉換;只有能夠地轉換,於溝通、學習;只有於溝通、學習,才能加快認同感產生,才能加速港澳台同胞接受新式漢字步伐。
只有讓他們具備了高度認同感,“內服”地而不是地接受了新式漢字,才能實現意義上“書同文”。
秦始皇“書同文”而不惜“焚書坑儒”做法,當今社會中是行不通。
看,只有在充分瞭解、學習過程中,才能培養出感情,才能達到認同境界。
等到新式漢字港澳台同胞高度認同時,實現意義上書同文,話下了。
拿《漢語拼音方案》來説,儘管台灣局阻撓,但是台灣同胞接受了,關鍵於《漢語拼音方案》有國際認同度。
試想,只要新式漢字國際認同度大大提高,大大超過了老式漢字,《漢語拼音方案》今天,新式漢字明天。
⑵閲讀書,繼承文化遺產,迫使我們面老式漢字。
傳統文化典籍是老式漢字印刷,要繼承文化遺產,面古書,要學習老式漢字。
這雖然不是普通人民大眾事,但有一大批人要事這項工作。
有人可能會認為,我們可以古代文獻典籍翻譯成現代文,大家不用學習老式漢字了。
然而,要實現這一“藍圖”並那麼輕而易舉。
報道,國家古籍整理出版規劃部門一位工作人員,記者介紹古籍電子出版物時説:目前古籍數字化整理方面,國家沒有政策出台,因為有些技術障礙。
,字沒有國家統一標準,哪些該保留,哪些不能確定。
其次,如何轉換成成一個研究課題,目前高校古委會北京大學合作做這方面研究,如何使這種轉化符合國家語言文字工作委員會要求探討之中。
第三是字庫容量問題,比如《康熙字典》中有些文字不能電腦上顯示。
延伸閱讀…
古籍電子出版物原本投入,出版社要付稿費,要佔市場,而他們得面臨繁簡轉化和造字難題,畏情緒是顯而易見。
即便能夠實現,翻譯成現代文後,會丟失許多歷史文化信息,譬如語言文化信息。
譬如我們要查證一個漢字是何時開始出現和使用,於受到簡字、稱異體字煩擾,無法如願以償。
例如文獻中明明意思“穀”與“谷”、“後”與“後”、“鬥”與“鬥”字,新式漢字文本中都變成了“谷”、“後”、“鬥”字,因此,要想查找“穀”、“後”、“鬥”字來歷,沒有可能。
説有一位國內出過好些書,發表過好些文章專家寫了一篇題為“男尊女卑漢語和德語中比”稿子,立論是:漢字中,從“女”、從“母”字多含貶義。
這無可厚非,但他舉了“毒”字例,並説:“從‘母’,貶義”。
實際上老式漢字“毒”字下邊並不是個“母”,而是個“毋”。
漢字簡化後,這兩個部首合一,寫作“母”,因此造成了這樣奇怪“研究結果”。
這説,通過現代文本來瞭解古代文化,若作粗略瞭解是可以,若要仔細研究話,還是古代、真跡靠得住。
要想做一個古代文化通,不學會老式漢字,是不大可能。
而要想使現代人能夠學會老式漢字,漢字一一應、轉換,是最佳選擇。
總之,“一一應”,是我們、優質地學習和研究古代文化遺產要求。
只有一一應,現代人才會錯綜複雜應關係羈絆,才能順利跨過老式漢字門檻,才能地轉寫各種古文化遺產。
⑶“一一應”,是漢字信息化處理要求。
漢字信息化處理過程中使用電腦字庫,要求兩種漢字體系能夠一一應、轉換。
於不能一一應、轉換,給字庫編制帶來了説盡煩惱。
有人説,繁簡轉換問題存在於人際之間,存在於電腦方面,這是“井底見”。
第二個字符集(GBK)是一個向下與 GB 2312 編碼兼容,支持 ISO 10646.1 國際標準承上啓下標。
ISO 10646 是國際標準化組織 ISO 公佈一個編碼標,即 Universal Multiple-Octet Coded Character Set(簡稱 UCS),大陸譯為《通用多八位編碼字符集》,台灣譯為《廣用多八位元編碼字元集》,它 Unicode 組織 Unicode 編碼完全兼容。
ISO 10646.1 是該標準第一部分《體系結構基本多文種平面》。
我國 1993 年以 GB 13000.1 國家標準形式予以認可(即 GB 13000.1 等同於 ISO 10646.1)。
ISO 10646 是一個包括世界上各種語言書面形式以及附加符號編碼體系。
其中漢字部分稱為“CJK 統一漢字”(C 指中國,J 指日本,K 指朝鮮)。
而其中中國部分,包括了源自中國大陸 GB 12345、《現代漢語通用字表》法定標準漢字和符號,以及源自台灣 CNS 11643 標準中第 1、2 字面(基本等同於 這個字符集推出基本能應付通用漢字信息化處理問題,瞭解範圍內漢字信息化處理問題,ISO/IEC 10646中日韓統一編碼漢字Unified Ideographs Extension B(四萬餘字)定稿,並IRG上交ISO(國際標準化組織)WG2、SC2,2001年8月1日呈報ISO秘書處,納入ISO/IEC 10646-2:2001發佈出版。
此前,ISO/IEC 10646-1:2000於2000年10月5日出版公佈。
這樣,ISO/IEC 10646所收入漢字(包括各種字體變形)超過七萬個,有人認為,甲骨文、篆文外,地滿足世界各地漢字使用需要。
但這是指研究方面,社會應用而言,目前大陸BIG-5 編碼主,並沒有接受GBK 規範跡象。
總之,只有妥善解決了一一對應問題,兩岸漢字字庫才能實現沒有障礙轉換,才能讓軟件專家們繁簡轉換中解脱出來,從而可以騰出多時間去做他們應該做事情。
如果實現了一一應,可以消除那些“你有我無、我有你無”應字,從而使整個字庫總量瘦身減肥,漢字信息處理和信息交流變得。
打通新式漢字老式漢字應關係,需要解決問題主要有兩項:⑴簡字問題;⑵稱異體字問題。
有許多大陸人,使用字鬧出許多笑話,如“寫字板”繁化成“寫字闆”,“皇后”繁化成“皇後”,病根繁簡字不能一一應上。
正如董琨先生所言:有人明白有字繁簡轉換並應關係,於是代替。
如內地一個京劇團到台灣演出,武松寫成武“鬆”,武松“松”成了肉鬆“鬆”。
知道這本來兩個字,而不是一。
要顯得有文化,結果弄巧成拙,貽笑大方。
此,本人做過調查和研究,編制了《簡字照表》(見《語文建設通訊》(香港)第53期),提出了一個《簡字調整》方案(見《語文建設通訊》(香港)第65期)。
現擇要概述如下:我們調查統計,7000通用字範疇內,共有簡字117組。
大體上可以分為:⑴一個對應幾個;⑵一個對應一個,但意義和用法盡;⑶一個作部分或分頭簡化。
漢字見下表:其中,以下13組不能正確地“繁轉”,其餘104組不能正確地“簡轉繁”:117組繁簡字中,同音代替類佔了絕大多數。
譬如,“只有”“”和“一隻”“隻”;“頭髮”“髮”與“發展”“發”;“後來”“後”與“皇后”“後”;“干戈”“幹”與“幹”“幹”。
上古時,字數少,沒有字典,寫作時找不到確當字,讀音字來代替,這令人頭痛“同音假借”。
字發音是變化,字發音歷着變化。
幾百年前讀音字,幾百年後可能相差,而使人看出它是哪個字代用品。
我們今天讀上古文學作品,文字是其中障礙:很多字,文章、段落中意思,因為他們是其他字代用品。
後來字數多了,有了字典,字讀音和意思地下來,借代少了。
即便是多音字,他們讀音和字意是。
儘管如此,一字多音,漢字中弄部分,於文字人有意避免它。
後代人同音字來借代,正字法上錯誤了,章太炎它叫做“借聲”,我們今天則叫做“別字”。
漢字簡化時,很多意思毫不相干而僅讀音類幾個字,一個筆畫字來頂,實際上是在人為地製造“別字”,因此,權衡各種利弊情況下,恢復某些字本來面貌,是有。
①廢除不能對應轉換繁簡關係,保留能夠對應轉換繁簡關係;②廢除繁簡關係後,並存,恢復規字;③字恢復規字後,能類推簡化繼續進行簡化;④廢除繁簡關係後,能找到應,組建繁簡關係;⑤廢除繁簡關係後,不能並存,找不到應,作為異體字取消。
③解除繁簡關係後,需要恢復規字繁體字有:“澱、鬥、發、複、幹、穀、後、彙、穫、幾、繫、傢、薑、據、捲、剋、瞭、懞、濛、矇、麼、寜、僕、乾、埆、捨、瀋、勝、適、術、鬆、塗、係、葉、臓、摺、徵、築”38字。
④解除繁簡關係後,可以繼續偏旁類推簡化字有:“襬、闆、錶、、讎、齣、噹、範、颳、櫃、價、儘、滷、瀰、麵、蘋、籤、縴、麯、囌、颱、枱、糰、鹹、鬚、鏇、餘、緻、鐘”29字。
和關係上看,異體字有三大類:⑴字;⑵包孕異體字;⑶交叉包孕異體字。
三種異體字宜採取方法進行整理:⑴字各變體之間是“音同義同”關係,不管使用哪個,表示同樣意義,有讀法,因此,即使老漢字體系中選擇了字形,不會影響間對應轉換。
但統一規範角度説,是採用同一取捨,因為那樣無所謂“一一應”問題了。
⑵交叉包孕異體字雖然是你中有我,我中有你,但各有側重點,因此只要兩岸採用分化法,兩字收,會有所謂“一一應”問題。
,如果兩種漢字體系中,只要有一方交叉包孕異體字採用分化法整理,會成為對應轉換障礙之一,需要加以關注。
例如:二者只在讀bǎng時同義,其他讀音上大相徑庭,因此宜採用分化法,讓二者並存並。
但如果像《一異表》那樣取消“髈”使用資格,而港澳台二者保留話,造成對應轉換困難。

