方正電子承擔(dān)“當(dāng)代人名地名用字蒐集與整理”工作 明年10月將完成 各領(lǐng)域系統(tǒng)升級可識生僻字
法制晚報訊(記者 馬曉晴)一些人由於名字裏帶有生僻字,買火車票、辦身份證、申領(lǐng)社保卡等均無法正確顯示全名。到銀行取錢都要被反覆核實(shí)身份,耗費(fèi)很多時間。
近日,《法制晚報》記者從北大方正電子有限公司(以下簡稱“方正電子”)獲悉,該公司將承擔(dān)“中華字庫”中第17包“當(dāng)代人名地名用字蒐集與整理”工作,將收集人口資訊中約3000個未編碼的生僻字。該項(xiàng)目預(yù)計(jì)在明年10月完成,可有效解決用生僻字取名無法錄入、顯示的問題。
困擾 名字為亂碼 難領(lǐng)社???/strong>
市民剛女士的名字中,帶有一個“ ”(yan,三聲)字。多年來,她辦理火車票、飛機(jī)票都無法正確顯示全名,“電腦打出來的是問號、方塊,或者乾脆是亂碼?!币?yàn)殡娔X“不識字”,工作兩年的她至今未能申領(lǐng)到社??ǎ荒茏再M(fèi)看病。
由於無法在支付寶上完成實(shí)名認(rèn)證,剛女士用不了滴滴、快滴等打車軟體,就連搶到的紅包都提不了現(xiàn)金。記者在商務(wù)印書館出版的第10版《新華字典》中,查到了這個“ ”字。詞條解釋為人名用字,是五代時期南漢的劉 為自己造的字。
剛女士説,父母為她起名時用這個“ ”字,是取“飛龍?jiān)谔臁钡脑⒁?,“他們真沒想到會給我?guī)磉@麼多麻煩”。
解決 3000生僻字 明年完成編碼
生僻字取名帶來的問題有望得到解決,記者近日從方正電子獲悉,該公司將承擔(dān)“中華字庫”中第17包“當(dāng)代人名地名用字蒐集與整理”和第20包“字庫製作一:中間字庫、宋體楷體等成果字庫”項(xiàng)目,預(yù)計(jì)在2016年10月完成。
方正電子字庫業(yè)務(wù)部副總經(jīng)理黃學(xué)鈞介紹,“中華字庫”工程于2011年啟動,共分為28個包,近30家高校、科研院所和企業(yè)參與了研發(fā)工作。方正電子負(fù)責(zé)的第17包,將收集人口資訊中約3000個未編碼的生僻字,將“中華字庫”中的漢字總量擴(kuò)充到7萬餘個。
第20包將製作完成包含30萬字的宋體、楷體成果字庫以及7萬多字的壓縮字庫,可滿足我國各民族古今各類文獻(xiàn)的出版印刷、數(shù)字化處理和傳輸?shù)男枰?/p>
剛女士名字中的“ ”字,在家用電腦上可以打出,但在社保和銀行的系統(tǒng)中無法顯示。黃學(xué)鈞解釋説,只要是電腦裏能打出的字,都是被編碼過的,“也就是已經(jīng)收入字庫了”。
他分析認(rèn)為,可能一些單位的數(shù)據(jù)庫沒有升級,還是用的老字庫,所以顯示不了“ ”字,“只要升級系統(tǒng)、更新字庫就沒問題了”。他提到,“中華字庫”中的每個字都有對應(yīng)的編碼,“相當(dāng)於門牌號”,如“ ”字的編碼為“4DAE”。
黃學(xué)鈞表示,生僻字的蒐集範(fàn)圍應(yīng)在公安、民政、教育、郵政、測繪、銀行等領(lǐng)域中選取,但必須包含公安和民政部門?!拔覀兺瓿身?xiàng)目後,也會積極向銀行、社保、醫(yī)療、教育等領(lǐng)域推廣,幫助單位、企業(yè)升級字庫系統(tǒng),解決生僻字帶來的煩惱。”
[責(zé)任編輯:楊永青]