維吾爾文識別和維漢翻譯理解問題曾經困擾業界多年,現在終於被我國科學家攻剋。12月1日,由教育部組織在北京清華大學召開的“高性能維吾爾文識別和理解系統”科技成果鑒定會上,鑒定委員會主任、中國工程院院士倪光南宣佈:清華大學丁曉青教授科研團隊首次實現了維吾爾文無切分識別並創建了維漢識別理解一體化系統,總體達到國際領先水平。
  自2011年起,在國家自然科學基金重點項目支持下,清華大學電子工程系在連寫民族文識別問題上深入鑽研。科研團隊摒棄了原有的基於字符切分的維吾爾文識別方法,在基於隱含馬爾可夫模型的無切分維吾爾文識別技術上進行了創新,提出了維漢對照關鍵詞檢索的跨語言理解方式。同時由新疆大學信息科學與工程學院院長吐爾根·依布拉音教授帶領團隊負責研發維漢全文翻譯技術,北京文通科技有限公司負責實現系統架構和網絡服務平臺,最終研製成功“高性能維吾爾文識別與理解系統”。
  據課題組成員、清華大學電子系彭良瑞副教授介紹,維吾爾文是不同於漢字和拉丁文字的拼音文字,其外形和結構的變化很大,單詞內字符連寫,且相似字不易辨別,為維吾爾文識別帶來相當的困難。
  “這一系統首次實現無切分連寫維吾爾文識別,併在統一系統框架中首次實現了維吾爾文識別和翻譯理解無縫連接,解決了維吾爾文的文檔經掃描圖像識別輸入計算機以及以漢語為目標語言的跨文種輸出難題。”彭良瑞說。
  據介紹,該系統可廣泛應用於維吾爾文辦公自動化、電子出版、互聯網信息資源建設。這一科研成果的取得為我國新疆地區的民族文字文檔建立開闢了先進的數字化大道,並且加強了以漢語為目標語言的跨文種交流方式,有利於促進民族文化交流。
  鑒定會上,清華大學電子工程系主任黃翊東教授在會議開始時致辭。國家自然科學基金委信息學部張兆田副主任、信息科學一處熊小芸處長和宋朝暉項目主任也出席了會議。教育部語言文字信息管理司張浩明司長、國家民委教育科技司周曉梅副司長在會後總結髮言,強調了民族文字信息化在國家發展及安全中的戰略地位。  (原標題:高性能維吾爾文識別和理解系統通過專家鑒定)
創作者介紹

pp55ppjzwo 發表在 痞客邦 留言(0) 人氣()