你的念頭和想法,就是你的資糧;差別在於自己累積的是善或惡的資糧?!

2013年11月5日 星期二

劉哲安老師所作的史上最強藏文軟體設計



大家好!

我是劉哲安。我很順利的在進行閉關,上師仁波切對我很好,正一步一步的帶領我,也非常照顧我的生活,寺裡認識的朋友更不時送東西給我吃,前年的過年雖然天氣很冷(零下n度),不過人情卻相當地溫暖。

設計緣起
        去年猴年大法會時,大學者  塔波京俄滾秋嘉措將多年匯集整理的「噶舉法藏」獻給了瓊倉法王;共有一百零八卷,相當的壯觀。可惜的是,該經文全部是手抄本,還是用藏文行書寫的(無頭字),既沒有木刻板,也更不用說電腦打印了。於是我就在想:為什麼都二十一世紀了,中國西藏還在用人工處理佛經,怎麼不將這些佛經輸入電腦,一來美觀,二來保存容易,還可以做快速的資料檢索。

設計的困難
        當今藏文的輸入程式,分為兩大類。
        一、歐美國家所設計的,都有一個致命的缺陷,亦即他們的藏文字碼是採用 ASCII編碼 ASCII僅能容納256個字元,而藏文字母組合後所需求的字元,卻至少需要1,000個字元左右。因此設計師們不得不將藏文拆成多個字型檔,讓每個字型檔擁有部分的藏文字母,這樣就解決了ASCII  256字元的限制。然而卻因此造成更嚴重的問題,亦即不同的藏文字母,在電腦上卻擁有相同的字元編碼,如此一來,當我們建立藏文資料庫時,是無法做檢索功能的,因為電腦本身並不能夠直接以藏文做檢索,而是以藏文的字元編碼做檢索。因此,即使我們將佛經全部輸入電腦,也無法直接用藏文檢索藏文佛經。
        二、中國所設計的藏文,雖然是用亞洲DBCS字元碼,脫離ASCII的限制,不使字元編碼重複,但是其系統大多停留在DOS階段。即便西北民族學院採用DBCS字元碼,設計了一套Windows作業系統的藏文輸入程式,然而其程式很狹隘地只能用於簡體GB碼的Windows,並且其藏文字體並不齊全,字體也不美觀

如何解決困境
        一、歐美國家:針對「字元碼重複,導致不能檢索」的問題,積極於電子化藏文佛經的工作人員,例如美國的 ACIP,提出了一個解決方案,他們先將藏文佛經全部用羅馬字母轉寫,做為檢索資料庫,然後再依靠羅馬字母的字元編碼做檢索,最後將檢索結果呼叫出藏文的檔案。雖然因此得到藏文檢索的功能,然而這種檢索是有缺陷的:亦即只能檢索一部佛經是哪一個檔案,卻不能檢索一段佛經、或一個關鍵詞,在哪一部佛經的哪一卷、哪一品、哪一行的哪一個位置。也就是說,這種檢索是很粗糙的
        設計師與電子化佛經的人員辛苦的繞了一大圈,只能得到這樣的結果,實在令人沮喪。因為這是ASCII字元碼根本的結構問題
        二、然而,Microsoft 公司,在 Windows 作業平台,早已發展出 Unicode 制式碼,能容納 65335個字元,不僅兼具亞洲DBCS 字元碼優秀的功能,更脫離了DBCS受制於WINDOWS語言版本的限制;Unicode制式碼可以用於各種語言版本的WINDOWSMicrosoft公司並計畫未來將全球語文都統一納入該制式碼內。因此,徹底解決藏文電腦化的問題,就是「採用Unicode制式碼」

我如何設計程式
        因為上述種種理由,促使我設計以 Unicode制式碼為基礎的藏文輸入程式。
        一、首先我先將市面上既有的藏文字型,在Unicode制式碼裡面予以整合並歸類,因其性質與類屬,制訂了每一個藏文字母在Unicode制式碼中固定的編號,繼而更進一步於其中補充一些少見的組合字,最後做成了目前世界上藏文字體最齊全完整,且非常美觀的「AnAnUCan」系列藏文字型。(Microsoft公司也一直嘗試做著與我相同的工作,雖然他們是軟體行家,卻是十足的藏文外行,所設計的字元編號尚不能正式進入使用階段)。
        二、接著我再使用最簡單的 Visual Basic 語言,設計對應鍵盤,經過將近兩個月的時間,我設計完成了我自己的輸入法,因為初發心的緣起,並且是在直貢替寺設計完成的,所以命名為「直貢藏文輸入法」。
        對我來說,這是閉關的障礙,但是對於未來藏文佛經電子化來說,卻是一個突破性的發展。

此套程式的階段性目的
        一、因為擁有了這套輸入軟體,塔波京俄滾秋嘉措所整理的「噶舉法藏」可以開始著手電子化的工作。幾個月以後我有錢了,我將買四部電腦,放在寺廟中,訓練一些和尚從事藏文打字,我希望至少在我回去之前,「噶舉法藏」能完成電子化的工作。
        二、「直貢藏文輸入法V1.0 Public」是完全免費的軟體,任何人皆可免費使用。這是為了全球快速進行藏文佛典電子化的工作
        三、未來全球有了足夠的純藏文電子書(並非像ACIP所用的羅馬轉寫),我們就可以做出  CBETA 一樣的電子大藏經。

其輔助軟體
        我雖然在藏文軟體開發上取得突破性進展,但是這不代表我要否定前人的一切建樹。為了能夠讓過去使用 Sambhota Tibetan5! 以及 ACIP 等等軟體從事佛典電子化的人,能夠直接將過去所輸入的檔案轉成我設計的藏文字型,大約花費了兩個星期左右的時間,我又設計出轉碼程式,命名為「藏文文件通」。此套軟體的特性為:不僅可以解決轉碼問題,也同時可以處理SambhotaDedrisEdedris之間的互相轉換時,以及Tibetan5!ClassicMachineCalligraphicDzongCalligraphic之間的互相轉換時,不造成字型混亂的窘境。

工商服務
        當然,不可諱言地,除了「直貢藏文輸入法V1.0」、「塔波京俄 藏文字典」,以及「顯密無遮大藏」之外,「直貢藏文輸入法V1.5 &V2.0 & V3.0」、「藏文文件通V1.0」、「藏文小會計」、「Word Matrix V1.0」是必須使用者付費購買的,但是相對於 Sambhota 要美金120元,Tibetan Computer Company 一套字型要美金250元,我很有良心地將擁有四套字型的「直貢藏文輸入法V1.5」,定價為1500元台幣(不到45元美金)。雖然如此,擁有兩套字型且免費的「直貢藏文輸入法V1.0」,也已相當足夠一般人使用,我是希望透過一番努力的功夫,能讓自己以及他人都能適切地得到利益。

最後,如果你有甚麼意見與建議,請上中心網站留言,或E-Mail至:123@sino-tibet.com,我雖然不能親自處理你的建言,但是有空下山時,我會處理的。

藏文輸入法下載網址: http://sino-tibet.com
網站留言:   http://sino-tibet.com/talk

沒有留言:

張貼留言