二子從周 作品

第兩千三百九十九章 讓研究浪漫起來

搞完這些又花了近一個小時,周至也就懶得回臥室了,按照老習慣,朝座位邊的大臥榻上一倒完事兒。

接下來的兩天裡,周至帶著麥小苗開始熟悉甲骨綴合項目和數字圖書館的圖數據庫架構。

這兩個項目也是接下來會契合細胞類神經網絡實驗研究的重點。

甲骨綴合項目最早源於瀚文大字庫圖片字轉矢量字的自動識別技術,以及字根解構與拼合技術,這兩個子項目的成功,也給瀚文大字庫的研發節約了大量的時間,尤其是二期與三期項目,幾乎是拿到兩位老師兄《字海》的卡片後,在極短的時間內就完成了識別,輸入,矢量化,入庫等工作。

也由於二期字庫的極快豐富,直接封殺了港島、新島、灣島甚至島國等漢字使用區想要自主研發全碼字庫的可能,吸引了日韓兩國派遣工作組來“共襄盛舉”,最終讓瀚文大字庫成為了全球唯一且統一的漢語言字符大字庫。

這些技術當然不會在完成大字庫研發後就束之高閣,而是繼續深化發展,很快周至又給它們找到了應用場景,那就是甲骨綴合。

於是之前的兩個技術,也就發展成了邊緣識別契合算法和變化字根通合算法。

這兩個算法說起來倒是簡單,就是實現部分人眼和人腦的功能。

前一個算法就是不管圖片上的碎片是大是小,位置如何,角度如何,也能夠讓計算機識別出其邊緣特徵,並且將之與數據庫當中其餘碎片的邊緣特徵進行匹配,如果找到匹配得上的位置,就會嘗試進行甲骨的拼合。

拼合好之後的甲骨,上面的文字往往就從寥寥幾個不明含義的散字變成一段話,很多隱藏在碎片當中的歷史信息就會第一次呈現在研究者們的面前。

價值當然不言而喻。

而第二個算法就更加的離散和非線性了。

甲骨文字雖然已經十分成熟,但是其流行的歷史時間相當長,且組字的時候並沒有固定的結構,因此往往一個字,多達數十種寫法。

比如步,其實就是一個左腳和一個右腳的字根,這兩個字根的寫法就有很多種,有繁有簡,而這兩個字根被貞人將之刻到甲骨上組合成“步”字以後,其位置關係和角度關係可謂五花八門。