二子從周 作品

第兩千兩百三十三章 蘇軾的標籤(第3頁)

    周至在ppt上的畫圖看上去倒是容易理解,但是深入到遠程登錄頁面,展示圖數據庫關係結構的時候,辜老直接舉手打斷:“都是幹文史的老骨頭了,肘子在技術上不用講得太深,給我們舉幾個在文科方面的應用就行。”

    “哦,正好我們現在在搞一個展示項目,我就通過這個項目給大家演示一下吧。”周至說道:“筆記類的歷史典籍,最豐富的是宋朝,後人評論《宋史》,往往評論其失之瑣細,然而對於我們幹數字圖書館和搜索引擎的來說,宋代留下的浩繁的文字資料,為我們進行研究提供了最好的素材庫。”

    “我們的這個項目是將宋代的資料倒入庫中,除了主幹的歷史資料《宋史》,《資治通鑑長篇》等書籍以外,還從《四庫提要》,《四庫全書》,《古今圖書集成》當中,將宋代部分的文、集、章、奏、墓誌、筆記等,都納入其中,僅《四庫全書》的‘別集類’著錄就有三百八十八部,五千多萬字,例如徐鉉的《騎省集》三十卷,田錫的《鹹平集》三十卷,《歐陽文忠公集》的一百五十三卷正文和兩卷附錄等等,都在其中。”

    “資料齊備以後,我們便可以開始構建應用,技術工具的實現非常複雜,這裡我就不講了,現在我通過應用來給大家演示一下吧。”

    “比如我們想要建立一個蘇軾的檢索目錄,我可以在引擎工具裡輸入‘蘇軾’二字,”周至在主索引的欄位開始錄入兩個字並且回車,很快,在電腦屏幕的下方出現了一大堆的文字介紹。

    “在古人的文獻典籍當中,蘇軾二字其實主要存在於奏章、傳記名稱、詞作者等地方,在更多的文獻當中,多用‘軾’,‘子瞻’,‘東坡’等稱謂。”

    “除此以外,在他人的章奏筆記裡,他還往往以‘三蘇’,‘軾轍’等並稱。”

    “另外,史籍中的‘元祐黨’,‘蜀黨’等,可以是他的標籤。”

    “如何根據‘蘇軾’這個主標籤找尋出剛剛我說的二類標籤,我們研發出了一些算法,這裡邊會涉及到許多的問題。”