地學數據、地質知識的一個典型特點就是具有空間屬性,在地學研究中這些空間屬性可以通過經緯度、坐標等數值形式得以精確反映,但知識表達更普遍的情況是以區域或地名的形式出現。例如,研究人員在進行青藏高原研究時,往往希望通過查詢青藏高原、西藏地區、特提斯成礦帶(中國)甚至第三極等一些具有明顯區域特征的關鍵詞查詢需要的數據資源,而很少有人直接通過青藏高原空間區域的范圍(北緯26°00′12″~39°46′50″,東經73°18′52″~104°46′59″)來查詢。因此,如何把用戶對空間范圍的查詢語義轉化為對地名或區域的查詢,或者直接揭示用空間語言表達的地學知識的空間特點,成為地質空間術語語義研究需要解決的問題之一。
目前在地質術語研究與應用方面取得的重要成果有《地質學漢語敘詞表(2010)》、《地球科學大辭典》、《石油主題詞表》、《地質礦產術語分類代碼(GB 9649-2009)》等,這些成果在規范專業術語使用的同時,也對空間術語進行了部分規范。這些術語詞典、詞表的出版,使廣大地質工作者有了學術交流的共同語言,為撰寫論文和檢索文獻提供了極大便利。但長期以來,空間地質名詞的學科化與規范研究基本上處于半空白狀態,一直套用行政地名系統、地理空間系統語義(地名敘詞),沒有建立起系統的空間地質語義體系,這不利于對地學知識的空間挖掘和本質的揭示。地學文獻信息資源的知識挖掘等要求更為系統的知識組織,尤其是語義層面的知識組織規范。
2012~2013年啟動實施的地質調查項目《地質敘詞語義第一部分 空間地質敘詞》對國內主要是近三十年的地學知識中包含的空間信息進行了梳理,整理了近4萬條知識性空間語言信息,明確了5萬多條詞間關系,探索了空間語言的空間位置關系計算,為地學知識的空間挖掘、分析進行了準備。該項目由中國地質圖書館主持承擔,主要完成人有丁群安、劉振鋒、劉素芳、王歡、宋韋劍、朱薇薇等。
一、成果主要內容
成果內容包括兩部分:編制了技術規范——《地質敘詞語義第一部分 空間地質敘詞》,為空間地質敘詞的內容拓展提供了技術規范;對地質空間語言的語義進行了拓展和規范,為基于空間的知識管理、挖掘提供了必要的理論和基礎支持。
1.《地質敘詞語義 第一部分 空間地質敘詞》
該敘詞規范共有8章和3個附錄。主要章節分別是:范圍、規范性引用文件、術語和詞間關系符號、空間地質敘詞的選定、詞間關系處理、空間地質敘詞編碼、空間地質敘表結構及編排、空間地質敘詞表的使用和維護。附錄包括三部分:附錄A空間地質敘詞主表,附錄B空間地質敘詞范疇索引表,附錄C空間地質敘詞英漢對照索引表。
該規范以“中國地質文獻數據庫”和《地質學漢語敘詞表》(2010)為基礎,結合地學文獻空間屬性標引與檢索需要,編制了空間地質敘詞647個。其中,政區類名詞193個,地理類名詞305個,地質類名詞149個,中國名詞329個,外國名詞318個,具有代用關系的敘詞60個。
2.拓展了地質空間術語的語義范疇
地質學領域常用的空間術語主要有行政、地理、地質三類。行政和地理類術語由于詞語的社會認知度高,便于公眾、一般研究人員識別,在標注應用上,主要描述研究行為、對象、問題所處的區域。地質類空間術語一般都含有地質專業信息,一般與研究的地質問題、現象關系密切,在使用和區分上主要利用空間地質術語的通用名進行識別。因此除政區外,地理類和地質類的術語分別按照《地球科學大詞典》、基礎地理信息要素分類與代碼空間要素信息進行規范。行政類空間語言一般與國家、國家權力下的行政空間劃分相關聯,其命名與行政確認、區劃變遷有直接關系,一部分與行政區區位相關,如華東地區,表示中國東部地區。地理類空間語言主要由自然地理地貌決定其空間范圍,部分命名可能受行政因素影響,部分地理名詞與行政名詞通用,如臺灣與臺灣地區、臺灣島通用。地質類空間語言一般由地質研究人員根據特殊的地質空間、地質現象提出,與一定的地質理論、特殊的地質問題關系密切,地質空間術語有較強的地質專業屬性,如板塊學說的華北板塊,大地構造學說的喜馬拉雅造山帶、斷裂帶,含油氣盆地學說的渤海灣盆地、珠江口盆地等。
(2)對地質空間術語進行了體系化研究
地質類空間語言一般由地質研究人員根據特殊的地質空間、地質現象提出,與一定的地質理論、特殊的地質問題關系密切,有較強的地質專業屬性。項目以“中國地質文獻數據庫”、《地質學漢語敘詞表》(2010)常用的空間地質類地名詞和《地球科學大詞典》不同學術觀點為基礎,按照學科范疇特點對空間地質信息通用名進行研究,將通用名歸入學科范疇。通用名包括板塊、地臺、地盾、地塊、地塹、盆地、坳陷、凹陷、古陸、地軸、地槽、斷裂帶、斷裂、構造、構造帶、造山帶、褶皺帶、縫合帶、隆起、成礦帶、成礦省、成礦域、地震帶、裂谷等單元名稱,為空間地質術語在知識標引、分類方面打下了基礎。同時,項目結合當前應用熱點,對重點的成礦帶、盆地進行系統補充。從地球科學大詞典、石油主題詞表中遴選184系列空間地質名詞,在文獻應用中進行查證,按照至少使用三次的原則進行篩選查證。增補敘詞成礦帶17個,盆地29個,斷裂帶18個,并重點對其英文譯名、詞間關系進行了梳理。
二、成果的應用前景和意義
空間語義在一定程度反映了地質學研究的深度、廣度和層次性,與常規的地學術語詞典、規范相比,地質空間語義不直接反映地學知識體系變化,但它反映了地學科學事實變化和科學認識的變化。空間地質語義的研究填補了地質學知識組織規范體系的一項空白,加速了國內地學知識體系的構建,為建立更為廣泛的空間語義網絡提供了必要的知識和理論準備。地球系統科學研究涉及天文、氣象、海洋、地質、生物等領域,需要打通交叉學科的術語壁壘,地質空間語義的規范研究,為融入即將到來的更為廣闊的空間語義網絡做好了知識和理論準備。另一方面,通過知識的空間屬性揭示,為識別地學在不同區域內的各種問題,展示地學的區域結構特點,更好地開展地學知識挖掘、地學科技工作部署和野外工作基地選擇提供了基于空間知識計量的科學分析數據。