該模塊利用能夠兼容多種數(shù)據(jù)格式的云端數(shù)據(jù)采集接口,基于一站式云服務模式,在線完成對政府網(wǎng)站上的文本、圖像、音頻、視頻等不同類型網(wǎng)頁資源的采集任務,對采集獲取的網(wǎng)頁資源進行統(tǒng)一格式轉(zhuǎn)換處理,將其批量保存到采集數(shù)據(jù)庫中。該模塊通過新增監(jiān)控與變動監(jiān)控實時更新獲取目標政府網(wǎng)站的最新數(shù)據(jù),確保網(wǎng)頁采集的質(zhì)量。同時采用數(shù)據(jù)加密、安全傳輸協(xié)議等方法保證網(wǎng)頁傳輸安全,確保網(wǎng)頁數(shù)據(jù)真實、完整、可信和可用。
該模塊主要包括內(nèi)容管理與元數(shù)據(jù)管理兩大功能。其中內(nèi)容管理的功能是對云端在線采集獲取的各類政府網(wǎng)頁進行線下的分類、著錄、標引、編目、鑒定整理,即按照設定的分類方案,對采集獲取的海量政府網(wǎng)頁進行自動分類,然后將添加元數(shù)據(jù)描述信息的政府網(wǎng)頁保存到相應的管理數(shù)據(jù)庫。元數(shù)據(jù)管理的功能則是通過確定元數(shù)據(jù)元素以及元數(shù)據(jù)的格式,明確政府網(wǎng)頁內(nèi)容、結構、背景和管理過程等信息與元數(shù)據(jù)之間的關系,在相關元數(shù)據(jù)之間建立聯(lián)系,實現(xiàn)元數(shù)據(jù)信息的序化組織,確保政府網(wǎng)頁信息能夠長期可利用。
該模塊基于云存儲動態(tài)易擴展的技術特性,通過調(diào)用云存儲服務端的應用程序,對其存儲集群中相應數(shù)據(jù)庫進行數(shù)據(jù)的插入、刪除、修改等操作,實現(xiàn)對海量政府網(wǎng)頁資源的實時動態(tài)歸檔保存。此外,該模塊還具備存儲數(shù)據(jù)的云備份、云遷移等功能,能夠根據(jù)存儲數(shù)據(jù)的更新情況,利用云存儲數(shù)據(jù)加密、云端數(shù)據(jù)隔離訪問、完整性驗證及可用性保護等方法,定期進行存儲數(shù)據(jù)的在線備份和遷移等處理,確保云環(huán)境下歸檔政府網(wǎng)頁數(shù)據(jù)的長期安全保存。
本文地址:http://m.blackside-inc.com//article/25870.html