請使用微信掃碼付費10元/篇

信息檢索解決方案背景分析


保存在數據庫中的記錄數據,從類型上可以分為兩種。其一是結構化數據,象字符、日期、數值、貨幣等,這些數據都是具有有限長度或固定格式的數據;其二是非結構化數據,也叫全文數據,象簡歷、簡介、論文等,這些數據都是以不定長、非固定格式保存的字符型數據。

現有的數據庫系統,都是以結構化數據為檢索的主要目標,因為實現相對簡單。比如數值檢索,可以建立一張排序好的索引表,以二分法實現查找,速度很快。但對于非結構化數據,即全文數據,要想實現全文檢索,相對難度要大的很多了。

當然,你也許會說:“這個多簡單呀,把全文數據讀到內存,然后進行比較查找不就可以了?”不錯,的確是一個很樸素想法。不過最嚴重的 問題是,如果數據庫中有1萬條,10萬條,100萬條記錄的話,可以想象一下檢索所消耗的時間了吧?!如果一個全文數據庫系統,對一條檢索命令的響應時間 超過了半分鐘,那么沒有用戶是能夠容忍的了。

因此,全文檢索的主要目的,就是實現對大容量的非結構化數據的快速查找。

信息檢索解決方案分析


B/S 全文檢索系統的核心功能是實現對中小型規模數據量(500萬級以上)站點信息的統一全文檢索。全文檢索是指在“海量”信息中快速、準確根據關鍵詞句返回用戶所需的信息。
B/S 不僅追求高準確率同時追求超高查全率的手段,內部采用自主研發的復方詞法分析系統。搜索結果可以按字段值或信息相關性排序,多字段聯合搜索,基于字段的層級命中數量估算,支持字段數值的區間搜索,支持大量的布爾搜索語法規則。
B/S它還是一個可完全定制的全文檢索解決方案套件,前臺和接口(API)調用采用 PHP 編寫,運行在 Linux/BSD 等 Unix 類操作系統中。

信息檢索解決方案總結


全文檢索引擎以先進的信息整合處理技術為核心,為政府及企業建設高性能信息檢索平臺,能夠將分散的多種信息集中檢索,讓用戶在一個檢索界面即可獲取到所需的各種相關信息,不論是內網的網頁、辦公的文檔、行業的數據庫,對于Goonie都能提供完美的檢索解決方案。

安徽11选5冷热号