福爾摩斯是一個普遍的搜索引擎,用於收集文本數據和索引系統(文本文件,網頁等),本地和網絡上。
功能:
- 在通過HTTP或從本地文件收集文件
- 解析使用外部解析器(如MS Word和PostScript)文本文件,HTML,PDF等多種格式。
- 在整個系統是模塊化的,所以添加您自己的數據源或解析器物質只是被插入正確的模塊(當然,平時也寫它)。
- 在混合字符集環境中工作良好。
- 在考慮同一個文件(即使有微小的變化)有多個URL的單個文件多次出現。
- 一切都是高度可配置的。你可以在一個特殊的語言,它允許根據文檔被處理來調整配置變量寫過濾規則。
- 單詞,短語和布爾表達式搜索。在搜索文件名和鏈接文本。
- 近似搜索和搜索常規加權附近。
- 識別語言,易於集成和詞幹同義字典。
- 基於在索引數據中觀察到詞頻,暗示他的查詢可能拼錯的用戶拼寫檢查器。
- 在搜索結果中包含上下文中的每個文件。
- 秤以及數千萬在普通PC硬件的文件。
- 用戶界面(前端)被完全從系統的其餘部分分離,因此很容易修改和也嵌入在搜索引擎中的現有應用程序。
- 在下載的文件和索引壓縮以節省空間。
評論沒有發現