打開搜索服務器(OSS)是GPL v3的開源許可下開發的搜索引擎軟件。
使用最好的開源技術提供內置,打開搜索服務器是一個穩定的,高性能的軟件。它既是現代搜索引擎和一套高性能的全文檢索算法。
打開搜索服務器運行在Windows 20XX / XP / Vista中,MacOS X系統,Solaris和Linux + Java虛擬機。
OSS引擎
這種附加在C ++開發的本地庫,並有相當的推動打開搜索服務器的能力。由於採用了優化的本地代碼,開源引擎會從開放式搜索服務器出色的表演。增強功能包括:
*針對性的個性化提供了巨大的可能性
*文件是指數由快一個數量級
*改進響應時間
*可能的同步查詢數量加高
OSS發動機的工作原理作為一個附加打開在Linux,Solaris,視窗20XX / XP / Vista和MacOS X的搜索服務器無論是在32或64位。它是通過一個專有許可歸屬分佈式
功能:
- 在多國語言索引。文檔可以在16種語言被索引 - 中國,丹麥語,荷蘭語,英語,芬蘭語,法語,德語,匈牙利語,意大利語,挪威語,葡萄牙語,羅馬尼亞語,俄語,西班牙語,瑞典語,土耳其語
- 在多國語言分析句子切成文字,然後再運行基於文檔的語言的話lemmatisation算法(單/複數,性別,共軛動詞等)
- 爬蟲通過網站和文件系統能夠快速,輕鬆地建立索引。
- 在眾多的文件格式的支持,例如XML,HTML / XHTML,Adobe公司PDF,微軟的Word,PowerPoint,OpenOffice的,等等。
- 在Web界面是圍繞由Zkoss框架所提供的電力。它運行與主Ajax的瀏覽器。此RIA型接口是一樣舒適,一個重客戶機來使用。
- 通過一個XML文件,其中包含的字段定義和指數化選項易於配置。
- 在快速整合的感謝通過HTTP查詢XML接口(HTTP上的XML)。
什麼在此版本中是新的:
- 在此開發者版本推出新的強大的功能和錯誤修正一些
- 的截圖功能可自動捕捉網頁截圖被抓取。
- 在搜索查詢是能夠從非存儲領域返回條款。
- 否定過濾器是可用的。
- 在網絡爬行器是能夠按照網站地圖文件。
什麼版本1.2.1-r987是新的:
- 新功能:
- 3176150:時間/日期戳
- 3186042:禁止沒有被允許(robots.txt的)
- 3182953:URL抓取從數據庫
- 3182950:模式分析與排除列表deactivable
- 3182097:添加字段提升的支持
- 3175585:更多類似這樣的功能
- 3169421:日本和韓國的支持
- 3159477:識別相同的網頁
- 3151757:升級到PDFBox的1.4.X
- 3141193:FTP / FTPS支持文件履帶
- 3141192:在文件履帶SMB / CIFS的支持
- 3034238:履帶能夠登錄在受保護的網站
- 3011773:添加石英為調度服務
- 3138603:升級到Tomcat的版本6.0.xx
- 3103055:轉換HTML實體
- 3087916:升級到1.2 PDFBox的
- 3043692:洪流分析器
- 3042488:音頻分析器
- 2882260:添加一個解析器純文本/
- 3010010:RTF分析器
- 3038733:添加一個木瓦過濾器
- 3036262:日誌管理
- 3031800:架構接口
- 3031204:添加NGRAM支持
- 3008440:指數複製
- 3026212:API和接口文檔刪除
- 3023327:子域名提取網絡爬蟲
- 2820289:數據庫抓取
- 3019035:Neglight動態URL抓取時
- 3017277:在瀏覽器的URL通配符允許查詢
- 3016491:URL出口商
- 3016566:監控API
- 3015939:群集崩潰
- 2830490:索引大小
- 3011847:分數的解釋
- 3008633:可能性關閉高亮
- 2997836:在具有Meta標籤額外的字段返回的領域
- 2997826:可能性指數只有指定的內容
- 2991252:可能性指數二進制文件,並把它添加到文檔li>
- 2982545:提取的詞頻信息
- 2881385:API來獲取可用的指數之
- 2887376:增強的索引頁刪除索引
- 2881388:API列出/創建/修改一個指定的架構領域
- 2973374:升級到ZKoss 5.0.x版
- 2970747:升級到Tomcat的版本6.0.26
- 2966139:統計時丟失OSS重啟
- 2964704:升級到Lucene的2.9.x
- 2958015:添加源存檔
- 2958005:升級的Apache HttpClient庫為4.0.1
- 2956498:提供一種方法通過電子郵件發送統計報告
- 2953803:升級到1.0 PDFBox的
- 2953802:升級到3.6 POI
- 2953575:字符集檢測應該看看META HTTP-當量
- 2953524:指定默認的字符集的解析器
- 2929332:小面後倒塌
- 2900462:升級到POI 3.5 XLSX和文檔支持
- 2900449:升級到PDFBox的0.8
- 錯誤修正:
- 3178432:錯誤的cron值調度
- 3104065:文件履帶崩潰,java.io.EOFException
- 3090248:統計配置添加字段時失去
- 3051308:不解釋
- 2881689:Requests.xml無法在某些Windows平台轉動
- 3019491:NullPointerException異常>在java.util.regex.Matcher中
- 3017481:網絡爬行器選擇按照字母順序主機
- 3015838:網絡爬蟲問題UTF-8編碼的BOM
- 2993103:NoClassDefFoundError的BouncyCastleProvider
- 2990960:關鍵字未在片段突出
- 2982541:短語同義詞產生不受歡迎的詞彙
- 2934214:移高亮段
什麼版本1.2 Beta版是新的:
- 在超過50個新功能和錯誤修正,加入
- 索引可以在遠程服務器上被複製。
- 在一個n克過濾器和過濾器瓦提供了新的可能性,如意見箱,拼寫錯誤寬容,以及自動生成的話題。
- 系統數據庫抓取支持連接查詢和外部文件加入。
- 一些改善,向網絡爬蟲製成,如一個URL出口,子域提取,排除列表,手動爬行,並且一個參數濾波器。
- 的監測和監督API和Web界面加入。
- 在新的音頻分析器提供能力指數洪流,MP3 / MP4,OGG Vorbis格式,FLAC和WMA文件。
什麼是1.1.2版本的新:
- 新功能:
- 添加源存檔
- 在Lucene的只讀支持
- 錯誤修正:
- 在PHP API失敗與錯誤的XML字符一些查詢
- 在問題的統計匯總
- 排序functionnality似乎忽略了排序順序
- 性能問題,大場緩存
- 問題,網絡爬蟲的性能
- 在網絡爬蟲統計負值
- 通配符功能的行為問題
- 在返回場中返回的XML複製
在什麼版本1.1是新的:
- 同義詞支持
- 拼寫檢查的支持
- 網絡爬蟲和文件履帶
- 在其他語言支持:羅馬尼亞,土耳其,丹麥,俄羅斯和中國的個別字符
- OpenDocument格式的支持
- 若干指標的單個實例中管理
評論沒有發現