PHPCrawl

PHPCrawl 0.83

可以以書面的搜索爬蟲(蜘蛛),地雷網頁的各種信息進行使用。PHPCrawl收購它被配置來獲取信息,並通過它進行進一步處理,以更強大的應用 特點: 在過濾器URL和內容類型的數據定義的方式來處理cookie 定義的方式來處理的robots.txt文件在限制它的活動以各種方式在多處理模式 什麼在此版本中是新的: 在修正錯誤:現在,正確編碼在鏈接被部分進行了urlencoded和部分沒有得到重建/。從PHPCrawlerRobotsTxtParser.class.php...

阿帕奇Nutch的是建立在頂部的的Apache Lucene的,一個強大的Java搜索引擎。Nutch的開發人員修改了Lucene的代碼庫,轉換數據無關的代碼庫的Lucene成專門用於搜索網絡上的數據專門項目。這種技術可以用於搜索自己的Web頁面作為一個內置的搜索服務器,或爬行網頁尋找數據解析和刮除到數據庫。Nutch的可以在一台機器上運行,但效果更好的的Hadoop 集群。各種插件可用於擴大其使用範圍 什麼是此版本中的新: ...

Sphinx

Sphinx 2.2.9 / 2.3.1-beta 更新

獅身人面像搜索服務器已被許多知名的互聯網公司Groupon的一樣,Slashdot的,Craigslist的,Joomla.org,MySQL.com,Box.com,土豆網,phpBB的,Scribd,優酷,SimpleMachines.org和許多其他更多。獅身人面像不關心你在哪裡存儲它來搜索數據。它將指數,並答复不管搜索查詢。斯芬克斯已經知道與兩個數據庫類型,關係SQL類型和NoSQL的鍵 - 值存儲服務器工作。速度是獅身人面像的發展一直圍繞為藍本,力求不斷提高返回結果的時間與每個新版本 ...

Reds

Reds 0.2.5

紅色基本上是一個服務器端,可以添加到任何Node.js的web應用程序的JavaScript搜索引擎。該指數基於文本的數據,將其存儲在Redis的數據庫,在那裡更容易在比解析文本真實位置更快的結果進行查詢。這是速度做為主,也更容易維護,以及。紅人專門開發用於苦厄 什麼在此版本中是新的: 加功能限制的結果(分頁)的數目。在不包含單詞串固定失敗。 什麼在0.2.2版本新: 在更新自然 什麼在0.2.1版本新: 在處理標點符號更好 什麼在0.2.0版本新: ...

Yioop!

Yioop! 3.1.1 更新

Open sourced, Yioop! allows webmasters to run their very own search engine for keeping up with changes across the Internet. Can be configured to crawl the whole Internet, or just a specific list of URLs and domains. Once crawled, site details are archived...

OSS Open Search Server

OSS Open Search Server 1.5.11 更新

在應用程序是基於像POI,Lucene的,Zkoss和Tagsoup其他開源技術。 什麼在此版本中是新的 在新功能: 在副本:從幾個方面來複製能力 在提高拼寫檢查查詢:返回現有的字 在複製內容的領域到另一個模式中的 在指數化使用文本文件 自動為每個文件的唯一參考 在整合的hunspell 在網站地圖gzip文件的支持 的片段單獨的查詢 在網絡爬蟲自動設置cookies...

Lunr.js

Lunr.js 0.7.0 更新

靈感來自 Apache Solr實現,Lunr.js是一個框架無關,不依賴JavaScript庫,它可以添加一個完全正常的工作基於文本的搜索引擎,任何應用程序。 搜索引擎的工作完全在瀏覽器將只搜索基於文本的內容,是的Solr那麼複雜,更小,笨的版本。就像Solr的,Lunr支持文字處理管道,文檔標記化,所產生的,並基本停止字(忽略常用術語)。一個演示和執行指令所包含的下載包 本發行版是新的: 莖正確用字母“Y”結尾的單詞。改進的構建工具和開發依賴安裝。 什麼是新的在0.6.0版本: ...

jQuery Looking For

jQuery Looking For 0.0.8 更新

jQuery的尋找插件可以用於大型列表和與搜索字段(輸入元件)一起使用。在他任期的用戶類型,在列表中的元素進行比較的期限和隱藏,如果他們不符合搜索條件。所有匹配術語將左可見,如果插件被配置為高亮顯示所找到的條款,該列表的項目將被著色,以反映匹配的文本。演示中還包含下載包,展示該插件的功能和配置的可能性。 什麼在此版本中是新的: 添加jQuery插件清單文件。 什麼是0.0.7版本,新的: 在新增的jQuery插件清單文件 要求: 在客戶端中啟用JavaScript...

Elastica

Elastica 3.1.0 更新

ElasticSearch 是實時搜索分析,專門針對雲計算基礎設施建設的支持分佈式REST風格的Java搜索引擎。 ElasticSearch是基於的Apache Lucene的 彈性曲線設置一個基本的界面,用於搜索和索引使用上述ElasticSearch搜索引擎基於PHP的項目裡面的內容。這圖書館是不是一個正式支持ElasticSearch客戶端。版本號是同源官方ElasticSearch發布 本發行版是新的: 更新構建依賴於elasticsearch 2.1.1 ...