YACY是一個分佈式的網絡爬蟲,也是一個緩存HTTP / HTTPS代理。經過該代理的網頁被索引,並且可以使用一個內置的HTTP服務器進行搜索。
YACY同行相互連接,形成一個基於P2P的指數交換網絡的基於分佈式哈希表。明確網絡抓取可以在本地或合作來完成,形成了全局搜索和分佈式索引引擎的網頁。
YACY還提供URL與其他代理同行,個人網頁和servlet網頁託管,文件共享區,以及數據庫引擎中的黑名單共享過濾
特點:
- 在搜索自己或全局指數
- 在抓取自己的網頁或啟動分佈式爬行
- 運行您的同行,以支持其他YaCy爬蟲
- 在使用內置的HTTP服務器,文件共享區和wiki上的同行提供的信息
- 在內置緩存HTTP代理
- 從代理緩存索引的利益;私人信息不被存儲或索引
- 在代理服務器的使用不是必需的網頁索引,但它使您可以訪問新的頂級域“.yacy”
- 在像吸附或間諜軟件過濾不需要的內容;分享您的網絡黑名單與其他同齡人
- 在安裝方便!無需額外的數據庫所需的!
- 在沒有中央服務器!
- 在GPL的,免費軟件
什麼在此版本中是新的:
- 在YaCy現在有一個嵌入式的Solr 4.0.0與標準Solr的XML搜索界面集成。
- 這是主索引引擎了。
- 現在有一種增強履帶用活鏈接結構的可視化。
- 在這個版本增加了一個主機瀏覽器來瀏覽抓取主機的文件結構。
- 這表明加載網頁,有錯誤的頁面,並以同樣的方式的文件瀏覽器將顯示一個主機的內容掛起文件。
什麼是0.7版本,新的:
- 在完整的國際字符集和所有UTF-8字符現在支持索引和搜索。
- 支持已添加了網站:,inurl這樣:和文件類型:運營商搜索
- 一個公共API已被添加到搜索結果中,索引,以及在XML和JSON語法鏈接結構。
什麼是在0.61版本新:
- 在這是一個快速釋放,有很多安全修補程序和錯誤修正。
什麼是在0.60版本新:
- 在自動重新爬行和抓取和書籤的組合有被添加。
- 在它現在可以自定義與YaCy個人搜索門戶。
- 在該功能範圍為Windows用戶得到了增強。
評論沒有發現