speedparser是通用飼料解析器的黑盒重新實現。它使用lxml的飼料解析和可選的HTML清洗 與feedparser speedparser的兼容性是場嚴格的子集,非常好,但差的子集外場。見測試/ speedparsertests.py的更多信息,哪些場是或多或少相容的,哪些不是。
在Intel酷睿i5 750,只在一個內核上運行,feedparser管理2.5飼料/秒的試驗飼料組(大約4200“飼料”,在測試/ feeds.tar.bz2),而speedparser管理約65供稿/秒,HTML 。在清洗和200飼料/秒,清洗過
要求:
- 在Python中
- LXML
評論沒有發現