Jericho HTML Parser

軟件截圖:
Jericho HTML Parser
軟件詳細信息:
版本: 3.4
上傳日期: 10 Dec 15
許可: 免費
人氣: 12

Rating: nan/5 (Total Votes: 0)

它可以編輯服務器端和客戶端的標籤,而逐字複製任何無法識別或無效的HTML。

它還提供了高層次的HTML表單操作函數

功能

  • 的存在真實世界QUOT;錯誤格式的HTML不與文檔的其餘部分,這使得圖書館使用的理想與&QUOT的分析干擾; HTML的扼流圈其他解析器。
  • 在ASP,JSP,PSP,PHP和梅森服務器標籤明確由解析器認可。這意味著,普通的HTML仍然被正確分析,即使有它們內部服務器標籤,這是常見的,例如當動態設置元素的屬性
  • 使用StreamedSource類,它允許使用事件迭代器的大文件存儲有效地處理新的基於流解析選項。這實質上是一種StAX的替代與處理HTML和非驗證XML,以及其他一些功能在其他流解析器不可用的能力。
  • 在它的標準形式,它既不是事件,也不基於樹的解析器,而是用簡單的文本搜索,高效的識別標籤和標籤位置緩存的組合。整個源文件的案文被第一次加載到內存中,然後只有相關的部分搜索每個搜索操作的相關文字。
  • 相比於基於樹的解析器,如DOM,內存和資源需求可能要好得多,如果需要該文件的一小部分來解析或修改。不正確或不正確格式的HTML很容易被忽略,與基於樹的解析器,必須確定每個節點的文件中從上到下。
  • 相比,基於事件的解析器如SAX,界面上一個更高的水平,更直觀,並且文檔元素層次結構的樹表示,如果需要可輕鬆創建。
  • 的開始和所有的分析部分的源文檔中的結束位置都可以訪問,使文件的選定部分的修改,而不必從樹上重構整個文檔。
  • 在源文檔中的每個位置的行數和列數都很方便。
  • 提供為HTML表單控件的分析和操作,包括初始值的提取和人口一個簡單而全面的接口,並轉化成只讀或數據顯示模式。的形式控制也允許從形式接收的數據的分析,以進行存儲和以適當的方式呈現。
  • 內置功能來提取HTML標記的所有文本,適用於輸送到一個文本搜索引擎,例如Apache Lucene的。
  • 內置功能,使簡單的文本格式的HTML標記。
  • 內置功能來格式化HTML源代碼,根據他們在文檔元素層次深度縮進元素。 (點擊此處查看在線演示)
  • 內置功能,緊湊的HTML源代碼通過刪除所有不必要的空白。
  • 在自定義標籤類型可以很容易地定義和註冊為認可解析器。

是什麼在此版本中是新的

  • 在添加的源(文件)構造
  • 新增OutputDocument.getSegment()方法。
  • 新增OutputDocument.remove(INT開始,INT端)的方法。
  • 新增Renderer.setHRLineLength()方法。
  • 新增RenderToText.jsp web應用程序的樣本。
  • 新增Segment.getRowColumnVector()方法。
  • 編碼檢測現在忽略了有一個代碼單元的大小與初步編碼不兼容的meta標籤中指定常見的編碼。

什麼3.1版本是新的

  • 修正項目:
  • 在Segment.getAllStartTags無限循環()
  • 在Segment.getAllElements無限循環()
  • Segment.getFirst *方法邊界外段返回段。
  • Segment.getAllElements方法沒有返回在某些情況下,所有封閉的元素。

  • 在Segment.getAllElements方法
  • 修正文檔錯誤。
  • 新增StreamedSource類。
  • 在變化,將影響現有程序的行為:
  • 從類改為ParseText接口。
  • Segment.getNodeIterator()現在返回作為單獨的節點字符引用。
  • 基於屬性值的正則表達式添加標籤的搜索方法。
  • 在基於HTML class屬性添加標籤的搜索方法。
  • 添加靜態Source.LegacyNodeIteratorCompatabilityMode屬性暫時恢復Segment.getNodeIterator()功能,以前的版本。
  • 刪除字符[]的搜索方法ParseText。
  • 新增CharacterReference.appendCharTo(可追加)的方法。
  • 新增OutputDocument(段)構造函數。
  • 新增StreamedSourceCopy示例程序。

類似的軟件

screenfull.js
screenfull.js

10 Dec 15

DOMPDF
DOMPDF

5 Jun 15

h5ile
h5ile

6 Jun 15

顯影劑的其他軟件 Martin Jericho

意見 Jericho HTML Parser

評論沒有發現
添加評論
打開圖片!