PDFTextStream

軟件截圖:
PDFTextStream
軟件詳細信息:
版本: 2.6.0
上傳日期: 20 Feb 15
許可: 共享軟件
價格: 1900.00 $
人氣: 63

Rating: 3.5/5 (Total Votes: 2)

PDFTextStream項目是可用於Java,Python和.NET中的PDF文本和元數據提取庫。
它支持所有版本的PDF文檔規範的,(包括V1.6,使用的Acrobat 7),提取文本使用雙字節字符集(包括中國,日本,韓國和),40位和128位解密編碼位加密的文件,並通過提取PDF文件(包括表格數據,書籤和註釋)提供的所有文件的元數據。
與雅加達Lucene的易於集成包括

什麼是此版本中的新

  • 在該版本包含了多種修復發確保PDFTextStream能夠提取所不合格的PDF規範PDF文檔的文本。
  • 在其中還包括了各種性能增強。

什麼是新的在2.3.0版本:

  • 在增加了一個.isStruckThrough()方法融為一體。 snowtide.pdf.TextUnit,指示字符是否具有穿過它畫出的刪除線。
  • 在改進PDFTextStream的支持嵌入式字符映射。
  • 在字與字之間空白的計算已經被固定為適當的解釋是在源PDF文檔中明確編碼的空白。
  • 在改進的複合內容編碼,這在以前是無法產生的PDF內容一定範圍內開採過程中被“忽略”的PDFTextStream的處理。
  • 修正了VisualOutputTarget一個錯誤的地方,從一個單行文本將拆分為多行
  • 在文本的改進垂直對齊方式提取出來,使用VisualOutputTarget
  • 在改進的VisualOutputTarget生產提取物,消除緊密相鄰字之間的寄生額外的空格

什麼是2.2.5版本,新的

  • 在這個版本增加了對提取XFA表單數據作為支撐XML。
  • 在這顯著提高使用VisualOutputTarget文本提取的性能。支持PDF文件大於2GB。
  • 在一個錯誤的地方,從嵌入的Type1字體的編碼以前未在某些情況下正確應用的修復。
  • 在對凡在更新PDF文件更新的內容有時被忽視的問題的修復程序。
  • 在哪裡PDFDocEncoding的編碼書籤和元數據沒有被正確解碼的問題的修復程序。
  • 系統.getDestinationName()在com.snowtide.pdf.Bookmark方法。

要求

  • 在Apache的Lucene的

意見 PDFTextStream

評論沒有發現
添加評論
打開圖片!