PDFTextStream項目是可用於Java,Python和.NET中的PDF文本和元數據提取庫。它支持所有版本的PDF文檔規範的,(包括V1.6,使用的Acrobat 7),提取文本使用雙字節字符集(包括中國,日本,韓國和),40位和128位解密編碼位加密的文件,並通過提取PDF文件(包括表格數據,書籤和註釋)提供的所有文件的元數據。與雅加達Lucene的易於集成包括 什麼是此版本中的新: ...

閱讀更多