最好的 Python模塊 為 Yusuke Shinyama
PDFMiner通過首先考慮的PDF文件的內容,並把它轉換為如HTML一個更有延展性的格式。從那裡,文本和數據被提取和分析,並基於分離並呈現給用戶,或傳送到其它更強大的數據分析工具的預定義的規則。如果文本分析是不是你打算做什麼,你可以輕鬆地配置PDFMiner簡單地提取或者只是將PDF轉換數據為好。它的功能可相互獨立工作,並允許更廣泛的使用範圍全靠它 功能: 100%的Python代碼,沒有C或C ++ 解析PDF文件分析PDF文件...