catdoc

軟件截圖:
catdoc
軟件詳細信息:
版本: 0.94.2
上傳日期: 14 Apr 15
開發: Victor Wagner
許可: 免費
人氣: 50

Rating: 4.0/5 (Total Votes: 1)

catdoc的程序,它讀取一個或多個Microsoft Word文件和輸出的文本,包含insinde他們到標準輸出。因此它為.doc文件同樣的工作,作為普通的ASCII文件的UNIX cat命令

catdoc項目現在伴隨著xls2csv - 程序,轉換Excel電子表格為逗號分隔值文件。最新加入catdoc套件catppt - 計劃,從提取的PowerPoint文件可讀文本。

Optionaly,catdoc能夠翻譯一些非ASCII字符到correspoindig TeX的轉義序列和轉換的Windows ANSI代碼頁或Unicode字符集到目標機器的本地代碼頁。

它還​​具有被用於哪些不是存在於目標編碼符號替代序列的數據庫。所以,如果你想讀在C語言環境俄語單詞的文件,你會得到一個音譯。

在Unix下它使用參閱nl_langinfo功能找出要使用的輸出編碼,DOS下它使用適當的DOS功能,它從CONFIG.SYS中COUNTRY語句獲取代碼頁值。

catdoc也能夠讀取RTF文件,甚至純文本,因此它可以用作一般用途的編碼轉換器。 (因為catdoc是俄羅斯方案,默認情況下它在DOS下運行時,在UNIX和CP866上運行時轉換CP1251為koi8-R。

Catdoc有基本的表格處理。在TeX的模式下,插入與時表行的遭遇字段分隔符,當遇到結束,沒有表頭的生產雖然。

Catdoc甚至沒有嘗試保護者MS-Word中的字符格式,它的目標是提取純文本,讓你讀它和,很可能重新使用TeX,根據TeXnical規則,大多數Word用戶甚至還沒有聽說過。

xls2csv的Excel文件做大致相同。它提取數據,並留下任何格式信息和公式。概念是,你希望看到的數據,而不是它的創建方式。

還有的Tcl / Tk GUI腳本wordview提供GUI用於查看Word和RTF文件使用catdoc。由於內部Tcl的字符串表示是utf-8和大多數系統現在有Unicode字體,你可能能夠使用這個腳本在任何語言中讀取文件。<​​/ P>

意見 catdoc

評論沒有發現
添加評論
打開圖片!