catdoc的程序,它讀取一個或多個Microsoft Word文件和輸出的文本,包含insinde他們到標準輸出。因此它為.doc文件同樣的工作,作為普通的ASCII文件的UNIX cat命令
catdoc項目現在伴隨著xls2csv - 程序,轉換Excel電子表格為逗號分隔值文件。最新加入catdoc套件catppt - 計劃,從提取的PowerPoint文件可讀文本。
Optionaly,catdoc能夠翻譯一些非ASCII字符到correspoindig TeX的轉義序列和轉換的Windows ANSI代碼頁或Unicode字符集到目標機器的本地代碼頁。
它還具有被用於哪些不是存在於目標編碼符號替代序列的數據庫。所以,如果你想讀在C語言環境俄語單詞的文件,你會得到一個音譯。
在Unix下它使用參閱nl_langinfo功能找出要使用的輸出編碼,DOS下它使用適當的DOS功能,它從CONFIG.SYS中COUNTRY語句獲取代碼頁值。
catdoc也能夠讀取RTF文件,甚至純文本,因此它可以用作一般用途的編碼轉換器。 (因為catdoc是俄羅斯方案,默認情況下它在DOS下運行時,在UNIX和CP866上運行時轉換CP1251為koi8-R。
Catdoc有基本的表格處理。在TeX的模式下,插入與時表行的遭遇字段分隔符,當遇到結束,沒有表頭的生產雖然。
Catdoc甚至沒有嘗試保護者MS-Word中的字符格式,它的目標是提取純文本,讓你讀它和,很可能重新使用TeX,根據TeXnical規則,大多數Word用戶甚至還沒有聽說過。
xls2csv的Excel文件做大致相同。它提取數據,並留下任何格式信息和公式。概念是,你希望看到的數據,而不是它的創建方式。
還有的Tcl / Tk GUI腳本wordview提供GUI用於查看Word和RTF文件使用catdoc。由於內部Tcl的字符串表示是utf-8和大多數系統現在有Unicode字體,你可能能夠使用這個腳本在任何語言中讀取文件。</ P>
按類別搜索
熱門軟件
-
Sophos UTM 17 Feb 15
-
OpenShot Video Editor 17 Aug 18
-
GTK VNC Viewer 2 Jun 15
-
Kconfigure 3 Jun 15
-
LMule 4 Jun 15
-
HP Linux Imaging and Printing 1 Dec 17
-
Porteus Xfce 12 Jan 17
評論沒有發現