一、產(chǎn)品概述:
金軟PDF文本抽出x-PDFExtractText工具是一款由北京信久通科技有限公司獨立開發(fā)的專門從PDF文件批量抽出文本到文本文件中的工具,它可以批處理同時為多個PDF文件抽出文本,功能強大。
本程序支持的PDF版本:
PDF 1.0。
PDF 1.1。
PDF 1.2。
PDF 1.3。
PDF 1.4。
PDF 1.5。
PDF 1.6。
PDF 1.7。
可以從上述文件的各種編碼字符集數(shù)據(jù)中抽取文本。
本程序支持的可抽出的字符串:
Unicode字符集。
日語。
英語(只限于拉丁字母字符集ISO_8859-1)。
漢語(簡體字 GB18030、GBK、繁體字Big5)。
韓語(KS_C_5601_1987)的字符串。
使用上述語言外的字體時,無法保證抽出結(jié)果的正確性。
抽出后的文本有17種字符編碼集可供選擇。抽出后文本的編碼方式所使用的基本字符集中所沒有的字符,轉(zhuǎn)換為類似的字符(1個字符或1個字符的組合)。當沒有類似的字符時替換為“〓”(2個字節(jié))、“?” (1個字節(jié))。
無法從有密碼保護的文件中抽出文本。有密碼保護的文件必須事先在源程序中解除安全設置。
x-VisioExtractText工具還具有快速、穩(wěn)定、安全的特點,其操作方便,簡單;界面清爽,靈動。它是Visio的一個輔助軟件,其操作方便簡單。
二、功能介紹:
1. 支持17種常見可轉(zhuǎn)換字符集。
2. 支持1種常見Visio文件的語言。
3.支持在輸出文件名末尾加文件生成日期后綴。
4. 支持批量處理,操作簡便,節(jié)省您的時間。