config xpdf for windows

原因是用户需要在windows下用到pdftotext这个工具。而这个工具通常只是在linux下使用。

要获得其windows版,首先可以在CTAN的各大镜像上去找,位置是CTAN/support/xpdf

其中可以下载到编译好的exe,即xpdfbin-win-x.x.zip

下载就可以了。其次为了支持中文,需要下载中文包:xpdf-chinese-simplified.tar.gz

下载这个语言包以后,根据说明需要修改xpdfrc这个文件,其中有一个示例,但是真正麻烦的是,你不知道你设置之后,这个文件有没有被用到。很有可能你设了半天,根本就没有被用到。

一个简单的测试方法是,在这个文件中胡乱键入一些文字,看pdftotext是否会报错,如果会报错,则说明你设置的xpdfrc真正生效了,否则你需要把这个文件换个地方试试。

在我的机器上,这个文件所在的位置应该是和pdftotext.exe在同一个目录下,否则是没用的。

放置到正确的位置之后,就可以设置了:

textEncoding  UTF-8

#----- begin Chinese Simplified support package (2011-sep-02)
cidToUnicode    Adobe-GB1       d:/chinese-simplified/Adobe-GB1.cidToUnicode
unicodeMap      ISO-2022-CN     d:/chinese-simplified/ISO-2022-CN.unicodeMap
unicodeMap      EUC-CN          d:/chinese-simplified/EUC-CN.unicodeMap
unicodeMap      GBK             d:/chinese-simplified/GBK.unicodeMap
cMapDir         Adobe-GB1       d:/chinese-simplified/CMap
toUnicodeDir                    d:/chinese-simplified/CMap
fontFileCC     Adobe-GB1       C:/WINDOWS/Fonts/SIMKAI.TTF
#fontFileCC     Adobe-GB1       /usr/..../gkai00mp.ttf
#----- end Chinese Simplified support package

我在没有打开上面的textEncoding之前,总是不能看到中文,打开之后就可以了。



本文地址: http://www.bagualu.net/wordpress/archives/6198 转载请注明




发表评论

电子邮件地址不会被公开。 必填项已用*标注