xpdf软件包有几个处理pdf文件的程序,如pdfinfo,pdfimage,pdftotext 要实现标题所说的目标,就要用到pdftotext,这个命令可以将pdf文件转换成.txt/.html文件(所以说是权宜之计嘛^-^) 命令格式pdftotext -layout -eol unix /path/to/yourfile.pdf /path/to/yourfile.txt 选项说明: -layout :保持源文件的物理布局(及所见即所得),这个选项一定要有,否则生成的.txt文件会惨不忍睹 -eol :设置转换后的文件所用的行结束方式(unix LF,win CR+LF,mac CR),linux上选unix 其他较重要的选项还有-enc(用于设置文件编码,若你要转换中文pdf文件,它必须设置正确)等,可参考manpage