pdftotext —— Linux/Unix中将PDF文件转化为Text文本格式的利器
安装 pdftotext 到 RedHat / RHEL / Fedora / CentOS / Ubuntu
在不同的Linux分发版本中使用poppler-utils包安装pdftotext(CentOS):
# yum install poppler-utils
或者在Debian / Ubuntu中使用如下指令:
$ sudo apt-get install poppler-utils
pdftotext 使用语法
pdftotext {PDF-file} {text-file}
如何将pdf转化为text?
将php-manual.pdf 转化为 php-manual.txt:
$ pdftotext php-manual.pdf php-manual.txt
只转化前 5 页和后 10 页:
$ pdftotext -f 5 -l 10 php-manual.pdf php-manual.txt
转化加密过的pdf文件( owner password ):
$ pdftotext -opw ‘password‘ php-manual.pdf php-manual.txt
转化加密过的pdf文件( user password ):
$ pdftotext -upw ‘password‘ php-manual.pdf php-manual.txt
Sets the end-of-line convention to use for text output. You can set it to unix, dos or mac. For UNIX / Linux oses, enter:
$ pdftotext -eol unix php-manual.pdf php-manual.txt
原作: http://www.icultivator.com/p/8744.html
郑重声明:本站内容如果来自互联网及其他传播媒体,其版权均属原媒体及文章作者所有。转载目的在于传递更多信息及用于网络分享,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。