在不同的Linux分发版本中使用poppler-utils包安装pdftotext(CentOS):
# yum install poppler-utils
或者在Debian / Ubuntu中使用如下指令:
$ sudo apt-get install poppler-utilspdftotext 使用语法
pdftotext {PDF-file} {text-file}如何将pdf转化为text?
将php-manual.pdf 转化为 php-manual.txt:
$ pdftotext php-manual.pdf php-manual.txt
只转化前 5 页和后 10 页:
$ pdftotext -f 5 -l 10 php-manual.pdf php-manual.txt
转化加密过的pdf文件(owner password ):
$ pdftotext -opw ’password’ php-manual.pdf php-manual.txt
转化加密过的pdf文件(user password ):
$ pdftotext -upw ’password’ php-manual.pdf php-manual.txt
Sets the end-of-line convention to use for text output. You can set it to unix, dos or mac. For UNIX / Linux oses, enter:
$ pdftotext -eol unix php-manual.pdf php-manual.txt更多命令:man page pdftotext
此外,还可以转化pdf为多种其他格式文件:
如可以将pdf文件转化为html,但我测试了一下,效果貌似不佳,很多页面有错乱出现,但是pdftotext转化的效果还是不错的(图片都去掉了),而且速度很快。
相关文章:
1. Win11右下角弹出英特尔无线bluetooth的解决教程2. 地毯式轰炸!不符合要求的电脑也收到全屏的 Win11 升级提醒 3. 电脑蓝屏代码0x000000d1怎么办?0x000000d1电脑蓝屏代码解决方法4. Win11开机后出现explorer.exe应用程序错误怎么解决? exe应用程序错误解决办法5. Win11增强音频没反应怎么办? Win11提高音频音量方法6. Win11 release preview通道是什么?release preview频道更新Win11好吗?7. Win11发布预览版Build 22000.1639更新补丁KB5022905推送(附更新修复内容汇总)8. Win10 Build 1904x.2673 预览版更新 KB5022906内容汇总9. KB5022845导致Win1122H2更新驱动失败 Surface出现0x80070103错误10. Win11 22H2 Moment 2更新后将彻底修复文件复制缓慢的问题