pdftotext —— Linux/Unix中将PDF文件转化为Text文本格式的利器

更新时间:2023-12-02 下载TXT文档 下载Word文档

安装 pdftotext 到 RedHat / RHEL / Fedora / CentOS / Ubuntu

在不同的Linux分发版本中使用poppler-utils包安装pdftotext(CentOS):

# yum install poppler-utils

或者在Debian / Ubuntu中使用如下指令:

$ sudo apt-get install poppler-utils

pdftotext 使用语法

pdftotext {PDF-file} {text-file}

如何将pdf转化为text?

将php-manual.pdf 转化为 php-manual.txt:

$ pdftotext php-manual.pdf php-manual.txt

只转化前 5 页和后 10 页:

$ pdftotext -f 5 -l 10 php-manual.pdf php-manual.txt

转化加密过的pdf文件( owner password ): [短码网_DuanMa.NET]

$ pdftotext -opw 'password' php-manual.pdf php-manual.txt

转化加密过的pdf文件( user password ):

$ pdftotext -upw 'password' php-manual.pdf php-manual.txt

Sets the end-of-line convention to use for text output. You can set it to unix, dos or mac. For UNIX / Linux oses, enter:

$ pdftotext -eol unix php-manual.pdf php-manual.txt

更多命令:

  • man page pdftotext

此外,还可以转化pdf为多种其他格式文件:

pdfto

如可以将pdf文件转化为html,但我测试了一下,效果貌似不佳,很多页面有错乱出现,但是pdftotext转化的效果还是不错的(图片都去掉了),而且速度很快。

以上就是短码网小编为大家整理的《pdftotext —— Linux/Unix中将PDF文件转化为Text文本格式的利器》相关内容,希望大家喜欢。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。

如若内容造成侵权/违法违规/事实不符,请将联系本站反馈,一经查实,立即处理!

pdftotext —— Linux/Unix中将PDF文件转化为Text文本格式的利器》文档下载仅供参考学习,下载后请在24小时内删除。

转载注明出处:https://www.duanma.net/article/c43db416841.html

回到顶部