如何在 Python 中破解 PDF 文件?


Python 拥有丰富的库集合,用于多种目的,例如创建和开发应用程序、Web 开发、科学计算、软件测试、机器学习等等。Python 也用于测试和开发信息安全性方面的系统应用程序。还有其他一些库和工具,它们包含用于创建哈希值、收集信息、检索信息、加密和解密、Web 爬取、欺骗等的特定脚本。

在本文中,我们将创建一个程序,该程序将对受密码保护的 PDF 文档进行解密。对于解密,我们将使用一个包含一些常见密码的单词列表,它将帮助解密 PDF 文档。

为了创建一个 PDF 破解器,我们将导入 pikepdf 库。下载后,我们可以在我们的笔记本中包含它。为了参考,我们将使用这个 单词列表 作为一个示例,其中包含 5000 个常见密码。

示例

import pikepdf
from tqdm import tqdm

#Loading password list
password = [line.strip() for line in open("wordlist.txt")]

#iterate over all the passwords
for paswrd in tqdm(password, "Cracking PDF"):
   try:
      #open PDF file
      with pikepdf.open("protected.pdf", password=paswrd) as pdf:
#If password matches then break the loop and print the output
         print("Password found:", paswrd)
         break
   except pikepdf._qpdf.PasswordError as e:
      #If password not found then continue
      continue

输出

运行上述代码将首先找到密码,然后以输出的形式打印出来。

更新于: 2021 年 3 月 4 日

1K+ 浏览

开启您的 职业生涯

完成课程以获得认证

开始
广告