893 次浏览
ZIP 是最流行的文件格式之一,用于存档和压缩。它自 MSDOS 和 PC 时代就开始使用,并被著名的 PKZIP 应用程序使用。Python 标准库中的 zipfile 模块提供了用于创建、提取、读取和写入 ZIP 档案的工具。ZipFile()此函数从文件参数返回一个 ZipFile 对象,该文件参数可以是字符串或由内置 open() 函数创建的文件对象。该函数需要一个模式参数,其默认值为 'r',尽管它可以采用 'w' 或 'a' 值来打开... 阅读更多
1K+ 次浏览
Python 标准库的 shutil 模块中定义了许多用于对文件和目录进行高级操作的函数。copy()此函数将文件复制到同一目录或其他目录中的指定文件。函数的第一个参数是现有文件的字符串表示形式。第二个参数是结果文件或目录的名称。如果它是目录,则文件将使用相同的名称复制到其中。原始文件的元数据不会被保留。>>> import shutil >>> shutil.copy("hello.py", "newdir/") 'newdir/hello.py'copy2()此函数类似于 copy() 函数,除了它保留元数据... 阅读更多
472 次浏览
很多时候,程序需要遍历文件系统中的文件列表,通常名称与模式匹配。glob 模块可用于在特定目录中创建文件列表,具有特定的扩展名,或以某个字符串作为文件名的一部分。glob 模块函数使用的模式匹配机制遵循 UNIX 路径扩展规则。虽然此模块不会扩展波浪号 (~) 和 shell 变量。glob 模块中主要有三个函数glob()此函数返回与 pathname 参数中给定模式匹配的文件列表。pathname 可以是绝对... 阅读更多
3K+ 次浏览
“tar”实用程序最初是为 UNIX 操作系统引入的。其目的是将多个文件收集到一个档案文件中,通常称为 tarball,这使得分发文件变得容易。Python 标准库的 tarfile 模块中的函数有助于根据需要创建 tar 档案和从中提取。档案可以使用 gzip、bz2 和 lzma 压缩或根本不压缩。此模块中定义的主要函数是 main(),通过它可以完成对 tar 文件的写入或读取。Open()此函数返回与文件名对应的 TarFile 对象,该文件名... 阅读更多
4K+ 次浏览
Lempel–Ziv–Markov chain 算法 (LZMA) 使用字典压缩方案执行无损数据压缩,其压缩率高于其他压缩算法。Python 的 lzma 模块包含用于使用 LZMA 算法压缩和解压缩数据的类和便捷函数。尽管此模块中的功能类似于 bz2 模块的功能,但与 BZ2File 类相比,LZMAFile 类不是线程安全的。在这里,lzma 模块中的 open() 函数是打开 lzma 压缩文件对象的非常简单的方法。open()此函数打开一个 LZMA 压缩文件并返回一个文件对象。该函数需要两个主要参数 - 文件名和... 阅读更多
bzip2 是一种用于文件压缩和解压缩的开源算法。Python 的 bz2 模块提供了以编程方式实现 bzip2 算法的功能。open()函数是此模块的主要接口。Open()此函数打开一个 bzip2 压缩文件并返回一个文件对象。文件可以以二进制/文本模式打开,并具有读/写权限。该函数根据 1 到 9 之间的 compressionlevel 参数执行压缩。write()当文件以 'w' 或 'wb' 模式打开时,此函数可用于文件对象。在二进制模式下,它将压缩的二进制数据写入文件。在普通文本模式下,文件... 阅读更多
13K+ 次浏览
GZip 应用程序用于文件压缩和解压缩。它是 GNU 项目的一部分。Python 的 gzip 模块是 GZip 应用程序的接口。gzip 数据压缩算法本身基于 zlib 模块。gzip 模块包含 GzipFile 类的定义及其方法。它还包含便捷函数 open()、compress() 和 decompress()。使用上述函数实现压缩和解压缩的最简单方法。open()此函数以二进制或文本模式打开一个 gzip 压缩文件并返回一个类似文件对象,该对象可以是物理文件、字符串或字节对象。默认情况下,文件... 阅读更多
753 次浏览
zlib 模块提供了 Python 对 Zlib 压缩库 (http://www.zlib.net) 的实现,它是 GNU 项目的一部分。本文讨论了 zlib 模块中定义的重要函数。compress()此函数是此模块的主要接口,以及 decompress() 函数。此函数通过压缩作为参数提供给它的数据来返回字节对象。该函数还有另一个名为 level 的参数,用于控制压缩程度。它是一个介于 0 到 9 之间的整数。最低值 0 表示不压缩,9 表示最佳压缩。压缩级别越高,压缩字节对象的长度越长。decompress()此函数执行... 阅读更多
JSON 代表 JavaScript 对象表示法。它是一种轻量级的数据交换格式。它类似于 pickle。但是,pickle 序列化是特定于 Python 的,而 JSON 格式由多种语言实现。Python 标准库中的 json 模块实现了类似于 pickle 和 marshal 模块的对象序列化功能。就像在 pickle 模块中一样,json 模块也提供 dumps() 和 loads() 函数将 Python 对象序列化为 JSON 编码的字符串,以及 dump() 和 load() 函数将序列化后的 Python 对象写入/读取到文件。dumps()此函数将对象转换为 JSON 格式。loads()此函数将 JSON 字符串转换回... 阅读更多
2K+ 次浏览
CSV(代表逗号分隔值)格式是电子表格常用的数据格式。Python 标准库中的 csv 模块提供了用于对 CSV 文件执行读/写操作的类和方法。writer()csv 模块中的此函数返回一个 writer 对象,该对象将数据转换为分隔的字符串并存储在文件对象中。该函数需要一个具有写权限的文件对象作为参数。写入文件中的每一行都会发出一个换行符。为了防止行之间出现额外的空格,newline 参数设置为 ''。writer 类具有以下方法writerow()此函数写入可迭代对象中的项目... 阅读更多