在 Linux 上处理 Zip 文件

Niraj Menon 2023年1月30日 2022年5月11日
  1. 在 Linux 中使用 ZIP 进行简单压缩
  2. 在 Linux 中使用多文件压缩
  3. 在 Linux 中添加文件夹目录
  4. 在 Linux 中提取 Zipfile
  5. 在 Linux 中更新或更新 ZIP 文件中的文件
  6. 在 Linux 中创建跨区 ZIP 文件
在 Linux 上处理 Zip 文件

压缩文件或 zipfiles 对于外行来说非常常见,是一种将多个文件和目录组合并压缩成单个文件的好方法。

ZIP 格式自 1989 年以来就已经存在,并且至少从 2000 年代起就已得到现代操作系统的支持。

如果你编写脚本来操作 ZIP 文件或希望更频繁地使用命令行,你可能会发现这很有帮助。

本教程将向普通 Linux 用户介绍 ZIP 文件的创建、更新、合并和拆分以及提取,所有这些都在 Bash shell 命令行上进行。

在 Linux 中使用 ZIP 进行简单压缩

zipfile 的最初目的是压缩。简而言之,需要一个或多个文件/目录。

它结合了每个文件中的常见模式,并使用特殊的编码来删除冗余信息,从而可以无损地重建每个文件中的数据。

你可以阅读完整的规范这里

这很好地展示了这种压缩的效果以及如何创建 zip 文件。

创建包含相同信息的具有相似字符的文件,例如 Lorem Ipsum。然后使用 zip 命令将它们放入一个 zip 文件中。

# we assume a file named lorem.txt exists 
# that is at least 15 MB large - you can 
# use any online site to make such a file!

user@linux:~$ ls -lh lorem.txt
-rw-r--r-- 1 user user 15M Jan  1 00:00 lorem.txt

user@linux:~$ zip lorem.zip lorem.txt
  adding: lorem.txt (deflated 89%)

user@linux:~$ ls -lh lorem
-rw-r--r-- 1 user user  15M Jan  1 00:00 lorem.txt
-rw-r--r-- 1 user user 1.6M Jan  1 00:00 lorem.zip

lorem.txt 文件包含 26 个可能的英文字母、逗号、句号、空格和换行符。对于总共 30 个唯一字符,仅包含这种字符组合的大文件非常容易压缩。

ZIP 的编码有效地存储了唯一字符的数量,记录了它们出现的次数和距离的远近。比原始文件存储更小,并允许在从 zipfile 中提取文件时进行完全重建。

在 Linux 中使用多文件压缩

语法很简单,可以压缩多个没有目录的文件。

# assume we have three files - lorem1, lorem2, lorem3.
user@linux:~$ zip lorem.zip lorem*
  adding: lorem1.txt (deflated 48%)
  adding: lorem2.txt (deflated 50%)
  adding: lorem3.txt (deflated 49%)
user@linux:~$ ls -lh lorem*
-rw-r--r-- 1 user user  832 Jan  1 00:00 lorem1.txt
-rw-r--r-- 1 user user  862 Jan  1 00:00 lorem2.txt
-rw-r--r-- 1 user user  919 Jan  1 00:00 lorem3.txt
-rw-r--r-- 1 user user 1.8K Jan  1 00:00 lorem.zip

在 Linux 中添加文件夹目录

要将文件夹添加到 zipfile,请指定递归 -r 选项并在 zip 文件路径后指定文件夹名称,如下所示。

# assuming a folder named loremfiles exists
user@linux:~$ zip -r lorem.zip loremfiles/

在 Linux 中提取 Zipfile

zip 实用程序不包括提取功能。相反,这将由 unzip 处理。其语法非常简单。

unzip lorem.zip

在 Linux 中更新或更新 ZIP 文件中的文件

在包含它的 zipfile 中对你想要相应更新的文件进行更改。你可以使用更新的 -f 标志使 zip 在 zipfile 中查找原始文件。

检查它们是否在 zipfile 被修改后发生了变化,并添加现有文件的较新版本。

例如,在前面的示例中,如果我们修改 lorem1.txt 并运行以下命令,我们可以更新我们的 lorem zip 文件并进行更改。

user@linux:~$ zip -f lorem.zip
freshening: lorem1.txt (deflated 48%)

我们可以使用更新 -u 选项来获得更多功能。

除了使用较新的文件更新 zipfile 之外,它还可以将新文件添加到现有的 zipfile 并在 zipfile 不存在时创建它。

# we change lorem3.txt, and create lorem4 and lorem5
user@linux:~$ zip -u lorem.zip lorem*
updating: lorem3.txt (deflated 49%)
  adding: lorem4.txt (deflated 49%)
  adding: lorem5.txt (deflated 49%)

在 Linux 中创建跨区 ZIP 文件

我们可能会避免通过 Internet 发送一个巨大的文件以节省带宽。相反,发送多个文件,以便在其他文件失败时至少部分文件可以通过。

我们可以尝试重新发送它们。ZIP 提供了将一个非常大的 zip 文件拆分为多个部分的选项,称为跨区存档。

要尝试一个示例,请查找一个大文件或使用随机数据创建一个文件,如下所示。

dd if=/dev/urandom of=frnd count=16384 bs=1024

这会在本地目录中生成一个名为 frnd 的 16 MB 文件。然后我们使用如图所示的 zip 命令将其拆分为 2 部分的 zip 文件,每部分 8 MB。

zip -r -s 8m rnd.zip frnd

这将生成两个名为 rnd.z01rnd.z02 的 8 MB 文件以及一个名为 rnd.zip 的文件结尾 zip。最后一个是必要的,以指示解压缩已达到文件结尾签名。

多个文件组成一个有效的 zip 存档以解压缩,将文件连接成一个 zip,然后解压缩结果。

cat rnd.z* > final.zip
unzip final.zip