在 Linux 上处理 Zip 文件
- 在 Linux 中使用 ZIP 进行简单压缩
- 在 Linux 中使用多文件压缩
- 在 Linux 中添加文件夹目录
- 在 Linux 中提取 Zipfile
- 在 Linux 中更新或更新 ZIP 文件中的文件
- 在 Linux 中创建跨区 ZIP 文件
压缩文件或 zipfiles 对于外行来说非常常见,是一种将多个文件和目录组合并压缩成单个文件的好方法。
ZIP 格式自 1989 年以来就已经存在,并且至少从 2000 年代起就已得到现代操作系统的支持。
如果你编写脚本来操作 ZIP 文件或希望更频繁地使用命令行,你可能会发现这很有帮助。
本教程将向普通 Linux 用户介绍 ZIP 文件的创建、更新、合并和拆分以及提取,所有这些都在 Bash shell 命令行上进行。
在 Linux 中使用 ZIP 进行简单压缩
zipfile 的最初目的是压缩。简而言之,需要一个或多个文件/目录。
它结合了每个文件中的常见模式,并使用特殊的编码来删除冗余信息,从而可以无损地重建每个文件中的数据。
你可以阅读完整的规范这里。
这很好地展示了这种压缩的效果以及如何创建 zip 文件。
创建包含相同信息的具有相似字符的文件,例如 Lorem Ipsum
。然后使用 zip
命令将它们放入一个 zip 文件中。
# we assume a file named lorem.txt exists
# that is at least 15 MB large - you can
# use any online site to make such a file!
user@linux:~$ ls -lh lorem.txt
-rw-r--r-- 1 user user 15M Jan 1 00:00 lorem.txt
user@linux:~$ zip lorem.zip lorem.txt
adding: lorem.txt (deflated 89%)
user@linux:~$ ls -lh lorem
-rw-r--r-- 1 user user 15M Jan 1 00:00 lorem.txt
-rw-r--r-- 1 user user 1.6M Jan 1 00:00 lorem.zip
lorem.txt
文件包含 26 个可能的英文字母、逗号、句号、空格和换行符。对于总共 30 个唯一字符,仅包含这种字符组合的大文件非常容易压缩。
ZIP 的编码有效地存储了唯一字符的数量,记录了它们出现的次数和距离的远近。比原始文件存储更小,并允许在从 zipfile 中提取文件时进行完全重建。
在 Linux 中使用多文件压缩
语法很简单,可以压缩多个没有目录的文件。
# assume we have three files - lorem1, lorem2, lorem3.
user@linux:~$ zip lorem.zip lorem*
adding: lorem1.txt (deflated 48%)
adding: lorem2.txt (deflated 50%)
adding: lorem3.txt (deflated 49%)
user@linux:~$ ls -lh lorem*
-rw-r--r-- 1 user user 832 Jan 1 00:00 lorem1.txt
-rw-r--r-- 1 user user 862 Jan 1 00:00 lorem2.txt
-rw-r--r-- 1 user user 919 Jan 1 00:00 lorem3.txt
-rw-r--r-- 1 user user 1.8K Jan 1 00:00 lorem.zip
在 Linux 中添加文件夹目录
要将文件夹添加到 zipfile,请指定递归 -r
选项并在 zip 文件路径后指定文件夹名称,如下所示。
# assuming a folder named loremfiles exists
user@linux:~$ zip -r lorem.zip loremfiles/
在 Linux 中提取 Zipfile
zip
实用程序不包括提取功能。相反,这将由 unzip
处理。其语法非常简单。
unzip lorem.zip
在 Linux 中更新或更新 ZIP 文件中的文件
在包含它的 zipfile 中对你想要相应更新的文件进行更改。你可以使用更新的 -f
标志使 zip
在 zipfile 中查找原始文件。
检查它们是否在 zipfile 被修改后发生了变化,并添加现有文件的较新版本。
例如,在前面的示例中,如果我们修改 lorem1.txt
并运行以下命令,我们可以更新
我们的 lorem
zip 文件并进行更改。
user@linux:~$ zip -f lorem.zip
freshening: lorem1.txt (deflated 48%)
我们可以使用更新 -u
选项来获得更多功能。
除了使用较新的文件更新 zipfile 之外,它还可以将新文件添加到现有的 zipfile 并在 zipfile 不存在时创建它。
# we change lorem3.txt, and create lorem4 and lorem5
user@linux:~$ zip -u lorem.zip lorem*
updating: lorem3.txt (deflated 49%)
adding: lorem4.txt (deflated 49%)
adding: lorem5.txt (deflated 49%)
在 Linux 中创建跨区 ZIP 文件
我们可能会避免通过 Internet 发送一个巨大的文件以节省带宽。相反,发送多个文件,以便在其他文件失败时至少部分文件可以通过。
我们可以尝试重新发送它们。ZIP 提供了将一个非常大的 zip 文件拆分为多个部分的选项,称为跨区存档。
要尝试一个示例,请查找一个大文件或使用随机数据创建一个文件,如下所示。
dd if=/dev/urandom of=frnd count=16384 bs=1024
这会在本地目录中生成一个名为 frnd
的 16 MB 文件。然后我们使用如图所示的 zip
命令将其拆分为 2 部分的 zip 文件,每部分 8 MB。
zip -r -s 8m rnd.zip frnd
这将生成两个名为 rnd.z01
和 rnd.z02
的 8 MB 文件以及一个名为 rnd.zip
的文件结尾 zip。最后一个是必要的,以指示解压缩
已达到文件结尾签名。
多个文件组成一个有效的 zip 存档以解压缩,将文件连接成一个 zip,然后解压缩结果。
cat rnd.z* > final.zip
unzip final.zip