在 Python 中从 .dat 文件中读取特定列
Abdul Jabbar
2022年5月18日
在处理大数据时,我们有一个巨大的数据存储,在单个文件中包含多个数据。在许多处理大数据的情况下,我们对该文件中的所有列和行都不感兴趣。我们只需要该文件中的特定行和列即可继续满足业务需求。因此,在本文中,我们将学习从 .dat 文件
中提取特定列或行的方法。然而,在 Python 中有多种方法可以做到这一点,我们将在下面的示例中看到其中的一些。
正如我们已经知道的那样,.dat 文件包含有关任何域的通用数据。数据集由具有相同数据类型的任何类型的信息组成。这些格式最适合用于表示记录的集合或序列,其中每条记录都具有相同的字段列表。
在 Python 中从 .dat
文件读取特定列
假设我们有一个 .dat
文件,其中包含价格记录,我们想提取该特定列并对其进行一些分析。首先,我们必须使用 Python 内置的文件打开函数导入 .dat
文件。然后使用 split()
函数,我们将通过将其传递到 split() 函数参数中来提取所需的列。默认情况下,它会为我们提取整个列。然后我们将使用 Python 中的 print()
函数在屏幕上显示整列。
with open(r"airline.dat") as datFile:
print([data.split()[0] for data in datFile])
输出:
Year
1997
1999
1998
1996
Author: Abdul Jabbar
Abdul is a software engineer with an architect background and a passion for full-stack web development with eight years of professional experience in analysis, design, development, implementation, performance tuning, and implementation of business applications.
LinkedIn