Pandas read_csv()函数

Suraj Joshi 2023年1月30日

Pandas Pandas Core

pandas.read_csv() 语法
示例代码：Pandas 使用 pandas.read_csv() 函数读取 CSV 文件
示例代码：在 pandas.read_csv() 函数中设置 usecols 参数
示例代码：带有表头的 pandas.read_csv() 函数
示例代码: 具有跳行的 pandas.read_csv() 函数

Pandas read_csv() 方法将指定的 CSV 文件读取到 DataFrame 中。

`pandas.read_csv()` 语法

pandas.read_csv(filepath_or_buffer: Union[str, pathlib.Path, IO[~ AnyStr]],
                sep=',',
                delimiter=None,
                header='infer',
                names=None,
                index_col=None,
                usecols=None,
                squeeze=False,
                prefix=None,
                mangle_dupe_cols=True,
                dtype=None,
                engine=None,
                converters=None,
                true_values=None,
                false_values=None,
                skipinitialspace=False,
                skiprows=None,
                skipfooter=0,
                nrows=None,
                na_values=None,
                keep_default_na=True,
                na_filter=True,
                verbose=False,
                skip_blank_lines=True,
                parse_dates=False,
                infer_datetime_format=False,
                keep_date_col=False,
                date_parser=None,
                dayfirst=False,
                cache_dates=True,
                iterator=False,
                chunksize=None,
                compression='infer',
                thousands=None,
                decimal: str='.',
                lineterminator=None,
                quotechar='"',
                quoting=0,
                doublequote=True,
                escapechar=None,
                comment=None,
                encoding=None,
                dialect=None,
                error_bad_lines=True,
                warn_bad_lines=True,
                delim_whitespace=False,
                low_memory=True,
                memory_map=False,
                float_precision=None)

参数


`filepath_or_buffer`	要导入的 CSV 文件的位置
`delimiter`	用于解析 CSV 文件内容的定界符
`usecols`	从 CSV 文件中形成 `DataFrame` 时，只包含列名。
`header`	哪一行/几行作为标题的列名
`squeeze`	如果解析的数据只包含一列，则返回 Pandas `Series`。
`skiprows`	跳过哪一行/几行

返回值

由带有标签轴的 CSV 文件形成的 Dataframe。

示例代码：Pandas 使用 `pandas.read_csv()` 函数读取 `CSV` 文件

import pandas as pd
df = pd.read_csv("dataset.csv")
print(df)

输出：

       Country      Item Type Sales Channel Order Priority
0       Tuvalu      Baby Food       Offline              H
1   East Timor           Meat        Online              L
2       Norway      Baby Food        Online              L
3     Portugal      Baby Food        Online              H
4     Honduras         Snacks        Online              L
5  New Zealand         Fruits        Online              H
6     Moldova   Personal Care        Online              L

该方法将 CSV 文件加载到 DataFrame 中。在这里，我们可以使用绝对路径和相对路径来提供一个文件路径作为 pandas.read_csv() 函数的参数。

在这种情况下，dataset.csv 与程序文件在同一目录下，这意味着可以使用 CSV 文件名作为文件路径。

示例代码：在 `pandas.read_csv()` 函数中设置 `usecols` 参数

import pandas as pd
df = pd.read_csv("dataset.csv",usecols=["Country","Sales Channel","Order Priority"])
print(df)

输出：

       Country Sales Channel Order Priority
0       Tuvalu       Offline              H
1   East Timor        Online              L
2       Norway        Online              L
3     Portugal        Online              H
4     Honduras        Online              L
5  New Zealand        Online              H
6     Moldova         Online              L

该案例通过只在 usecols 参数中包含指定的列，将 CSV 文件加载到 DataFrame 中。

Country，Sales Channel 和 Order Priority 这几列只作为参数传递，所以它们只被包含在 DataFrame 中。

示例代码：带有表头的 `pandas.read_csv()` 函数

import pandas as pd
df = pd.read_csv("dataset.csv",header=1)
print(df)

输出：

        Tuvalu      Baby Food Offline  H
0   East Timor           Meat  Online  L
1       Norway      Baby Food  Online  L
2     Portugal      Baby Food  Online  H
3     Honduras         Snacks  Online  L
4  New Zealand         Fruits  Online  H
5     Moldova   Personal Care  Online  L

该过程通过将第 1 行设置为 header，将 CSV 文件加载到 DataFrame 中。

这里，第 1 行元素作为整个 DataFrame 的列名。

示例代码: 具有跳行的 `pandas.read_csv()` 函数

import pandas as pd
df = pd.read_csv("dataset.csv",skiprows=3)
print(df)

输出：

        Norway      Baby Food  Online  L
0     Portugal      Baby Food  Online  H
1     Honduras         Snacks  Online  L
2  New Zealand         Fruits  Online  H
3     Moldova   Personal Care  Online  L

这个过程通过跳过前 3 行将 CSV 文件加载到 DataFrame 中。

作者： Suraj Joshi

Suraj Joshi is a backend software engineer at Matrice.ai.

pandas.read_csv() 语法

参数

返回值

示例代码：Pandas 使用 pandas.read_csv() 函数读取 CSV 文件

示例代码：在 pandas.read_csv() 函数中设置 usecols 参数

示例代码：带有表头的 pandas.read_csv() 函数

示例代码: 具有跳行的 pandas.read_csv() 函数

相关文章 - Pandas Core

`pandas.read_csv()` 语法

示例代码：Pandas 使用 `pandas.read_csv()` 函数读取 `CSV` 文件

示例代码：在 `pandas.read_csv()` 函数中设置 `usecols` 参数

示例代码：带有表头的 `pandas.read_csv()` 函数

示例代码: 具有跳行的 `pandas.read_csv()` 函数