Pandas DataFrame DataFrame.to_csv() 函数

Minahil Noor 2023年1月30日 2020年11月7日
  1. pandas.DataFrame.to_csv() 语法
  2. 示例代码:DataFrame.to_csv()
  3. 示例代码:DataFrame.to_csv() 为 CSV 数据指定分隔符
  4. 示例代码:DataFrame.to_csv() 选择少数几列并重新命名列
Pandas DataFrame DataFrame.to_csv() 函数

Python Pandas DataFrame.to_csv() 函数将一个 DataFrame 的行和列所包含的值保存到一个 CSV 文件中。我们也可以将 DataFrame 转换为 CSV 字符串。

pandas.DataFrame.to_csv() 语法

DataFrame.to_csv(path_or_buf= None,
                 sep= ",",
                 na_rep= "",
                 float_format= None,
                 columns= None,
                 header= True,
                 index= True,
                 index_label= None,
                 mode= "w",
                 encoding= None,
                 compression= "infer",
                 quoting= None,
                 quotechar= '""',
                 line_terminator= None,
                 chunksize= None,
                 date_format= None,
                 doublequote= True,
                 escapechar= None,
                 decimal= "."
                 ) 

参数

这个函数有几个参数。上面提到了所有参数的默认值。

path_or_buf 它是一个字符串或文件句柄。它代表一个文件或一个文件对象的名称。如果它的值是 None,那么 DataFrame 将被转换为 CSV “string”。
sep 它是一 Series 个字符串。它代表 CSV 文件中使用的分隔符。
na_rep 它是一个字符串。它代表缺失的数据。
float_format 它是一个字符串。它表示浮点数的格式。
columns 它是一个 Series。它表示将保存在 CSV 文件中的 DataFrame 的列。
header 它是一个布尔值或一个字符串列表。如果它的值被设置为 False,那么列名就不会保存在 CSV 文件中。如果传递一个字符串列表,那么这些字符串将作为列名保存。
index 它是一个布尔值,如果它的值是 True,则保存行名,即索引。如果它的值为 True,那么行名即索引将被保存。
index_label 它是一个字符串或 Series。它代表一个特定索引的列名。
mode 它是一个字符串。它代表进程的模式。由于我们正在将 DataFrame 写入 CSV 文件,它的值是 Python 写入模式 w
encoding 它是一个字符串。它代表 CSV 文件中要使用的编码方案,默认的编码方案是 utf-8。默认的编码方案是 utf-8
compression 它是一个字符串或字典。如果是字符串,则代表压缩模式。如果它是一个字典,那么 method 键对应的值代表压缩模式。它有几种压缩模式。你可以查看这里
quoting 它代表一个 CSV 模块的常量
quotechar 它是一个字符串,长度为 1。它的长度为 1,表示用于引用字段的字符。
line_terminator 它是一个字符串。它代表 CSV 文件中新行的字符。
chunksize 它是一个整数。它表示每次要写入 CSV 文件的行数。
date_format 它是一个字符串。它代表 DateTime 对象的格式。
doublequote 它是一个布尔值。它控制 quotechar 的引用。
escapechar 它是一个字符串,长度为 1。它的长度为 1,代表用于转义的 sepquotechar 的字符。
decimal 它是一个字符串。它代表小数点的字符。

返回值

它返回 None 或字符串。如果 path_or_bufNone,那么它将 DataFrame 转换为字符串并返回字符串。否则,它返回 None

示例代码:DataFrame.to_csv()

在接下来的几个代码中,我们将以不同的方式实现这个函数。

import pandas as pd

dataframe=pd.DataFrame({
                        'Attendance': 
                            {0: 60, 
                            1: 100, 
                            2: 80,
                            3: 78,
                            4: 95},
                        'Name': 
                            {0: 'Olivia', 
                            1: 'John', 
                            2: 'Laura',
                            3: 'Ben',
                            4: 'Kevin'},
                        'Obtained Marks': 
                            {0: 90, 
                            1: 75, 
                            2: 82, 
                            3: 64, 
                            4: 45}
                        })

print(dataframe)

示例 DataFrame 是:

   Attendance    Name  Obtained Marks
0          60  Olivia              90
1         100    John              75
2          80   Laura              82
3          78     Ben              64
4          95   Kevin              45

这个函数的所有参数都是可选的。如果我们在执行这个函数时不传递任何参数,那么它将产生以下输出。

import pandas as pd

dataframe=pd.DataFrame({
                        'Attendance': 
                            {0: 60, 
                            1: 100, 
                            2: 80,
                            3: 78,
                            4: 95},
                        'Name': 
                            {0: 'Olivia', 
                            1: 'John', 
                            2: 'Laura',
                            3: 'Ben',
                            4: 'Kevin'},
                        'Obtained Marks': 
                            {0: 90, 
                            1: 75, 
                            2: 82, 
                            3: 64, 
                            4: 45}
                        })

csvstring = dataframe.to_csv()
print(csvstring)

输出:

,Attendance,Name,Obtained Marks
0,60,Olivia,90
1,100,John,75
2,80,Laura,82
3,78,Ben,64
4,95,Kevin,45

该函数使用所有默认值生成了输出。它返回了一个 CSV 字符串。现在我们将把数据保存在 CSV 文件中。

import pandas as pd

dataframe=pd.DataFrame({
                        'Attendance': 
                            {0: 60, 
                            1: 100, 
                            2: 80,
                            3: 78,
                            4: 95},
                        'Name': 
                            {0: 'Olivia', 
                            1: 'John', 
                            2: 'Laura',
                            3: 'Ben',
                            4: 'Kevin'},
                        'Obtained Marks': 
                            {0: 90, 
                            1: 75, 
                            2: 82, 
                            3: 64, 
                            4: 45}
                        })

returnValue = dataframe.to_csv('myfile.csv')
print(returnValue)

输出:

None

函数在保存程序的目录下创建了一个新的 CSV 文件。

示例代码:DataFrame.to_csv() 为 CSV 数据指定分隔符

import pandas as pd

dataframe=pd.DataFrame({
                        'Attendance': 
                            {0: 60, 
                            1: 100, 
                            2: 80,
                            3: 78,
                            4: 95},
                        'Name': 
                            {0: 'Olivia', 
                            1: 'John', 
                            2: 'Laura',
                            3: 'Ben',
                            4: 'Kevin'},
                        'Obtained Marks': 
                            {0: 90, 
                            1: 75, 
                            2: 82, 
                            3: 64, 
                            4: 45}
                        })

returnValue = dataframe.to_csv(sep= '@')
print(returnValue)

输出:

@Attendance@Name@Obtained Marks

0@60@Olivia@90

1@100@John@75

2@80@Laura@82

3@78@Ben@64

4@95@Kevin@45

示例代码:DataFrame.to_csv() 选择少数几列并重新命名列

import pandas as pd

dataframe=pd.DataFrame({
                        'Attendance': 
                            {0: 60, 
                            1: 100, 
                            2: 80,
                            3: 78,
                            4: 95},
                        'Name': 
                            {0: 'Olivia', 
                            1: 'John', 
                            2: 'Laura',
                            3: 'Ben',
                            4: 'Kevin'},
                        'Obtained Marks': 
                            {0: 90, 
                            1: 75, 
                            2: 82, 
                            3: 64, 
                            4: 45}
                        })

returnValue = dataframe.to_csv(
                                'myfile.csv', 
                                columns=['Name', 'Obtained Marks'], 
                                header=['Full Name', 'Marks'])
print(returnValue)

输出:

None

Pandas DataFrame to_csv.png

就像上面的代码一样,我们可以使用不同的参数来定制我们的 CSV 文件。这个函数提供了几个参数来使用。

相关文章 - Pandas DataFrame