追加到 Pandas 中的空 DataFrame
- 在 Pandas 中创建一个空 DataFrame 并添加行和列
- 将行附加到具有 Pandas 列的空 DataFrame
-
使用 Pandas 中的
.loc()
函数创建一个空 DataFrame,包括带有索引的列和附加行
正如我们之前所了解的,Python 中的 Pandas 是一个开源模块,我们可以使用它进行数据分析和制作机器学习模型。它与另一个名为 Numpy
的包一起使用,因为它们携手支持多维数组。
许多数据科学模块可以与 Python 生态系统中的 Pandas 一起使用。我们将学习在 Pandas 中附加到空 DataFrame 的不同操作。
DataFrame 是表格形式的二维和潜在的异构数据。
本教程教授如何使用 Python 在 Pandas 的空 DataFrame 中添加行和列。我们将研究三种不同的方法来向空 DataFrame 添加数据,因为有多种方法。
在 Pandas 中创建一个空 DataFrame 并添加行和列
下面是导入所需包、制作空 DataFrame 和附加列的代码。
# import pandas library as pd
import pandas as pd
# create an Empty DataFrame object
df = pd.DataFrame()
print(df)
# append columns to an empty DataFrame
df['Name'] = ['Preet', 'Parin', 'Rajesh']
df['Articles'] = [97, 600, 200]
df['Improved'] = [2200, 75, 100]
print(df)
上述代码片段的输出如下。
Empty DataFrame
Columns: []
Index: []
Name Articles Improved
0 Preet 97 2200
1 Parin 600 75
2 Rajesh 200 100
在我们添加列和行之前,DataFrame 是空的。因此,打印空 DataFrame 为我们提供了输出 Empty DataFrame, Columns: [], Index: []
作为输出,这是预期的,因为数据为空。
将行附加到具有 Pandas 列的空 DataFrame
在这个方法中,DataFrame 是空的,但是会有预定义的列名,我们唯一的任务就是在它下面的行中插入数据。
下面是上述方法的代码,我们最初导入库 Pandas,创建一个包含列的 DataFrame,然后以行的形式附加值。
# import pandas library as pd
import pandas as pd
# create an Empty DataFrame
# object With column names only
df = pd.DataFrame(columns = ['Name', 'Articles', 'Improved'])
print(df)
# append rows to an empty DataFrame
df = df.append({'Name' : 'Preet', 'Articles' : 97, 'Improved' : 2200},
ignore_index = True)
df = df.append({'Name' : 'Parin', 'Articles' : 30, 'Improved' : 50},
ignore_index = True)
df = df.append({'Name' : 'Rajesh', 'Articles' : 17, 'Improved' : 220},
ignore_index = True)
print(df)
该代码将为我们提供以下输出。
Empty DataFrame
Columns: [Name, Articles, Improved]
Index: []
Name Articles Improved
0 Preet 97 2200
1 Parin 30 50
2 Rajesh 17 220
正如我们所看到的,由于我们已经在 DataFrame 中添加了列的名称,因此输出由 Columns: [Name, Articles, Improvement]
组成,它是数组中的列名称。
以下输出是因为我们使用了 .append()
函数。
使用 Pandas 中的 .loc()
函数创建一个空 DataFrame,包括带有索引的列和附加行
Pandas 中的 .loc()
方法可帮助用户轻松地从 DataFrame 中检索值,而不会带来任何复杂性。可以根据函数中传递的索引值访问特定行和列中的值。
在这种方法中,我们将创建一个空的 DataFrame 和列名。将使用索引来识别每一列来访问它。
接下来我们将一个接一个地追加行。
下面给出了证明这种方法的代码。
# import pandas library as pd
import pandas as pd
# create an Empty DataFrame object With
# column names and indices
df = pd.DataFrame(columns = ['Name', 'Articles', 'Improved'],
index = ['a', 'b', 'c'])
print("Empty DataFrame With NaN values : \n\n", df)
# adding rows to an empty
# dataframe at existing index
df.loc['a'] = ['Preet', 50, 100]
df.loc['b'] = ['Parin', 60, 120]
df.loc['c'] = ['Rajesh', 30, 60]
print(df)
上面给出的代码的输出如下。
Empty DataFrame With NaN values :
Name Articles Improved
a NaN NaN NaN
b NaN NaN NaN
c NaN NaN NaN
Name Articles Improved
a Preet 50 100
b Parin 60 120
c Rajesh 30 60
正如我们所观察到的,第一个表中的 NaN
值是因为我们提到了索引,但这些值仍然为空。
提供索引的数量会将表绑定到该特定实例的那么多值。增加索引的数量允许插入更多的值。
因此,在本教程中,我们学习了在 Pandas 中将值附加到 DataFrame 的三种不同方法。