计算 R 中的行数
Manav Narula
2023年1月30日
2021年1月4日
在现实生活中的例子中,我们会遇到包含成百上千行和列的大型数据集。为了处理这样大块的数据,我们需要熟悉行、列和数据类型。
本教程将介绍如何在 R 中按组计算行数。
在 R 中使用 data.frame(table())
函数计算行数
data.frame(table())
函数创建了一个包含不同因子值计数的表格。它计算一列的总唯一行数。我们可以很容易地将 DataFrame 所需的列传递给函数。下面的代码片段将解释具体如何来做。
df <- data.frame(Name = c("Jack","Jay","Mark","Sam"),
Month = c("Jan","Jan","May","July"),
Age = c(12,10,15,13))
data.frame(table(df$Month))
输出:
Var1 Freq
1 Jan 2
2 July 1
3 May 1
使用 count()
函数计算 R 中的行数
R 中的 plyr
库执行基本的数据处理任务,如拆分数据、执行一些函数,然后再合并。它有一个函数 count()
,可以返回一个 DataFrame 的唯一行的频率。我们必须传递 DataFrame 和列名作为其参数,如下所示。
df <- data.frame(Name = c("Jack","Jay","Mark","Sam"),
Month = c("Jan","Jan","May","July"),
Age = c(12,10,15,13))
library(plyr)
count(df, "Month")
输出:
Month freq
1 Jan 2
2 July 1
3 May 1
使用 ddply()
函数来计算 R 中的行数
plyr
库中提供的另一个有趣的函数是 ddply()
函数。它将数据分割成一个子集,指定一些要应用于数据的函数,并将结果合并。在下面的例子中,我们将把 DataFrame 和列名传给函数和 nrow
函数作为参数。
df <- data.frame(Name = c("Jack","Jay","Mark","Sam"),
Month = c("Jan","Jan","May","July"),
Age = c(12,10,15,13))
library(plyr)
ddply(df, .(Month), nrow)
输出:
Month V1
1 Jan 2
2 July 1
3 May 1
Author: Manav Narula
Manav is a IT Professional who has a lot of experience as a core developer in many live projects. He is an avid learner who enjoys learning new things and sharing his findings whenever possible.
LinkedIn