計算 R 中的行數
Manav Narula
2023年1月30日
2021年1月4日
在現實生活中的例子中,我們會遇到包含成百上千行和列的大型資料集。為了處理這樣大塊的資料,我們需要熟悉行、列和資料型別。
本教程將介紹如何在 R 中按組計算行數。
在 R 中使用 data.frame(table())
函式計算行數
data.frame(table())
函式建立了一個包含不同因子值計數的表格。它計算一列的總唯一行數。我們可以很容易地將 DataFrame 所需的列傳遞給函式。下面的程式碼片段將解釋具體如何來做。
df <- data.frame(Name = c("Jack","Jay","Mark","Sam"),
Month = c("Jan","Jan","May","July"),
Age = c(12,10,15,13))
data.frame(table(df$Month))
輸出:
Var1 Freq
1 Jan 2
2 July 1
3 May 1
使用 count()
函式計算 R 中的行數
R 中的 plyr
庫執行基本的資料處理任務,如拆分資料、執行一些函式,然後再合併。它有一個函式 count()
,可以返回一個 DataFrame 的唯一行的頻率。我們必須傳遞 DataFrame 和列名作為其引數,如下所示。
df <- data.frame(Name = c("Jack","Jay","Mark","Sam"),
Month = c("Jan","Jan","May","July"),
Age = c(12,10,15,13))
library(plyr)
count(df, "Month")
輸出:
Month freq
1 Jan 2
2 July 1
3 May 1
使用 ddply()
函式來計算 R 中的行數
plyr
庫中提供的另一個有趣的函式是 ddply()
函式。它將資料分割成一個子集,指定一些要應用於資料的函式,並將結果合併。在下面的例子中,我們將把 DataFrame 和列名傳給函式和 nrow
函式作為引數。
df <- data.frame(Name = c("Jack","Jay","Mark","Sam"),
Month = c("Jan","Jan","May","July"),
Age = c(12,10,15,13))
library(plyr)
ddply(df, .(Month), nrow)
輸出:
Month V1
1 Jan 2
2 July 1
3 May 1
Author: Manav Narula
Manav is a IT Professional who has a lot of experience as a core developer in many live projects. He is an avid learner who enjoys learning new things and sharing his findings whenever possible.
LinkedIn