將 JSON 轉換為 Pandas DataFrame

Manav Narula 2023年1月30日 2020年12月19日
  1. 使用 json_normalize() 將 JSON 轉換為 Pandas DataFrame
  2. 使用 read_json() 將 JSON 轉換為 Pandas DataFrame
將 JSON 轉換為 Pandas DataFrame

本文將介紹如何將 JSON 轉換為 Pandas DataFrame。

JSON 是 JavaScript Object Notation 的縮寫,它是基於 JavaScript 中物件的格式,是一種表示結構化資料的編碼技術。它是基於 JavaScript 中物件的格式,是一種表示結構化資料的編碼技術。目前,它被廣泛使用,特別是在伺服器和 Web 應用程式之間共享資料。

由於它的簡單性和受程式語言資料結構的影響,JSON 正變得非常流行。它比較容易理解,下面是一個簡單的 API 的 JSON 響應的例子。

{
"Results":
         [
         { "id": "01", "Name": "Jay" },
         { "id": "02", "Name": "Mark" },
         { "id": "03", "Name": "Jack" }
         ],
"status": ["ok"]
}

在我們的例子中可以看到,JSON 在某種程度上似乎是巢狀列表和字典的結合,因此,從 JSON 檔案中提取資料,甚至將其儲存為 Pandas DataFrame 是比較容易的。

Python 中的 Pandas 和 JSON 庫可以幫助實現這個功能。我們有兩個函式 read_json()json_normalize() 可以幫助將 JSON 字串轉換為 DataFrame。

使用 json_normalize() 將 JSON 轉換為 Pandas DataFrame

json_normalize() 函式被非常廣泛地用於讀取巢狀的 JSON 字串並返回一個 DataFrame。要使用這個函式,我們首先需要使用 Python 中 JSON 庫中的 json.loads() 函式來讀取 JSON 字串,然後我們將這個 JSON 物件傳遞給 json_normalize(),它將返回一個包含所需資料的 Pandas DataFrame。

import pandas as pd
import json
from pandas import json_normalize

data = '''
{
"Results":
         [
         { "id": "1", "Name": "Jay" },
         { "id": "2", "Name": "Mark" },
         { "id": "3", "Name": "Jack" }
         ],
"status": ["ok"]
}
    '''

info = json.loads(data)

df = json_normalize(info['Results']) #Results contain the required data
print(df)

輸出:

   id  Name
0  1   Jay
1  2  Mark
2  3  Jack

使用 read_json() 將 JSON 轉換為 Pandas DataFrame

另一個將 JSON 轉換為 DataFrame 的 Pandas 函式是 read_json(),用於簡單的 JSON 字串。我們可以直接將 JSON 檔案的路徑或 JSON 字串傳遞給函式,以便將資料儲存在 Pandas DataFrame 中。read_json() 有很多引數,其中 orient 指定 JSON 字串的格式。

缺點是它很難與巢狀的 JSON 字串一起使用。因此,為了使用 read_json(),我們將使用一個簡單得多的例子,如下所示。

import pandas as pd

data = '''
          {
              "0":{
                  "Name": "Jay",
                  "Age": "17"
              },
              "1":{
                  "Name": "Mark",
                  "Age": "15"
              },
              "2":{
                  "Name": "Jack",
                  "Age":"16"
              }
          }
    '''

df = pd.read_json(data, orient ='index')
print(df)

輸出:

   Name  Age
0   Jay   17
1  Mark   15
2  Jack   16

我們將 orient 設定為 'index',因為 fromat 的 JSON 字串匹配的模式是 {index : {column: value}}

Author: Manav Narula
Manav Narula avatar Manav Narula avatar

Manav is a IT Professional who has a lot of experience as a core developer in many live projects. He is an avid learner who enjoys learning new things and sharing his findings whenever possible.

LinkedIn

相關文章 - Pandas DataFrame

相關文章 - Pandas JSON