如何使用 Python Pandas 库将 JSON 文件读取到 DataFrame 中?


JSON 代表 JavaScript 对象表示法,它以键值对的形式存储文本数据,这是一种人类可读的数据格式。这些 JSON 文件通常用于在网络上交换数据。JSON 对象用花括号({})括起来。JSON 的每个键值对之间用逗号隔开。

JSON 数据看起来非常类似于 Python 字典,但 JSON 是一种数据格式,而字典是一种数据结构。要将 JSON 文件读取到 Pandas DataFrame 中,我们在 Pandas 库中可以使用 **read_json** 方法。以下示例概述了如何将 JSON 文件读取到 Pandas DataFrame 中。

示例

将本地 JSON 文件读取到 Pandas DataFrame 中

#importing pandas package
import pandas as pd

# reading JSON file
df = pd.read_json('E:\iris.json')

# displaying sample output
df.sample(5)

解释

在上面的代码中,我们使用 pd.read_json 方法将本地 JSON 文件读取到 df 变量中,我们将 JSON 文件位置作为字符串传递给此方法。此方法会自动将 JSON 文件中的数据转换为 DataFrame。最初,我们将 Pandas 包导入为 pd。最后,在最后一行,我们显示了 DataFrame 中的 5 个示例行作为输出。

输出

    sepalLength   sepalWidth   petalLength    petalWidth    species
149     5.9          3.0          5.1           1.8         virginica
90      5.5          2.6          4.4           1.2         versicolor
56      6.3          3.3          4.7           1.6        versicolor
38 4.4 3.0 1.3 0.2 setosa
85 6.0 3.4 4.5 1.6 versicolor

Iris JSON 数据集/文件作为输入传递给 read_json 方法,此数据集具有 5 列和 150 行数据。在此输出块中,我们仅使用 df.sample() 方法显示了 5 行数据的示例。此方法随机返回 DataFrame 中的数据。

以同样的方式,我们可以读取远程 JSON 数据,方法是在文件路径的位置提及远程 URL。

示例

import pandas as pd

data = pd.read_json(
'http://universities.hipolabs.com/search?country=United+Kingdom')
print(data)

解释

在此示例中,我们使用了一个公共 HTTP API,该 API 以 JSON 格式保存数据。这里也使用 read_json 方法来读取此远程 URL JSON 数据。

输出


域名网页名称两位字母国家代码州/省国家
0[abdn.ac.UK, Aberdeen.ac.uk][www.abdn.ac.uk/]阿伯丁大学GBNaN英国
1[aber.ac.uk][www.aber.ac.uk/]威尔士阿伯里斯特威斯大学GBNaN英国
2[abertay.ac.uk][www.abertay.ac.uk/]邓迪阿伯泰大学GBNaN英国
3[aiuniv.edu][www.aiuniv.edu/]美国洲际大学 - 伦敦GBNaN英国
4[aku.edu][www.aku.edu/]阿迦汗大学GBNaN英国

此输出包含 read_json 方法返回的 4 行 JSON 数据示例,这些数据来自公共 URL,它有 171 行和 6 列。

更新于: 2021-11-18

2K+ 浏览量

开启你的 职业生涯

通过完成课程获得认证

立即开始
广告

© . All rights reserved.