如何使用 Python Pandas 库将 JSON 文件读取到 DataFrame 中?
JSON 代表 JavaScript 对象表示法,它以键值对的形式存储文本数据,这是一种人类可读的数据格式。这些 JSON 文件通常用于在网络上交换数据。JSON 对象用花括号({})括起来。JSON 的每个键值对之间用逗号隔开。
JSON 数据看起来非常类似于 Python 字典,但 JSON 是一种数据格式,而字典是一种数据结构。要将 JSON 文件读取到 Pandas DataFrame 中,我们在 Pandas 库中可以使用 **read_json** 方法。以下示例概述了如何将 JSON 文件读取到 Pandas DataFrame 中。
示例
将本地 JSON 文件读取到 Pandas DataFrame 中
#importing pandas package
import pandas as pd
# reading JSON file
df = pd.read_json('E:\iris.json')
# displaying sample output
df.sample(5)解释
在上面的代码中,我们使用 pd.read_json 方法将本地 JSON 文件读取到 df 变量中,我们将 JSON 文件位置作为字符串传递给此方法。此方法会自动将 JSON 文件中的数据转换为 DataFrame。最初,我们将 Pandas 包导入为 pd。最后,在最后一行,我们显示了 DataFrame 中的 5 个示例行作为输出。
输出
sepalLength sepalWidth petalLength petalWidth species 149 5.9 3.0 5.1 1.8 virginica 90 5.5 2.6 4.4 1.2 versicolor 56 6.3 3.3 4.7 1.6 versicolor 38 4.4 3.0 1.3 0.2 setosa 85 6.0 3.4 4.5 1.6 versicolor
Iris JSON 数据集/文件作为输入传递给 read_json 方法,此数据集具有 5 列和 150 行数据。在此输出块中,我们仅使用 df.sample() 方法显示了 5 行数据的示例。此方法随机返回 DataFrame 中的数据。
以同样的方式,我们可以读取远程 JSON 数据,方法是在文件路径的位置提及远程 URL。
示例
import pandas as pd data = pd.read_json( 'http://universities.hipolabs.com/search?country=United+Kingdom') print(data)
解释
在此示例中,我们使用了一个公共 HTTP API,该 API 以 JSON 格式保存数据。这里也使用 read_json 方法来读取此远程 URL JSON 数据。
输出
| 域名 | 网页 | 名称 | 两位字母国家代码 | 州/省 | 国家 | |
|---|---|---|---|---|---|---|
| 0 | [abdn.ac.UK, Aberdeen.ac.uk] | [www.abdn.ac.uk/] | 阿伯丁大学 | GB | NaN | 英国 |
| 1 | [aber.ac.uk] | [www.aber.ac.uk/] | 威尔士阿伯里斯特威斯大学 | GB | NaN | 英国 |
| 2 | [abertay.ac.uk] | [www.abertay.ac.uk/] | 邓迪阿伯泰大学 | GB | NaN | 英国 |
| 3 | [aiuniv.edu] | [www.aiuniv.edu/] | 美国洲际大学 - 伦敦 | GB | NaN | 英国 |
| 4 | [aku.edu] | [www.aku.edu/] | 阿迦汗大学 | GB | NaN | 英国 |
此输出包含 read_json 方法返回的 4 行 JSON 数据示例,这些数据来自公共 URL,它有 171 行和 6 列。
数据结构
网络
关系型数据库管理系统
操作系统
Java
iOS
HTML
CSS
Android
Python
C 编程
C++
C#
MongoDB
MySQL
Javascript
PHP