366 次浏览
在 python pandas 中(版本 1.0.0 到最新版本 1.2.4)存储文本数据有两种方法。就此而言,我们可以说 pandas 文本数据有两种数据类型,分别是 object 和 StringDtype。在旧版本的 pandas(1.0)中,只有 object dtype 可用,在新版本的 pandas 中,建议使用 StringDtype 来存储所有文本数据。为了克服使用 object dtype 的一些缺点,在 pandas 1.0 版本中引入了 StringDtype。但是,我们仍然可以使用 object 和 StringDtype 来存储文本数据。让我们举个例子,在其中使用… 阅读更多
2K+ 次浏览
JSON 代表 JavaScript 对象表示法,它以键值对的形式存储文本数据,这是一种人类可读的数据格式。这些 JSON 文件通常用于在 Web 上交换数据。JSON 对象用花括号({})表示。JSON 的每个键值对用逗号分隔。JSON 数据看起来非常类似于 python 字典,但 JSON 是一种数据格式,而字典是一种数据结构。要将 JSON 文件读取到 pandas DataFrame 中,我们在 pandas 库中可以使用 read_json 方法。以下示例将为您提供… 阅读更多
DataFrame 是一种二维 pandas 数据结构,用于以行和列格式表示表格数据。我们可以使用 python 字典列表创建 pandas DataFrame 对象。如果我们使用字典作为 DataFrame 函数的数据,则无需显式指定列名。在这里,我们将使用字典列表创建 DataFrame,在以下示例中。示例# 创建字典列表 li = [{'i': 10, 'j': 20, 'k': 30}, {'i': 8, 'j': 40, 'k': 60}, {'i': 6, 'j': 60, 'k': 90}] # 创建 dataframe df = pd.DataFrame(l, ... 阅读更多
632 次浏览
Pandas 系列有一个用于计算系列元素绝对值的方法。该函数也可用于计算包含复数的系列的绝对值。pandas 系列中的 abs() 方法将返回一个新系列,其中包含包含复数的系列的计算绝对值。复数的绝对值为 $\sqrt{a^{2}+b^{2}}$,其中 a 是复数的实数值,b 是复数的虚数值。示例# 导入 pandas 包 import pandas as pd # 创建一个包含空数据的系列 s_obj = pd.Series([2.5 + 3j, -1 - 3.5j, 9 ... 阅读更多
265 次浏览
pandas 系列的 abs 函数将返回一个包含每个元素的绝对数值的系列。此 abs 函数将计算系列中每个元素的绝对值。此函数仅适用于系列对象,前提是它仅包含数字元素。它不适用于任何缺失元素(NaN 值),并且可用于计算复数的绝对值。示例import pandas as pd # 创建一个系列 s = pd.Series([-3.43, -6, 21, 6, 1.4]) print(s, end='') # 计算绝对值 result = s.abs() # 打印结果 print(result)说明我们有一个简单的… 阅读更多
421 次浏览
pandas 系列中的 head() 方法用于从系列对象中检索最顶部的行。默认情况下,它将显示系列数据的 5 行,我们可以自定义 5 行以外的行数。此方法将整数值作为参数来返回具有这些行数的系列,假设您将整数 n 作为参数传递给 head 方法,例如 head(n),那么它将返回一个具有 n 个元素的 pandas 系列。这些元素是我们 pandas 系列对象的最初 n 个元素。示例# 导入所需… 阅读更多
954 次浏览
Pandas 系列是一种一维 ndarray 类型对象,它存储带有标签的元素,这些标签用于寻址 pandas 系列中存在的元素。标签用整数、字符串、DateTime 等表示。在这里,我们将了解如果索引用 DateTime 值标记,如何访问系列元素。示例import pandas as pd # 创建日期 date = pd.date_range("2021-01-01", periods=5, freq="D") # 使用日期索引创建 pandas 系列 series = pd.Series(range(10, len(date)+10), index=date) print(series) print('') # 获取元素 print(series['2021-01-01'])说明变量 date 存储长度为 5 的日期列表,起始日期… 阅读更多
9K+ 次浏览
pandas 系列保存带标签的数据,通过使用这些标签,我们可以访问系列元素,并且可以对我们的数据进行操作。但是,在某些情况下,我们需要分别获取所有标签和值。标签可以称为索引,系列中存在的数据称为值。如果要单独获取标签和值。然后我们可以使用 Series 对象的 index 和 values 属性。让我们举个例子,看看这些属性是如何工作的。示例import pandas as pd # 创建一个系列 s = pd.Series({97:'a', 98:'b', 99:'c', 100:'d', 101:'e', 102:'f'}) print(s) # 获取… 阅读更多
847 次浏览
Pandas 系列可以通过不同的方式创建,在这里我们将了解如何使用 python 列表创建 pandas 系列对象。要创建 pandas 系列,我们有来自 pandas 功能的 pandas.Series() 函数。让我们举个例子,并使用 python 列表创建一个简单的 pandas 系列。为了从 python 列表创建 pandas 系列,首先我们需要定义一个 python 列表对象。示例import pandas as pd # 定义一个列表 list_of_values = [2, 89, 34, 78, 3] # 创建系列 s = pd.Series(list_of_values) print(s)说明在上面的代码中,我们使用… 阅读更多
1K+ 次浏览
NumPy 和 pandas 都是数据科学和机器学习技术必不可少的工具。我们知道 pandas 提供类似 SQL 表的 DataFrame,允许您进行表格数据分析,而 NumPy 非常高效地运行向量和矩阵运算。pandas 提供了许多 C 或 Cython 优化函数,这些函数可能比 NumPy 等效函数更快(例如,从文本文件读取文本)。如果您想进行数学运算,例如点积、计算平均值等等,pandas DataFrame 通常会比 NumPy 数组慢。因为 pandas 正在做更多的事情,例如对齐… 阅读更多