找到关于 Pandas 的 507 篇文章

如何对 Pandas DataFrame 的多列进行排序?

Rishikesh Kumar Rishi
更新于 2021-08-30 12:21:38

898 次浏览

要对 Pandas DataFrame 的多列进行排序,可以使用 sort_values() 方法。步骤:创建一个二维的、大小可变的、可能异构的表格数据 df。打印输入 DataFrame df。初始化一个变量 col 来排序列。打印排序后的 DataFrame。示例 实时演示import pandas as pd df = pd.DataFrame(    {       "x": [5, 2, 7, 0],       "y": [4, 7, 5, 1],       "z": [9, 3, 5, 1]    } ) print "输入 DataFrame 为:", df col = ["x", "y"] df = df.sort_values(col, ascending=[False, True]) print "排序列 ", col, "后 DataFrame 为:", df输出输入 DataFrame 为:    x  y  z 0  5  4  9 1  2  7  3 2  7  5  5 3  0  1  1 排序列 ['x', 'y'] 后 DataFrame 为:    x  y  z 2  7  5  5 0  5  4  9 1  2  7  3 3  0  1  1

如何对 Pandas DataFrame 的一列进行排序?

Rishikesh Kumar Rishi
更新于 2021-08-30 12:20:01

374 次浏览

要对 Pandas DataFrame 中的一列进行排序,可以使用 sort_values() 方法。步骤:创建一个二维的、大小可变的、可能异构的表格数据 df。打印输入 DataFrame df。初始化一个变量 col 来排序列。打印排序后的 DataFrame。示例 实时演示import pandas as pd df = pd.DataFrame(    {      "x": [5, 2, 7, 0],      "y": [4, 10, 5, 1],     `"z": [9, 3, 5, 1]   } ) print "输入 DataFrame 为:", df col = "x" df = df[col].sort_values(ascending=False) print "排序列 ", col, "后 DataFrame 为:", df输出输入 DataFrame 为:    x  y  z 0  5  4  9 1  2 10  3 2  7  5  5 3  0  1  1 排序列 x 后 DataFrame 为: 2  7 0  5 1  2 3  0 Name: x, dtype: int64

如何在 Pandas 中对单列使用 apply() 函数?

Rishikesh Kumar Rishi
更新于 2021-08-30 12:15:24

16K+ 次浏览

可以使用 lambda 表达式在 DataFrame 的列上使用 apply() 函数。步骤:创建一个二维的、大小可变的、可能异构的表格数据 df。打印输入 DataFrame df。使用 lambda x: x*2 表达式通过 apply() 方法覆盖列 x。打印修改后的 DataFrame。示例 实时演示import pandas as pd df = pd.DataFrame(    {       "x": [5, 2, 1, 5],       "y": [4, 10, 5, 10],       "z": [1, 1, 5, 1]    } ) print "输入 DataFrame 为:", df df['x'] = df['x'].apply(lambda x: x * 2) print "应用乘以 2 后 DataFrame 为:", df输出输入 DataFrame 为:    x  y  z 0  5  4  1 1  2 10  1 2  1  5  5 3  5 10  1 应用乘以 2 后 DataFrame 为:     x  y   z 0  10  4   1 1   4 10   1 2   2  5   5 3  10 10   1

在 Pandas 中计算 DataFrame 列中值的频率

Rishikesh Kumar Rishi
更新于 2021-08-30 12:13:18

4K+ 次浏览

要计算 Pandas 中 DataFrame 列中值的频率,可以使用 df.groupby(列名).size() 方法。步骤:创建一个二维的、大小可变的、可能异构的表格数据 df。打印输入 DataFrame df。打印列 x 的频率。打印列 y 的频率。打印列 z 的频率。示例 实时演示import pandas as pd df = pd.DataFrame(    {       "x": [5, 2, 1, 5],       "y": [4, 10, 5, 10],       "z": [1, 1, 5, 1]    } ) print "输入 DataFrame 为:", df col = "x" count = df.groupby('x').size() print "列 ", col, "中值的频率,… 阅读更多

如何在 Pandas 中检查列是否存在?

Rishikesh Kumar Rishi
更新于 2021-08-30 12:11:12

9K+ 次浏览

要检查 Pandas DataFrame 中是否存在列,可以执行以下步骤:步骤:创建一个二维的、大小可变的、可能异构的表格数据 df。打印输入 DataFrame df。用列名初始化一个 col 变量。创建一个用户定义的函数 check() 来检查 DataFrame 中是否存在列。用有效的列名调用 check() 方法。用无效的列名调用 check() 方法。示例 实时演示import pandas as pd def check(col):    if col in df:       print "列", col, "存在于 DataFrame 中。"    else:       print "列", col, "不存在于 DataFrame 中。" df = pd.DataFrame( ... 阅读更多

如何在 Pandas DataFrame 中选择除一列之外的所有列?

Rishikesh Kumar Rishi
更新于 2023-09-13 15:54:47

34K+ 次浏览

要在 Pandas DataFrame 中选择除一列之外的所有列,可以使用 df.loc[:, df.columns != ]。步骤:创建一个二维的、大小可变的、可能异构的表格数据 df。打印输入 DataFrame df。用要排除的列名初始化一个变量 col。使用 df.loc[:, df.columns != col] 创建另一个不包含特定列的 DataFrame。打印不包含 col 列的 DataFrame。示例 实时演示import pandas as pd df = pd.DataFrame(    {       "x": [5, 2, 1, 9],       "y": [4, 1, 5, 10],       "z": [4, 1, 5, 0]    } ) print("输入 DataFrame 为:", df) col ... 阅读更多

如何从 Pandas DataFrame 的单元格中获取值?

Rishikesh Kumar Rishi
更新于 2023-09-14 01:23:02

36K+ 次浏览

要从 DataFrame 的单元格中获取值,可以使用索引和 col 变量。步骤:创建一个二维的、大小可变的、可能异构的表格数据 df。打印输入 DataFrame df。初始化索引变量。初始化 col 变量。获取对应于索引和 col 变量的单元格值。打印单元格值。示例 实时演示import pandas as pd df = pd.DataFrame(    {       "x": [5, 2, 1, 9],       "y": [4, 1, 5, 10],       "z": [4, 1, 5, 0]    } ) print("输入 DataFrame 为:", df) index = 2 col = "y" cell_val = df.iloc[index][col] print ... 阅读更多

如何在 Pandas DataFrame 的列中用零替换 NaN 值?

Rishikesh Kumar Rishi
更新于 2021-08-30 12:03:02

606 次浏览

要将 Pandas DataFrame 列中的 NaN 值替换为零或其他值,可以使用 df.fillna() 方法。步骤:创建一个二维的、大小可变的、可能异构的表格数据 df。打印输入 DataFrame df。使用 df.fillna(0) 将 DataFrame 中的 NaN 替换为值 0。同样,使用 df.fillna(5) 和 df.fillna(7) 将 DataFrame 中的 NaN 分别替换为 5 和 7。打印替换 NaN 后的 DataFrame。示例 实时演示import pandas as pd import numpy as np df = pd.DataFrame(    {       "x": [5, np.nan, 1, np.nan],       "y": [np.nan, 1, np.nan, 10],       "z": [np.nan, 1, np.nan, np.nan]    } ... 阅读更多

如何在 Pandas Series 的列中用零替换 NaN 值?

Rishikesh Kumar Rishi
更新于 2021-08-30 11:57:35

819 次浏览

为了用零或其他值替换 Pandas Series 列中的 NaN 值,我们可以使用 s.fillna() 方法。步骤创建一个具有轴标签(包括时间序列)的一维 ndarray。打印输入序列。使用 s.fillna(0) 将序列中的 NaN 替换为值 0。类似地,使用 s.fillna(5) 和 s.fillna(7) 将序列中的 NaN 分别替换为值 5 和 7。打印替换后的 NaN 序列。示例 在线演示导入 pandas as pd 导入 numpy as np s = pd.Series([1, np.nan, 3, np.nan, 3, np.nan, 7, np.nan, 3]) print "输入序列为:", s print "替换 NaN 为 0 后:", s.fillna(0) print "替换 NaN 为 5 后:", s.fillna(5) ... 阅读更多

在 Pandas 中创建具有自定义索引参数的 DataFrame

Rishikesh Kumar Rishi
更新于 2021年8月30日 11:51:23

2K+ 次浏览

要创建一个带有某些索引的 DataFrame,我们可以传递一个值列表并将它们分配到 DataFrame 类中的索引中。步骤创建一个二维、大小可变的、可能是非同质的表格数据 df。在 DataFrame 类的索引中放入一个索引列表。打印具有自定义索引的 DataFrame。示例 在线演示导入 pandas as pd df = pd.DataFrame(    {       "x": [5, 2, 1, 9],       "y": [4, 1, 5, 10],       "z": [4, 1, 5, 0]    } ) print "输入 DataFrame 为:", df df = pd.DataFrame(    {       "x": [5, 2, 1, 9],       "y": [4, 1, 5, 10],       "z": [4, 1, 5, 0]    },    index=["John", "Jacob", "Ally", "Simon"] ) print "带有自定义索引: ", df输出输入 DataFrame 为:    x  y  z 0  5  4  4 1  2  1  1 2  1  5  5 3  9  10  0 带有自定义索引:        x  y   z John   5  4   4 Jacob  2  1   1 Ally   1  5   5 Simon  9  10  0

广告