找到 507 篇文章 关于 Pandas

编写 Python 代码以查找两个数据框的交叉表

Vani Nalliappan
更新于 2021 年 2 月 25 日 05:59:10

487 次查看

假设您有两个数据框,交叉表的结果为:年龄 12 13 14 分数 80 90 85 ID 1 1 0 0 2 0 1 0 3 1 0 0 4 0 1 0 5 0 0 1解决方案要解决此问题,我们将遵循以下步骤:定义两个数据框在索引中应用 df.crosstab() 函数作为“ID”,在列中作为“年龄”和“分数”。它定义如下:pd.crosstab(index=df['Id'],columns=[df['Age'],df1['Mark']])示例import pandas as pd df = pd.DataFrame({'Id':[1,2,3,4,5],'Age':[12,13,12,13,14]}) df1 = pd.DataFrame({'Mark':[80,90,80,90,85]}) print(pd.crosstab(index=df['Id'],columns=[df['Age'],df1['Mark']]))输出年龄 12 13 14 分数 80 90 85 ID 1 1 0 0 2 0 1 0 3 1 0 0 4 0 1 0 5 0 0 1

编写 Python 程序以使用 applymap 打印数据框中所有列中元素的长度

Vani Nalliappan
更新于 2021 年 2 月 25 日 05:58:11

309 次查看

数据框中所有列中元素的长度结果为:数据框为: 水果 城市 0 苹果 西姆拉 1 橙子 悉尼 2 芒果 勒克瑙 3 奇异果 惠灵顿所有列中元素的长度 水果 城市 0 5 6 1 6 6 2 5 7 3 4 10解决方案要解决此问题,我们将遵循以下步骤:定义一个数据框在 lambda 函数内使用 df.applymap 函数计算所有列中元素的长度,如 df.applymap(lambda x:len(str(x)))示例让我们检查以下代码以获取... 阅读更多

编写 Python 代码以计算前 2 个和后 2 个值的 ID 和年龄列之间的百分比变化

Vani Nalliappan
更新于 2021 年 2 月 25 日 05:55:54

318 次查看

假设,您有数据框,并且 ID 和年龄列的前 2 个和后 2 个值之间的百分比变化结果为ID 和年龄 - 前 2 个值 ID 年龄 0 NaN NaN 1 1.0 0.0 ID 和年龄 - 后 2 个值 ID 年龄 3 0.000000 -0.071429 4 0.666667 0.000000解决方案要解决此问题,我们将遵循以下步骤:定义一个数据框在切片 [0:2] 中应用 df[[‘Id’, ’Age’]].pct_change() df[['Id', 'Age']].pct_change()[0:2]在切片 [-2:] 中应用 df[[‘Id’, ’Age’]].pct_change() df[['Id', 'Age']].pct_change()[0:2]示例让我们检查以下代码以更好地理解:import pandas as pd df = pd.DataFrame({"Id":[1, 2, 3, None, 5], ... 阅读更多

编写 Python 程序以在数据框中执行表级管道函数

Vani Nalliappan
更新于 2021 年 2 月 25 日 05:48:54

168 次查看

假设,您有一个数据框,并且表级函数的结果为:表级函数: ID 分数 0 6.0 85.0 1 7.0 95.0 2 8.0 75.0 3 9.0 90.0 4 10.0 95.0解决方案要解决此问题,我们将遵循以下步骤:定义一个数据框创建一个带两个参数的用户定义函数 avg 并返回结果为 (a+b/2)。它定义如下:def avg(a, b): return (a+b/2)应用 pipe() 函数以在第一个值为 avg() 和第二个参数为 10 的情况下执行表级函数以计算所有数据框值的平均值。df.pipe(avg, 10)示例让我们检查以下代码以... 阅读更多

编写 Python 程序以修剪数据框中的最小和最大阈值

Vani Nalliappan
更新于 2021 年 2 月 25 日 05:46:06

394 次查看

假设,您有一个数据框,并且最小和最大阈值修剪的结果为:最小阈值: Column1 Column2 0 30 30 1 34 30 2 56 30 3 78 50 4 30 90 最大阈值: Column1 Column2 0 12 23 1 34 30 2 50 25 3 50 50 4 28 50 修剪后的数据框为: Column1 Column2 0 30 30 1 34 30 2 50 30 3 ... 阅读更多

编写 Python 程序以量化数据框中分布的形状

Vani Nalliappan
更新于 2021 年 2 月 25 日 05:44:50

262 次查看

假设,您有一个数据框,并且量化分布形状的结果为:峰度为:Column1 -1.526243 Column2 1.948382 dtype: float64 非对称分布 - 偏度为:Column1 -0.280389 Column2 1.309355 dtype: float64解决方案要解决此问题,我们将遵循以下步骤:定义一个数据框应用 df.kurt(axis=0) 计算分布的形状,df.kurt(axis=0)应用 df.skew(axis=0) 计算轴 0 上的无偏偏度以查找非对称分布,df.skew(axis=0)示例让我们查看以下代码以更好地理解:import pandas as pd data = {"Column1":[12, 34, 56, 78, 90], "Column2":[23, 30, 45, ... 阅读更多

编写 Python 程序以查找数据框中行和列的平均绝对偏差

Vani Nalliappan
更新于 2021 年 2 月 25 日 05:42:20

424 次查看

解决方案假设您有一个数据框,并且行和列的平均绝对偏差为:列的 mad:Column1 0.938776 Column2 0.600000 dtype: float64 行的 mad:0 0.500 1 0.900 2 0.650 3 0.900 4 0.750 5 0.575 6 1.325 dtype: float64要解决此问题,我们将遵循以下步骤:定义一个数据框计算行的平均绝对偏差,df.mad()计算行的平均绝对偏差,df.mad(axis=1)示例让我们查看以下代码以更好地理解:import pandas as pd data = {"Column1":[6, 5.3, 5.9, 7.8, 7.6, 7.45, 7.75], ... 阅读更多

编写 Python 程序以查找面板中第一行的平均值

Vani Nalliappan
更新于 2021 年 2 月 25 日 05:37:27

234 次查看

假设,您有面板,并且第一行的平均值为:第一行的平均值为:Column1 0.274124 dtype: float64解决方案要解决此问题,我们将遵循以下步骤:将数据值设置为字典键为“Column1”,值为 pd.DataFrame(np.random.randn(5, 3))data = {'Column1' : pd.DataFrame(np.random.randn(5, 3))}将数据分配给面板并将其保存为 pp = pd.Panel(data)使用 dict 键 Column1 打印列print(p['Column1'])使用 major_xs(0) 计算第一行的平均值,p.major_xs(0).mean()示例让我们查看以下代码以更好地理解:import pandas as pd import numpy as np data = {'Column1' : pd.DataFrame(np.random.randn(5, 3))} p = pd.Panel(data) print("面板值:") ... 阅读更多

编写 Python 程序以查找数据框中特定列的最小排名

Vani Nalliappan
更新于 2021 年 2 月 25 日 05:33:26

322 次查看

解决方案假设您有一个数据框和特定列的最小排名,  Id Name    Age    Rank 0 1 Adam    12    1.0 1 2 David   13    3.0 2 3 Michael 14    5.0 3 4 Peter   12    1.0 4 5 William 13    3.0要解决此问题,我们将按照以下步骤操作 -定义数据框。在 rank 函数内分配 df[‘Age’] 列以计算轴 0 的最小排名,即 df["Age"].rank(axis=0, method ='min', ascending=True)示例让我们看看以下代码以更好地理解 -import pandas as pd data = {'Id': [1, 2, 3, ... 阅读更多

编写一个 Python 程序,从数据框字典创建面板并打印第一列的最大值

Vani Nalliappan
更新于 2021年2月25日 05:32:24

148 次查看

面板中第一列最大值的计算结果是第一列的最大值为; Column1    1.377292解决方案要解决此问题,我们将遵循以下方法 -将数据值设置为字典键为 ‘Column1’,值为 pd.DataFrame(np.random.randn(5, 3))data = {'Column1' : pd.DataFrame(np.random.randn(5, 3))}将数据分配给 Panel 并将其保存为 pp = pd.Panel(data)使用字典键 Column1 打印列print(p['Column1'])使用 minor_xs(0) 计算第一列的最大值,p.minor_xs(0).max()示例让我们看看以下代码以更好地理解 -import pandas as pd import numpy as np data = {'Column1' : pd.DataFrame(np.random.randn(5, 3))} p = pd.Panel(data) print("Panel ... 阅读更多

广告