590 次浏览
小计是指根据分组列查找值的总和。例如,如果我们有一个名为 df 的数据框,其中包含三个数值列 x、y、z 和一个分类列 Group,那么可以使用命令 aggregate(cbind(x,y,z)~Group,data=df,FUN=sum) 查找 Group 中每个类别 x、y、z 的小计。请考虑以下数据框 -示例 实时演示x1
197 次浏览
要创建具有递增值的随机整数向量,我们可以使用 sample.int 进行随机采样,并使用 cummax 函数获取递增值。例如,要创建大小为 5、最大值为 5、起始值为 1 的随机整数向量,可以使用命令 cummax(sample.int(5))。示例 实时演示x1
2K+ 次浏览
当我们执行任何类型的数据分析时,会在 R 环境中创建许多类型的对象,例如向量、数据框、矩阵、列表、数组等。如果我们想获取 R 环境中可用数据框的列表,则可以使用以下命令 -names(which(unlist(eapply(.GlobalEnv,is.data.frame))))示例 实时演示x1
4K+ 次浏览
如果我们在 R 数据框中有一个数值列,并且该列中唯一值的个数很少,这意味着该数值列可以被视为一个因子。因此,我们可以将数值列转换为因子。要使用 dplyr 包执行此操作,我们可以使用 dplyr 包的 mutate_if 函数。加载 dplyr 包并将 BOD 数据集(在基本 R 中可用)中的数值列转换为因子列 -示例library(dplyr) str(BOD) 'data.frame': 6 obs. of 2 variables: $ Time : num 1 2 3 4 5 7 $ demand: num 8.3 10.3 19 16 15.6 19.8 - ... 阅读更多
394 次浏览
假设,您有一个数据框,并且修剪最小和最大阈值的结果,最小阈值: Column1 Column2 0 30 30 1 34 30 2 56 30 3 78 50 4 30 90 最大阈值: Column1 Column2 0 12 23 1 34 30 2 50 25 3 50 50 4 28 50 修剪后的数据框为: Column1 Column2 0 30 30 1 34 30 2 50 30 3 ... 阅读更多
262 次浏览
假设,您有一个数据框,并且量化分布形状的结果为,峰度为: Column1 -1.526243 Column2 1.948382 dtype: float64 偏度分布 - 偏度为: Column1 -0.280389 Column2 1.309355 dtype: float64解决方案要解决此问题,我们将按照以下步骤操作 -定义一个数据框应用 df.kurt(axis=0) 计算分布的形状,df.kurt(axis=0)应用 df.skew(axis=0) 计算轴 0 上的无偏偏度以查找偏度分布,df.skew(axis=0)示例让我们看看以下代码以更好地理解 -import pandas as pd data = {"Column1":[12, 34, 56, 78, 90], "Column2":[23, 30, 45, ... 阅读更多
424 次浏览
解决方案假设您有一个数据框,并且行和列的平均绝对偏差为,列的 mad: Column1 0.938776 Column2 0.600000 dtype: float64 行的 mad: 0 0.500 1 0.900 2 0.650 3 0.900 4 0.750 5 0.575 6 1.325 dtype: float64要解决此问题,我们将按照以下步骤操作 -定义一个数据框计算行的平均绝对偏差,df.mad()计算行的平均绝对偏差,df.mad(axis=1)示例让我们看看以下代码以更好地理解 -import pandas as pd data = {"Column1":[6, 5.3, 5.9, 7.8, 7.6, 7.45, 7.75], ... 阅读更多
234 次浏览
假设,您有 Panel,并且第一行的平均值为,第一行的平均值为: Column1 0.274124 dtype: float64解决方案要解决此问题,我们将按照以下步骤操作 -将数据值设置为字典键为 'Column1',值为 pd.DataFrame(np.random.randn(5, 3))data = {'Column1' : pd.DataFrame(np.random.randn(5, 3))}将数据分配给 Panel 并将其保存为 pp = pd.Panel(data)使用字典键 Column1 打印列print(p['Column1'])计算使用 major_xs(0) 的第一行的平均值,p.major_xs(0).mean()示例让我们看看以下代码以更好地理解 -import pandas as pd import numpy as np data = {'Column1' : pd.DataFrame(np.random.randn(5, 3))} p = pd.Panel(data) print("Panel values:") ... 阅读更多
322 次浏览
解决方案假设,您有一个数据框和特定列的最小排名, Id Name Age Rank 0 1 Adam 12 1.0 1 2 David 13 3.0 2 3 Michael 14 5.0 3 4 Peter 12 1.0 4 5 William 13 3.0要解决此问题,我们将按照以下步骤操作 -定义一个数据框。将 df[‘Age’] 列分配到 rank 函数中以计算轴 0 的最小排名,df["Age"].rank(axis=0, method ='min', ascending=True)示例让我们看看以下代码以更好地理解 -import pandas as pd data = {'Id': [1, 2, 3, ... 阅读更多
148 次浏览
面板中第一列的最大值的结果为第一列的最大值为; Column1 1.377292解决方案要解决此问题,我们将按照以下方法操作 -将数据值设置为字典键为 'Column1',值为 pd.DataFrame(np.random.randn(5, 3))data = {'Column1' : pd.DataFrame(np.random.randn(5, 3))}将数据分配给 Panel 并将其保存为 pp = pd.Panel(data)使用字典键 Column1 打印列print(p['Column1'])使用 minor_xs(0) 计算第一列的最大值,p.minor_xs(0).max()示例让我们看看以下代码以更好地理解 -import pandas as pd import numpy as np data = {'Column1' : pd.DataFrame(np.random.randn(5, 3))} p = pd.Panel(data) print("Panel ... 阅读更多