7K+ 次浏览
要查找R数据框中所有列的平均值,我们可以简单地使用colMeans函数,它将返回平均值。但是对于标准差,我们没有任何可以直接使用的函数;因此,我们可以使用sd与apply结合,并引用列来查找R数据框所有列的标准差。例如,如果我们有一个数据框df,那么使用apply函数查找所有列的标准差的语法将是apply(df, 2, sd),这里2指的是列。如果我们想……阅读更多
745 次浏览
当我们从R数据框中获取随机样本时,样本行的行号与原始数据框中的行号相同,这显然是由于随机化造成的。但这可能会在进行分析时造成混淆,尤其是在我们需要使用行的情况下,因此,我们可以将行的索引号转换为从1到所选样本中行数的数字。示例考虑以下数据框 - 实时演示> set.seed(111) > x1 x2 x3 df1 df1输出 x1 x2 x3 1 1.735220712 2.8616625 1.824274 2 1.169264128 2.8469644 ... 阅读更多
189 次浏览
一个向量可能包含数千个值,并且每个值可能不同或相同。值也可能分组或随机选择,但也可能有一些相似的值。无论向量中的值如何,要查找一些最大值,我们需要按升序对向量进行排序,然后选择最大值。示例> x1 x1 [1] -1.4447473195 3.2906645299 -0.4680055849 0.1611487482 -0.7715094280 [6] 0.4442103640 0.3702444686 0.0783124252 1.3476432299 1.0140576107 [11] -0.0968917066 0.4628821017 0.3102594626 -0.2946001275 0.1498108166 [16] -0.6002154305 0.5905382364 1.3892651534 0.1008921325 -0.6486318692 [21] -0.0562831933 -0.6887431711 0.4907512082 -0.3994662410 0.7827897030 [26] 0.5294704584 -1.3802965730 -0.6159076490 -0.0009408529 1.6182294859 ... 阅读更多
363 次浏览
数值向量可能包含大量元素;因此,我们可能希望将其转换为区间向量。例如,如果我们在向量中具有1到10的值,那么我们可能希望将其转换为区间向量,例如对于1、2、3、4和5为(1, 5),对于6、7、8、9和10为(6, 10)。这可以通过使用cut函数来完成,在其中我们将使用breaks参数将向量元素组合在一个区间中。示例 实时演示> x1 x1输出[1] 1 2 3 4 5 6 7 ... 阅读更多
653 次浏览
累积和是连续值的和,我们可以对任何数值向量或R数据框的列进行此求和。但是,如果存在NA,则我们需要跳过它,因此累积和的大小将减少NA值的个数。如果向量中存在NA值,则可以使用!is.na在计算累积和时忽略它们,使用cumsum函数。示例 实时演示> x1 x1输出[1] 1 2 3 4 5 6 7 8 9 10 NA > cumsum(x1[!is.na(x1)]) [1] 1 3 6 ... 阅读更多
4K+ 次浏览
十进制值的几分形式是用除号表示的值的形式。例如,将0.5表示为1/2。在R中,我们可以使用MASS包的fractions函数将十进制值或十进制值向量转换为分数形式。为此,我们只需要将值作为fractions(“Decimal_value或Vector_Of_Decimal_Values”)传递到fractions函数中。加载MASS包 - 示例> library(MASS)输出> fractions(0.14) [1] 7/50 > fractions(1.14) [1] 57/50 > library(MASS) > fractions(0.5) [1] 1/2 > fractions(0.3) [1] 3/10 > fractions(0.31) [1] 31/100 > fractions(1.31) [1] 131/100 > fractions(2.01) [1] 201/100 > ... 阅读更多
196 次浏览
要注释ggplot2创建的绘图中的文本,我们可以使用annotate函数。它用于解释绘图或添加任何有助于读者更好地理解绘图的有用信息。有时,我们可能希望更改带注释文本的角度,尤其是在我们有一些在绘图中垂直显示的信息的情况下,因此,我们可以使用annotate函数的角度参数。示例考虑以下数据框 - 实时演示> x y df df输出 x y 1 4.086537 5.890591 2 ... 阅读更多
440 次浏览
点图是一种直方图,它显示点而不是条形,它用于小型数据集。在ggplot2中,我们有geom_dotplot函数来创建点图,但我们必须传递正确的binwidth(它是geom_dotplot的参数),这样我们才能不会收到警告“警告:忽略未知参数:bins `stat_bindot()` 使用 `bins = 30`。使用 `binwidth` 选择更好的值。”示例考虑以下数据框 -> x df1 library(ggplot2)创建x的点图 -> ggplot(df1, aes(x))+geom_dotplot(binwidth=0.2)输出让我们来看另一个例子 -> y df2 ggplot(df2, aes(y))+geom_dotplot(binwidth=0.2)输出阅读更多
198 次浏览
百分位数帮助我们确定数据集中的某个百分比处的值。例如,如果我们有一个大小为100的向量,其中包含任何值,并且假设向量的第十百分位数为25,这意味着向量中十个百分比的值小于25,或者我们可以说,向量中九十个百分比的值大于25。我们可以使用R中的quantile函数查找向量值的百分位数。示例 实时演示> x1 x1输出[1] 7 1 7 6 6 5 3 1 5 5 4 ... 阅读更多
1K+ 次浏览
任何大小矩阵的行和列的删除或添加大多是使用单个方括号完成的,这也是最简单的方法。要删除行和列,我们只需要使用列索引或行索引,如果我们想删除多个行或列,则可以通过将它们放在c中用逗号分隔它们,如c(-1, -2)。如果我们想按顺序删除多个行或列,则可以使用冒号。示例 实时演示> M M输出 [, 1] [, 2] [, 3] [, ... 阅读更多