295 次浏览
要查找组的相关性,我们可以使用 cor 函数,但它不能直接使用。为此,我们首先需要为数据表对象的组列设置键。例如,如果我们有一个数据表 DT,其中一个数值列定义为 x,一个组列定义为 Group,有四个组 a、b、c 和 d,那么组 a 和 b 的数值相关性可以找到如下:setkey(DT, Group) cor(DT["a"]$x, DT["b"]$x)加载 data.table 包:library(data.table)示例考虑下面的数据表对象:x阅读更多
779 次浏览
可以通过转置整个矩阵并从中提取上三角矩阵然后将其存储到原始矩阵中来将上三角矩阵替换为下三角矩阵。例如,如果我们有一个矩阵 M,则可以使用以下代码将 M 的上三角矩阵替换为下三角矩阵:M1[upper.tri(M1)]
605 次浏览
如果 R 数据框中存在重复行,则可以使用 unique 函数和数据框对象名称将其删除。如果要根据数值列对包含重复行的数据框进行排序,则应首先查找唯一行,然后可以使用 order 函数进行排序,如下例所示。示例考虑以下数据框:实时演示x1
374 次浏览
我们可以使用 table 函数创建向量元素的频率表,并使用 sort 函数进行排序。如果要以降序排列频率,则可以使用 decreasing 参数。例如,如果我们有一个向量 x,则可以按如下方式创建有序频率表:sort(table(x))。示例实时演示x1
320 次浏览
SVM 是一种监督机器学习算法,可用于分类或回归挑战,但我们主要将其用于分类。使用 svm 的分类也可以用于两个或多个类别。在 R 中,我们可以简单地使用 e1071 包的 svm 函数。示例考虑虹膜数据:实时演示str(iris)输出'data.frame': 150 obs. of 5 variables: $ Sepal.Length: num 5.1 4.9 4.7 4.6 5 5.4 4.6 5 4.4 4.9 ... $ Sepal.Width : num 3.5 3 3.2 3.1 3.6 3.9 3.4 3.4 2.9 3.1 ... $ Petal.Length: num 1.4 1.4 1.3 1.5 1.4 1.7 1.4 1.5 ... 阅读更多
3K+ 次浏览
截断意味着删除十进制位数,而不是四舍五入。例如,如果我们有一个值 5.1742145,则截断到一位小数将为 5.1,四舍五入将为 5.2。在 R 中,我们可以使用 trunc 函数来实现这一点,如下例所示。示例实时演示x1
6K+ 次浏览
有时我们需要最大值,这有助于我们识别哪个案例或主体发生在最大点,因此我们可以理解所研究样本或总体的限制。如果要查找 R 数据框中每一行中两个或多个列的值的最大值,则可以使用 pmax 函数。示例考虑以下数据框:实时演示set.seed(1997) x1
434 次浏览
要创建没有列和行索引的矩阵,我们首先需要创建矩阵,然后可以使用 prmatrix 函数将其转换为没有列和行索引的矩阵,但我们需要在函数中提供行数。例如,如果我们有一个包含 5 行 5 列的矩阵 M,则可以使用 prmatrix(M,rowlab=rep("",5),collab=rep("",5))将其转换为没有列和行索引的矩阵。示例实时演示M1
2K+ 次浏览
泊松分布是一个离散分布,只有一个参数称为 lambda,它是速率参数。速率参数定义为在固定时间间隔内发生的事件数。要在 R 中创建泊松分布图,我们可以使用 plot 函数和使用 dpois 函数的泊松分布密度。示例实时演示plot(dpois(x=1:50,lambda=3))输出示例实时演示plot(dpois(x=1:50,lambda=3),type="l")输出示例实时演示plot(dpois(x=1:50,lambda=3),type="b")输出
500 次浏览
要创建没有边距的绘图,我们首先需要以这样一种方式定义边距:之后创建的绘图将没有边距,这可以通过使用 par 函数来实现。我们需要在 par 函数中传递 mar 函数,例如 par(mar=c(0,0,0,0))。示例实时演示par(mar=c(0,0,0,0)) plot(1:10)输出示例实时演示barplot(1:10)输出