找到 2038 篇文章,关于 R 编程

如何在 R 中分割包含特殊字符的字符串值?

Nizamuddin Siddiqui
更新于 2020-10-09 14:48:49

909 次浏览

当我们有一个单一的长字符串或一个字符串值的向量,并且字符串中的值由一些特殊字符分隔时,分割这些值可以帮助我们正确理解这些字符串。这可能发生在字符串数据记录有错误或出于其他目的的情况下。我们可以使用 strsplit 函数进行分割。示例 现场演示x1

如何绘制 R 数据框的所有值?

Nizamuddin Siddiqui
更新于 2020-10-09 14:46:43

380 次浏览

要绘制 R 数据框的所有值,我们可以使用 matplot 函数。此函数根据 R 数据框的列绘制所有值,并用列号表示它们。例如,如果我们在 R 数据框中有五列,则 matplot 将用 1 表示第一列,用 2 表示第二列,用 3 表示第三列,依此类推。考虑以下数据框 - 示例 现场演示set.seed(555) v1

如何在 R 数据框中查找行值的比例?

Nizamuddin Siddiqui
更新于 2020-10-09 14:42:06

448 次浏览

如果我们将每一行值除以特定行中所有值的总和,则可以计算行值的比例。因此,比例的总和将等于 1。这可以通过将数据框除以行和来完成,为此我们可以使用以下语法 - 语法data_frame_name/rowSums(data_frame_name)考虑以下数据框 - 示例 现场演示set.seed(111) x1

如何在 R 中使用 ggplot2 创建透明多边形?

Nizamuddin Siddiqui
更新于 2020-10-09 14:30:57

623 次浏览

透明多边形仅表示边框线和空心区域;因此,我们只能理解覆盖的区域,但理解比例会有点困难。因此,这种可视化技术不如其他使用不同颜色填充区域的技术有用。但如果数据的范围不大,则可以使用它。考虑以下数据框 - 示例 现场演示set.seed(123) x

如何根据列的字符串值和 OR 条件子集 R 数据框?

Nizamuddin Siddiqui
更新于 2020-10-09 14:28:08

3K+ 次浏览

我们可能希望使用特定列的一个或多个值创建 R 数据框的子集。例如,假设我们有一个包含列 C1、C2、C3、C4 和 C5 的数据框 df,并且这些列中的每一列都包含从 A 到 Z 的值。如果我们想使用列 C1 中的值 A 或 B 选择行,则可以执行以下操作:df[df$C1=="A"|df$C1=="B",]。考虑以下数据框 - 示例set.seed(99) x1

如何使用 cast 函数查找 R 数据框的均值列联表?

Nizamuddin Siddiqui
更新于 2020-10-09 14:20:00

211 次浏览

列联表考虑两个分类变量的数值。通常,我们需要计数的列联表,尤其是在非参数分析中,但我们也可能希望将均值用于我们的分析。因此,我们可以使用 reshape 包中的 cast 函数,它可以轻松地解决创建列联表的问题。考虑以下数据框 - 示例 现场演示set.seed(99) x1

如何查找 R 数据框中每一列中 NA 的数量?

Nizamuddin Siddiqui
更新于 2020-10-09 14:19:24

722 次浏览

有时数据框充满了太多缺失值/NA,并且数据框的每一列都至少包含一个 NA。在这种情况下,我们可能希望找出每一列中存在多少缺失值。因此,我们可以如下使用 colSums 函数以及 is.na:colSums(is.na(df)) #这里 df 指的是数据框名称。考虑以下数据框 - 示例 现场演示set.seed(109) x1

如何在 R 中模拟固定范围内的正态分布?

Nizamuddin Siddiqui
更新于 2020-10-09 13:26:24

571 次浏览

要模拟正态分布,我们可以在 R 中使用 rnorm 函数,但我们无法限制模拟值的范围。如果我们想对固定范围模拟此分布,则可以使用 truncnorm 包的 truncnorm 函数。在此函数中,我们可以传递带有和不带均值和标准差的限制。加载和安装 truncnorm 包 - >install.packages("truncnorm") >library(truncnorm)示例rtruncnorm(n=10, a=0, b=10)[1] 0.76595522 0.33315633 1.29565988 0.67154230 0.04957334 0.38338705 [7] 0.75753005 0.65265304 0.63616552 0.45710877rtruncnorm(n=50, a=0, b=100)[1] 0.904997947 0.035692016 0.402963452 1.001102057 1.445190636 0.109245234 [7] 0.205630845 0.312428027 0.465876772 0.424647787 0.309222394 0.442172805 [13] 0.365503292 1.277570451 0.235747661 1.128447123 ... 阅读更多

如何在 R 中使用 ggplot2 创建透明直方图?

Nizamuddin Siddiqui
更新于 2020-10-08 15:23:20

2K+ 次浏览

当我们使用 ggplot2 包创建直方图时,直方图覆盖的区域填充为灰色,但我们可以删除该颜色以使直方图看起来透明。这可以通过在 geom_histogram 中使用 fill="transparent" 和 color="black" 参数来完成,我们需要使用 color 参数,因为如果我们不使用它,则直方图条的边框也将被删除,并且此颜色不限于黑色。示例考虑以下数据框 - set.seed(987) x

如何从 R 数据框列中选择小于或大于特定百分位数的值?

Nizamuddin Siddiqui
更新于 2020-10-08 15:21:21

570 次浏览

百分位数将一组数值划分为一百个组,如果值的个数为 100,则为单个值。我们可以找到 R 数据框的数值列的百分位数,因此,也可以根据这些百分位数选择列的值。为此,我们可以使用 quantile 函数。示例考虑以下数据框 - set.seed(111) x

广告