4K+ 次浏览
概率分布是一种分布类型,它为数据集中的每个值赋予一个特定的概率。例如,如果我们有一个变量 X,它包含三个值 1、2 和 3,并且每个值出现的概率分别定义为 0.25、0.50 和 0.25,那么给出 X 中每个值出现概率的函数称为概率分布。在 R 中,如果我们为每个值预定义了概率,或者使用已知的分布(例如…… 阅读更多
261 次浏览
如果我们想根据多个数值列创建数据框的子集,我们可以遵循以下步骤:创建数据框。使用 dplyr 包的 filter 函数对数据框进行子集化。创建数据框让我们创建一个数据框,如下所示:实时演示x1
314 次浏览
子集化是一种常用的技术,它根据分析的目标服务于许多不同的目的。如果分组列中的特定类别数值列大于某个值,则需要子集化数据框,我们需要遵循以下步骤:创建数据框。使用 dplyr 包的 filter 函数对数据框进行子集化。创建数据框让我们创建一个数据框,如下所示:实时演示x
113 次浏览
子集化是一种常用的技术,它根据分析的目标服务于许多不同的目的。如果找到提供的分组值之一,这意味着如果分类变量的任何值存在于分类列中,我们希望进行子集化;如果我们想包含一个大于某个值的数值列,那么我们需要遵循以下步骤:创建数据框。如果分类变量的任何提供的值存在并且数值列的值大于…… 阅读更多
46 次浏览
子集化是一种常用的技术,它根据分析的目标服务于许多不同的目的。如果找到提供的分组值之一,这意味着如果分类变量的任何值存在于分类列中,我们希望进行子集化,为此,我们可以遵循以下步骤:创建数据框。如果分类变量的任何提供的值存在,则对数据框进行子集化。创建数据框让我们创建一个数据框,如下所示:实时演示x
3K+ 次浏览
有序变量是一种具有自然顺序的分类变量。例如,有序变量可以是工资水平,用低、中、高三个类别定义,这里我们有三个类别,但是这些类别存在自然顺序,因为低工资总是小于中等工资,中等工资总是小于高工资。要在 R 中创建有序变量,我们可以在创建变量时使用 order 参数以及 factor 函数。按照以下步骤在 R 中创建有序变量:使用 factor 函数创建一个分类列,其中…… 阅读更多
2K+ 次浏览
子集化是一种常用的技术,它根据分析的目标服务于许多不同的目的。为了使用 dplyr 包排除一列来子集化数据框,我们可以遵循以下步骤:创建数据框。同时使用 dplyr 包的 filter 函数基于数值列和分类列对数据框进行子集化。创建数据框让我们创建一个数据框,如下所示:实时演示级别
1K+ 次浏览
如果我们想创建一个带有两个图例的散点图,那么我们必须有两个分类列或因子列。这可以通过以下步骤完成:创建一个包含两个数值列和两个分类列的数据框。使用 ggplot2 包的 geom_point 函数的 shape 和 color 参数创建散点图。创建数据框让我们创建一个数据框,如下所示:实时演示x
475 次浏览
子集化是一种常用的技术,它根据分析的目标服务于许多不同的目的。为了使用 dplyr 包排除一列来子集化数据框,我们可以遵循以下步骤:创建数据框。使用 dplyr 包的 select 函数排除一列来子集化数据框。创建数据框让我们创建一个数据框,如下所示:实时演示x1
791 次浏览
要子集化 R 数据框的行,如果任何列的值大于某个值,我们可以遵循以下步骤:首先,创建一个数据框。然后,使用 dplyr 包的 filter_all 函数和 any_vars 函数来子集化数据框的行,以便任何列的值大于某个值。创建数据框让我们创建一个数据框,如下所示:实时演示x1