367 次查看
R 中的包可能有多个作者,如果我们在研究、书籍、课程或任何其他类型的文章中使用他们的包,我们可能希望使用他们的姓名。因此,需要找出所有为特定包做出贡献的作者,这可以通过使用带包名称的 citation 函数来完成,如下例所示。示例citation("ggplot2")在出版物中引用 ggplot2 时,请使用 -H. Wickham. ggplot2: Elegant Graphics for Data Analysis. Springer-Verlag New York, 2016.LaTeX 用户的 BibTeX 条目为@Book{, author = {Hadley Wickham}, ... 阅读更多
1K+ 次查看
查找列的方差是数据分析中的一项常见任务,但通常数据以宽格式而不是长格式提供,因此,案例垂直表示,变量水平对齐,并且此数据可能以矩阵或任何其他形式提供。因此,可以使用 apply 函数轻松找到方差。示例 现场演示M1
264 次查看
如果我们想在散点图内创建回归线,则可以使用 lines 函数与线性模型函数 lm 一起使用,但如果我们想对自变量的特定范围执行此操作,则需要定义此范围并在 lines 函数中传递。查看下面考虑预测自变量范围的线性回归模型示例。考虑以下向量 -示例strsplit(x6,"[*]")输出定义 x 的范围 -Range_of_x
130 次查看
当我们处理文本数据时,很难使其干净,并且此类数据最基本的问题之一是值用一些唯一字符(例如特殊字符)分隔。为此,我们可以使用 strsplit 函数,它可以轻松地在文本值之间进行分离。查看下面的示例以了解如何操作。示例 现场演示x1
3K+ 次查看
我们可以使用 str_detect 函数来检查单个字符串或字符串向量是小写还是大写。与 str_detect 函数一起,我们需要使用 upper 或 lower 来检查字符串是小写还是大写,输出将以 TRUE 或 FALSE 的形式返回,如果字符串是小写并且我们使用 str_detect 函数传递 lower,则输出将为 TRUE,反之亦然。示例 现场演示x1
要查找向量元素的秩,我们可以直接使用 rank 函数,但这会导致从最小到最大的秩。例如,如果我们有一个包含值 1、2、3 的向量 x,则 rank 函数将返回 1 2 3。但是,如果我们想获得从大到小的秩,则它将是 3 2 1,并且可以在 R 中完成为 rank(-x)。示例 现场演示x1
通常,我们获得的数据包含小写列名或仅首字母大写。如果我们想将这些列名转换为所有大写单词或大写,则可以使用 toupper 函数对列名进行操作。这可以通过使用以下语法来完成 -语法names(“data_frame_name”)
256 次查看
要创建简单的逻辑回归模型,我们需要使用 glm 函数,其中 family = binomial,因为简单逻辑回归模型或二项式逻辑回归模型中的因变量有两个类别,如果有多于两个类别,则模型称为多项式逻辑回归模型。如果我们想从简单的逻辑回归模型中提取斜率和截距的优势比,则需要使用 exp 函数与模型对象一起使用,如下例所示。示例 现场演示set.seed(999) x1
193 次查看
假设我们有一个包含 5 列的数据框 df1 和另一个仅包含一列的数据框 df2,但两个数据框中列的数据类型相同。现在,我们可能希望通过创建与第一个数据框中相同数量的列,在第一个数据框的行末开始添加第二个数据框的列。研究人员可能需要这样做来了解外部变量对分析结果的影响,并且可以使用... 阅读更多
145 次查看
随机抽样是几乎每个研究人员、分析师、金融分析师、数据科学家甚至领导者都使用的一种技术,如果我们说几乎每个人一生中至少使用过一次,那也就不足为奇了。因为我们甚至在不知道的情况下,也以某种方式在生活中使用它。要获取随机样本或创建从 1 开始到一定范围内的随机值,我们可以在 R 中简单地使用 sample 函数。查看下面的示例以了解此函数如何用于带替换的抽样。示例 现场演示sample(100)输出[1] 17 76 ... 阅读更多