简介 在处理时间序列数据时,至关重要的是采用一种考虑数据时间顺序的交叉验证方法。这是因为时间序列数据显示出自相关性,这意味着数据点的值与其先前值相关。因此,与许多其他机器学习应用不同,数据不能被认为是独立且同分布的 (iid)。标准的 k 折交叉验证技术将数据随机分成 k 折,并在 k-1 折上训练模型,然后在剩余的折上进行测试,这对于时间序列数据来说是不够的。… 阅读更多
简介 KNN 和 k 均值聚类是两种常用的机器学习技术,用于各种任务。这两种方法都使用 k 参数,但它们应用于不同的问题,并且工作方式不同。在分类和回归问题中,KNN 是一种监督学习方法,而 k 均值聚类是一种无监督学习方法。在本文中,我们将探讨 KNN 和 k 均值聚类之间的主要区别,包括每种方法的学习风格、任务、输入、距离计算、输出、应用和限制。我们可以为手头的任务选择最佳算法,并避免常见的… 阅读更多