2K+ 次浏览
简介 K-Medoids 是一种使用分区方法进行聚类的无监督聚类算法。它是 K-Means 聚类算法的改进版本,尤其用于处理异常值数据。它需要未标记的数据才能使用。在本文中,让我们用一个例子来理解 k-Medoids 算法。K-Medoids 算法在 K-Medoids 算法中,每个数据点称为一个 medoid。medoids 作为聚类中心。medoid 是一个点,它与同一聚类中所有其他点的距离之和最小。对于距离,可以使用任何合适的度量,例如欧几里得距离或曼哈顿距离…… 阅读更多
3K+ 次浏览
Python pandas 库提供了不同的函数来检查某天是否是工作日,例如 weekday()、day_name()、isoweekday() 等。Pandas 是一个开源的 Python 库,用于数据操作、数据分析、数据可视化和数据结构等。这个库广泛用于数据科学和数据分析,提供数据清洗、探索和转换功能。Pandas 中有许多模块和函数可用于处理给定数据。使用 weekday() 函数在 Python 中,weekday() 函数可用于确定给定的一天是否是工作日。这…… 阅读更多
133 次浏览
在今天这个日期,人工智能已经影响了我们的生活,没有任何其他事物能够产生如此大的影响。它改变了我们日常工作的完成方式,并且参与了我们行业、生活以及几乎所有领域的主要方面。在这篇文章中,我们将了解人工智能在我们的生活中发挥重要作用的一些领域。医疗行业医疗保健是 21 世纪一个发展迅速且至关重要的行业。它不仅为人们提供更好的生活,而且每天都在挽救数百万人的生命。我们不能忽视健康方面…… 阅读更多
7K+ 次浏览
在 Python 语言中,我们有不同的模块和函数来检查给定的 NumPy 数组中是否存在指定的值。NumPy 的缩写是 Numerical Python,它是一个用于执行数学、统计和科学计算的 Python 库。NumPy 数组的结果以数组的格式返回。数组可以创建一维、二维等等,最多 32 维。NumPy 库提供了许多模块和函数,帮助我们执行科学计算和数学计算。让我们逐一查看每种方法…… 阅读更多
377 次浏览
简介 在处理任何数据科学或机器学习用例时,数据的分布会为我们提供对数据的有用见解。数据分布是指数据的可用性和当前状态,有关数据特定部分的信息,数据中的任何异常值以及与数据相关的中心趋势。为了探索数据分布,流行的图形方法在处理数据时被证明是有益的。在本文中,让我们探索这些方法。更多地了解您的数据:图形化方法直方图和 KDE 密度图直方图是…… 阅读更多
11K+ 次浏览
Python 脚本是可以存储代码的文件,用于执行特定任务或一组任务。此文件以“.py”文件扩展名保存。Python 脚本可以在任何文本编辑器中创建和编辑,并可以使用命令行提示符执行,或者可以作为包或模块导入到集成开发环境 (IDE) 中。每个 Python 脚本都需要一些时间来执行文件;可以使用以下方法计算它。使用 time 模块在 Python 中,我们有 time 模块…… 阅读更多
变量是一个存储不同值的实体。当我们每次分配新值时,前一个值将被新值替换。在 Python 中,变量可以是字母、下划线、数字值,开头是字母等等。可以针对一个值检查多个变量;这可以通过以下方法在 Python 中进行检查。使用逻辑“或”和“与”在 Python 中检查多个变量是否等于一个值的一种方法是使用逻辑或和与。与运算符将检查所有变量是否都等于它们…… 阅读更多
614 次浏览
我们在日常生活中使用不同的网站。每个特定的网站都需要一些时间来加载内容。从数学上讲,我们可以通过从读取整个网站的时间中减去获得的时间来获得加载时间。在 Python 中,我们有一些包和模块可以检查网站的加载时间。步骤/方法以下是我们需要遵循的步骤,以获得网站的加载时间。让我们逐一查看每个步骤。首先,我们必须将所需的库导入到我们的 Python 环境中。以下是…… 阅读更多
610 次浏览
引言 分类数据是一种取值数量固定的数据类型,其变量之间不存在逻辑顺序。分类变量可以是血型、是非情况、性别、排名(例如,第一、第二、第三)等。在机器学习的应用场景中,分类变量通常会进行编码,例如独热编码和名义编码,以二进制或整数格式表示。分类数据及相关术语 众数是与分类变量/观察值相关的最常见的集中趋势。它是观察值集合中出现频率最高的数值…… 阅读更多
浏览量:302
时间序列是一组按规则时间间隔记录的数据点。它用于研究模式趋势,以及变量在定义时间内的关系。时间序列的常见例子包括股票价格、天气模式和经济指标。它通过统计和数学技术分析时间序列数据。时间序列的主要目的是识别先前数据的模式和趋势,以预测未来的值。如果数据不随时间变化,则称其为平稳数据。这是必要的…… 阅读更多