748 次查看
行列式值可以计算矩阵或多维数组。有时需要更好地理解矩阵/数组。这就是需要行列式运算的地方。SciPy 提供了一个名为“det”的函数,它存在于“linalg”类中,“linalg”是“线性代数”的缩写。“det”函数语法scipy.linalg.det(matrix)“matrix”是传递给“det”函数以查找其行列式值的参数。可以通过将矩阵/数组作为参数来调用此函数。在上图中,假设“a”、“b”、“c”和“d”是数值…… 阅读更多
894 次查看
将一系列值转换为标准化值范围的过程称为规范化。这些值可能介于 -1 到 +1 或 0 到 1 之间。数据也可以通过减法和除法来规范化。作为输入提供给学习算法的数据应保持一致和结构化。输入数据的全部特征应处于单一比例,以便有效地预测值。但在现实世界中,数据是非结构化的,而且大多数情况下,数据并非处于同一比例。这时,规范化就派上用场了。它是最重要的…… 阅读更多
335 次查看
特征缩放是构建机器学习算法的数据预处理阶段中的一个重要步骤。它有助于将数据规范化为特定范围。有时,它还有助于提高机器执行计算的速度。为什么需要它?作为输入提供给学习算法的数据应保持一致和结构化。输入数据的全部特征应处于单一比例,以便有效地预测值。但在现实世界中,数据是非结构化的,而且大多数情况下,数据并非处于同一比例。这时,规范化就派上用场了。它是…… 阅读更多
318 次查看
数据预处理是指数据清洗、去除无效数据、噪声、用相关值替换数据等等。数据预处理基本上是指将从各种资源或单个资源收集的所有数据整理成通用格式或统一数据集(取决于数据类型)的任务。一个步骤的输出成为下一个步骤的输入,依此类推。可能需要从输入数据中去除均值以获得特定结果。让我们了解如何使用 scikit-learn 库来实现这一点。示例 import numpy as np from sklearn import preprocessing … 阅读更多
165 次查看
决策树是随机森林算法的基本构建块。它被认为是机器学习中最流行的算法之一,用于分类目的。决策树给出的决策可以用来解释为什么做出某种预测。这意味着用户可以清楚地了解该过程的输入和输出。它们也被称为 CART,即分类和回归树。它可以被可视化为二叉树(在数据结构和算法中学习到的那种)。树中的每个节点都代表一个单一输入…… 阅读更多
196 次查看
Scikit-learn,通常称为 sklearn,是 Python 中的一个库,用于实现机器学习算法。它功能强大且稳定,因为它提供了各种工具来执行统计建模。这包括使用 Python 中功能强大且稳定的界面进行分类、回归、聚类、降维等等。建立在 Numpy、SciPy 和 Matplotlib 库之上。在将输入数据传递给机器学习算法之前,必须将其分成训练数据集和测试数据集。一旦数据适应所选模型,输入数据集就会在这个模型上进行训练…… 阅读更多
1K+ 次查看
数据可视化是一个重要步骤,因为它有助于理解数据中正在发生的事情,而无需实际查看数字并执行复杂的计算。Seaborn 是一个有助于数据可视化的库。它带有自定义主题和高级界面。当需要处理的变量本质上是分类变量时,无法使用一般的散点图、直方图等。这时需要使用分类散点图。诸如“stripplot”、“swarmplot”之类的图用于处理分类变量。“stripplot”函数用于至少一个变量是分类变量的情况。“stripplot”…… 阅读更多
191 次查看
大量存在的数据需要妥善处理。这就是为什么使用大容量计算机的原因。可以使用 Python 中名为 SciPy 的库来进行大型数据集的科学和技术计算。SciPy 是“科学 Python”的缩写。Python 中的 Numpy 库是 SciPy 的先决条件,因为 SciPy 建立在 Numpy 之上。确保在安装 SciPy 库之前安装 Numpy 库。它是一个开源软件,易于安装和使用。它具有数据科学和机器学习的许多必需功能…… 阅读更多
71 次查看
数据可视化是一个重要步骤,因为它有助于理解数据中正在发生的事情,而无需实际查看数字并执行复杂的计算。Seaborn 是一个有助于数据可视化的库。它带有自定义主题和高级界面。核密度估计,也称为 KDE,是一种可以估计连续随机变量的概率密度函数的方法。此方法用于非参数值的分析。使用“distplot”时,如果将参数“kde”设置为 True 并将“hist”设置为 False,则可以可视化 KDE。让…… 阅读更多
339 次查看
Scikit-learn(通常称为sklearn)是一个基于Python的开源库,用于实现机器学习算法。这包括分类、回归、聚类、降维等等,它通过一个强大且稳定的Python接口来实现这些功能。该库构建于NumPy、SciPy和Matplotlib库之上。让我们来看一个加载数据的例子:示例from sklearn.datasets import load_irismy_data = load_iris()X = my_data.datay = my_data.targetfeature_name = my_data.feature_namestarget_name = my_data.target_namesprint("特征名称为:", feature_name)print("目标名称为:", target_name)print("数据集的前8行是:", X[:8])输出特征……阅读更多