如何在 Python 中拟合多项式回归模型来理解数据中的非线性趋势?
在构建回归模型时,会检查多重共线性。这是因为我们需要了解所有不同连续变量组合之间存在的相关性。如果变量之间存在多重共线性,我们必须确保将其从数据中移除。
现实世界中的数据通常是非线性的。我们需要找到机制来将此类非线性数据拟合到模型中。我们将使用 Anscombe 的数据集来可视化此数据。
‘implot’ 函数用于非线性数据 -
示例
import pandas as pd import seaborn as sb from matplotlib import pyplot as plt my_df = sb.load_dataset('anscombe') sb.lmplot(x = "x", y = "y", data = my_df.query("dataset == 'II'"),order = 3) plt.show()
输出
解释
- 导入所需的包。
- 输入数据是 ‘anscombe’,它从 seaborn 库加载。
- 此数据存储在数据框中。
- ‘load_dataset’ 函数用于加载 iris 数据。
- 使用 ‘implot’ 函数可视化此数据。
- 在此,数据框作为参数提供。
- 此外,还指定了 x 值、y 值和阶数。
- 此数据显示在控制台上。
广告