如何在 Python 中拟合多项式回归模型来理解数据中的非线性趋势?


在构建回归模型时,会检查多重共线性。这是因为我们需要了解所有不同连续变量组合之间存在的相关性。如果变量之间存在多重共线性,我们必须确保将其从数据中移除。

现实世界中的数据通常是非线性的。我们需要找到机制来将此类非线性数据拟合到模型中。我们将使用 Anscombe 的数据集来可视化此数据。

‘implot’ 函数用于非线性数据 -

示例

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
my_df = sb.load_dataset('anscombe')
sb.lmplot(x = "x", y = "y", data = my_df.query("dataset == 'II'"),order = 3)
plt.show()

输出

解释

  • 导入所需的包。
  • 输入数据是 ‘anscombe’,它从 seaborn 库加载。
  • 此数据存储在数据框中。
  • ‘load_dataset’ 函数用于加载 iris 数据。
  • 使用 ‘implot’ 函数可视化此数据。
  • 在此,数据框作为参数提供。
  • 此外,还指定了 x 值、y 值和阶数。
  • 此数据显示在控制台上。

更新于: 2020-12-11

122 次查看

启动您的 职业生涯

通过完成课程获得认证

开始
广告