如何在Python中使用TensorFlow结合提升树?


TensorFlow可以与提升树结合使用,以提高数据集的预测性能。数据按照通常的方式加载和预处理,但在进行预测时,会使用多个模型进行预测,并将所有这些模型的输出组合起来以得到最终结果。

阅读更多: 什么是TensorFlow以及Keras如何与TensorFlow一起创建神经网络?

我们将使用Keras Sequential API,这有助于构建一个顺序模型,用于处理简单的层堆栈,其中每一层只有一个输入张量和一个输出张量。

包含至少一层卷积层的神经网络称为卷积神经网络。我们可以使用卷积神经网络来构建学习模型。

我们使用Google Colaboratory运行以下代码。Google Colab或Colaboratory帮助在浏览器上运行Python代码,无需任何配置,并可免费访问GPU(图形处理单元)。Colaboratory构建在Jupyter Notebook之上。

我们将了解如何使用决策树和tf.estimator API训练梯度提升模型。提升树模型被认为是回归和分类中最流行和有效的机器学习方法。这是一种集成技术,它结合了来自许多(10个、100个或1000个)树模型的预测。它们有助于在最少的超参数调整下实现令人印象深刻的性能。

示例

import numpy as np
import pandas as pd
from IPython.display import clear_output
from matplotlib import pyplot as plt
print("Load the dataset")
dftrain = pd.read_csv('https://storage.googleapis.com/tf-datasets/titanic/train.csv')
dfeval = pd.read_csv('https://storage.googleapis.com/tf-datasets/titanic/eval.csv')
print("Delete the column 'survived'")
y_train = dftrain.pop('survived')
y_eval = dfeval.pop('survived')
import tensorflow as tf
tf.random.set_seed(123)

代码来源 −https://tensorflowcn.cn/tutorials/estimator/boosted_trees

输出

Load the dataset
Delete the column 'survived'

解释

  • 导入所需的包。
  • 加载数据集。
  • 将其读取为csv文件。
  • 删除'survived'列。

更新于: 2021年2月25日

132次浏览

启动你的职业生涯

完成课程获得认证

开始学习
广告