如何在Python中使用TensorFlow结合提升树?
TensorFlow可以与提升树结合使用,以提高数据集的预测性能。数据按照通常的方式加载和预处理,但在进行预测时,会使用多个模型进行预测,并将所有这些模型的输出组合起来以得到最终结果。
阅读更多: 什么是TensorFlow以及Keras如何与TensorFlow一起创建神经网络?
我们将使用Keras Sequential API,这有助于构建一个顺序模型,用于处理简单的层堆栈,其中每一层只有一个输入张量和一个输出张量。
包含至少一层卷积层的神经网络称为卷积神经网络。我们可以使用卷积神经网络来构建学习模型。
我们使用Google Colaboratory运行以下代码。Google Colab或Colaboratory帮助在浏览器上运行Python代码,无需任何配置,并可免费访问GPU(图形处理单元)。Colaboratory构建在Jupyter Notebook之上。
我们将了解如何使用决策树和tf.estimator API训练梯度提升模型。提升树模型被认为是回归和分类中最流行和有效的机器学习方法。这是一种集成技术,它结合了来自许多(10个、100个或1000个)树模型的预测。它们有助于在最少的超参数调整下实现令人印象深刻的性能。
示例
import numpy as np import pandas as pd from IPython.display import clear_output from matplotlib import pyplot as plt print("Load the dataset") dftrain = pd.read_csv('https://storage.googleapis.com/tf-datasets/titanic/train.csv') dfeval = pd.read_csv('https://storage.googleapis.com/tf-datasets/titanic/eval.csv') print("Delete the column 'survived'") y_train = dftrain.pop('survived') y_eval = dfeval.pop('survived') import tensorflow as tf tf.random.set_seed(123)
代码来源 −https://tensorflowcn.cn/tutorials/estimator/boosted_trees
输出
Load the dataset Delete the column 'survived'
解释
- 导入所需的包。
- 加载数据集。
- 将其读取为csv文件。
- 删除'survived'列。
广告