如何使用 Estimators 和 Tensorflow 构建线性模型来加载泰坦尼克号数据集?
可以使用 Estimators 构建线性模型来加载泰坦尼克号数据集,方法是使用 'Pandas' 包中提供的 'read_csv' 方法。此方法获取存储泰坦尼克号数据集的 Google API。读取 API 并将数据存储为 CSV 文件格式。
阅读更多: 什么是 TensorFlow 以及 Keras 如何与 TensorFlow 一起创建神经网络?
我们将使用 Keras Sequential API,它有助于构建一个顺序模型,用于处理简单的层堆栈,其中每一层只有一个输入张量和一个输出张量。
包含至少一层卷积层的神经网络称为卷积神经网络。我们可以 使用卷积神经网络构建学习模型。
TensorFlow Text 包含与文本相关的类和操作的集合,可与 TensorFlow 2.0 一起使用。TensorFlow Text 可用于 预处理序列建模。
我们使用 Google Colaboratory 来运行以下代码。Google Colab 或 Colaboratory 帮助在浏览器上运行 Python 代码,无需任何配置,并可免费访问 GPU(图形处理单元)。Colaboratory 是基于 Jupyter Notebook 构建的。
Estimator 是 TensorFlow 对完整模型的高级表示。它旨在易于扩展和异步训练。
我们将使用 tf.estimator API 训练逻辑回归模型。该模型用作其他算法的基线。我们使用泰坦尼克号数据集,目标是预测乘客的生存情况,给定诸如性别、年龄、舱位等特征。
pip install -q sklearn
示例
import os import sys import numpy as np import pandas as pd import matplotlib.pyplot as plt from IPython.display import clear_output from six.moves import urllib import tensorflow.compat.v2.feature_column as fc import tensorflow as tf print("Load the dataset") dftrain = pd.read_csv('https://storage.googleapis.com/tf-datasets/titanic/train.csv') dfeval = pd.read_csv('https://storage.googleapis.com/tf-datasets/titanic/eval.csv') print("Removing feature 'survived'") y_train = dftrain.pop('survived') y_eval = dfeval.pop('survived')
代码来源 −https://tensorflowcn.cn/tutorials/estimator/linear
输出
Load the dataset Removing feature 'survived'
解释
- 下载所需的软件包。
- 从 API 下载数据。
- 删除“survived”列。
广告