如何使用 Estimators 和 Tensorflow 构建线性模型来加载泰坦尼克号数据集?


可以使用 Estimators 构建线性模型来加载泰坦尼克号数据集,方法是使用 'Pandas' 包中提供的 'read_csv' 方法。此方法获取存储泰坦尼克号数据集的 Google API。读取 API 并将数据存储为 CSV 文件格式。

阅读更多: 什么是 TensorFlow 以及 Keras 如何与 TensorFlow 一起创建神经网络?

我们将使用 Keras Sequential API,它有助于构建一个顺序模型,用于处理简单的层堆栈,其中每一层只有一个输入张量和一个输出张量。

包含至少一层卷积层的神经网络称为卷积神经网络。我们可以 使用卷积神经网络构建学习模型。

TensorFlow Text 包含与文本相关的类和操作的集合,可与 TensorFlow 2.0 一起使用。TensorFlow Text 可用于 预处理序列建模。

我们使用 Google Colaboratory 来运行以下代码。Google Colab 或 Colaboratory 帮助在浏览器上运行 Python 代码,无需任何配置,并可免费访问 GPU(图形处理单元)。Colaboratory 是基于 Jupyter Notebook 构建的。

Estimator 是 TensorFlow 对完整模型的高级表示。它旨在易于扩展和异步训练。

我们将使用 tf.estimator API 训练逻辑回归模型。该模型用作其他算法的基线。我们使用泰坦尼克号数据集,目标是预测乘客的生存情况,给定诸如性别、年龄、舱位等特征。

pip install -q sklearn

示例

import os
import sys
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from IPython.display import clear_output
from six.moves import urllib
import tensorflow.compat.v2.feature_column as fc
import tensorflow as tf
print("Load the dataset")
dftrain = pd.read_csv('https://storage.googleapis.com/tf-datasets/titanic/train.csv')
dfeval = pd.read_csv('https://storage.googleapis.com/tf-datasets/titanic/eval.csv')
print("Removing feature 'survived'")
y_train = dftrain.pop('survived')
y_eval = dfeval.pop('survived')

代码来源 −https://tensorflowcn.cn/tutorials/estimator/linear

输出

Load the dataset
Removing feature 'survived'

解释

  • 下载所需的软件包。
  • 从 API 下载数据。
  • 删除“survived”列。

更新于: 2021年2月22日

83 次浏览

开启你的 职业生涯

通过完成课程获得认证

开始学习
广告