如何在 Python 中使用 Keras 下载和探索与预测 Stack Overflow 问题标签相关的数据集?


TensorFlow 是 Google 提供的一个机器学习框架。它是一个开源框架,与 Python 结合使用以实现算法、深度学习应用程序等等。它用于研究和生产目的。它具有优化技术,有助于快速执行复杂的数学运算。

这是因为它使用 NumPy 和多维数组。这些多维数组也称为“张量”。该框架支持使用深度神经网络。它具有高度可扩展性,并附带许多流行的数据集。它使用 GPU 计算并自动管理资源。它附带大量机器学习库,并且得到良好的支持和记录。该框架能够运行深度神经网络模型、训练它们以及创建预测相应数据集相关特征的应用程序。

可以使用以下代码行在 Windows 上安装“tensorflow”包:

pip install tensorflow

Keras 是作为 ONEIROS(开放式神经电子智能机器人操作系统)项目研究的一部分开发的。Keras 是一个用 Python 编写的深度学习 API。它是一个高级 API,具有高效的接口,有助于解决机器学习问题。它具有高度可扩展性,并具有跨平台功能。这意味着 Keras 可以运行在 TPU 或 GPU 集群上。Keras 模型也可以导出到 Web 浏览器或手机上运行。

Keras 已经存在于 TensorFlow 包中。可以使用以下代码行访问它。

import tensorflow
from tensorflow import keras

我们正在使用 Google Colaboratory 来运行以下代码。Google Colab 或 Colaboratory 帮助通过浏览器运行 Python 代码,并且无需任何配置即可免费访问 GPU(图形处理单元)。Colaboratory 基于 Jupyter Notebook 构建。以下是探索与预测 Stack Overflow 问题标签相关的数据集的代码片段:

示例

print("Downloading tensorflow-text")
!pip -q install tensorflow-text

import collections
import pathlib
import re
import string
import tensorflow as tf

from tensorflow.keras import layers
from tensorflow.keras import losses
from tensorflow.keras import preprocessing
from tensorflow.keras import utils
from tensorflow.keras.layers.experimental.preprocessing import TextVectorization

import tensorflow_datasets as tfds
import tensorflow_text as tf_text
data_url =
'https://storage.googleapis.com/download.tensorflow.org/data/stack_overflow_16k.tar.gz'
dataset = utils.get_file(
   'stack_overflow_16k.tar.gz',
   data_url,
   untar=True,
   cache_dir='stack_overflow',
   cache_subdir='')
dataset_dir = pathlib.Path(dataset).parent

代码来源 - https://tensorflowcn.cn/tutorials/load_data/text

输出

Downloading tensorflow-text
Downloading data from
https://storage.googleapis.com/download.tensorflow.org/data/stack_overflow_16k.tar.gz
6053888/6053168 [==============================] - 0s 0us/step

解释

  • 导入所需的包。

  • 从 API 加载数据。

更新于: 2021年1月18日

181 次浏览

启动你的 职业生涯

通过完成课程获得认证

开始学习
广告