如何使用 Python 中的 TensorFlow 查找数据集预处理层的狀態?
TensorFlow 是 Google 提供的一个机器学习框架。它是一个开源框架,与 Python 结合使用以实现算法、深度学习应用程序等等。它用于研究和生产目的。它具有优化技术,有助于快速执行复杂的数学运算。
这是因为它使用了 NumPy 和多维数组。这些多维数组也称为“张量”。该框架支持使用深度神经网络。它具有高度可扩展性,并附带许多流行的数据集。它使用 GPU 计算并自动管理资源。它附带大量机器学习库,并且得到良好的支持和记录。该框架能够运行深度神经网络模型、训练它们并创建预测相应数据集相关特征的应用程序。
可以使用以下代码行在 Windows 上安装“tensorflow”包:
pip install tensorflow
张量是 TensorFlow 中使用的数据结构。它有助于连接数据流图中的边。此数据流图称为“数据流图”。张量只不过是多维数组或列表。
我们使用 Google Colaboratory 来运行以下代码。Google Colab 或 Colaboratory 帮助在浏览器上运行 Python 代码,并且无需任何配置即可免费访问 GPU(图形处理单元)。Colaboratory 是建立在 Jupyter Notebook 之上的。以下是代码片段:
示例
print("A text-only dataset without labels is prepared") train_text = raw_train_ds.map(lambda text, labels: text) print("The adapt method is called") binary_vectorize_layer.adapt(train_text) int_vectorize_layer.adapt(train_text) print("The result is displayed on the console") def binary_vectorize_text(text, label): text = tf.expand_dims(text, -1) return binary_vectorize_layer(text), label
代码来源 - https://tensorflowcn.cn/tutorials/load_data/text
输出
A text-only dataset without labels is prepared The adapt method is called The result is displayed on the console
解释
准备了不使用标签的数据集。
在此数据上调用了一个名为“adapt”的方法。
这将使用模型的“二进制”格式对数据集进行矢量化。
广告