如何使用 Python 导出 TensorFlow 构建的模型?
TensorFlow 是 Google 提供的一个机器学习框架。它是一个开源框架,与 Python 结合使用,可以实现算法、深度学习应用程序等等。它用于研究和生产目的。
可以使用以下代码行在 Windows 上安装 ‘tensorflow’ 包:
pip install tensorflow
张量 (Tensor) 是 TensorFlow 中使用的一种数据结构。它有助于连接数据流图中的边。这个数据流图被称为 ‘数据流图’。张量不过是一个多维数组或列表。
我们将使用伊利亚特的数据集,其中包含来自威廉·考珀、爱德华(德比伯爵)和塞缪尔·巴特勒的三部翻译作品的文本数据。该模型经过训练,可以识别在给出单行文本时翻译者是谁。使用的文本文件已经过预处理。这包括删除文档页眉和页脚、行号和章节标题。
我们使用 Google Colaboratory 来运行以下代码。Google Colab 或 Colaboratory 帮助在浏览器上运行 Python 代码,无需任何配置,并可免费访问 GPU(图形处理单元)。Colaboratory 建立在 Jupyter Notebook 之上。
示例
以下是代码片段:
print("The customized pre-processing step") preprocess_layer = TextVectorization( max_tokens=vocab_size, standardize=tf_text.case_fold_utf8, split=tokenizer.tokenize, output_mode='int', output_sequence_length=MAX_SEQUENCE_LENGTH) preprocess_layer.set_vocabulary(vocab) print("The model is being exported") export_model = tf.keras.Sequential( [preprocess_layer, model, layers.Activation('sigmoid')])
代码来源:https://tensorflowcn.cn/tutorials/load_data/text
输出
The customized pre-processing step The model is being exported
解释
如果我们希望我们的模型接受原始字符串作为输入,我们需要创建一个 ‘textVectorization’ 层,它执行与预处理相同的函数。
词汇表已经过训练,这意味着我们可以使用 ‘set_vocabulary’ 方法来训练新的词汇表。
广告