如何使用 Python 和 TensorFlow 对 Stack Overflow 问题数据集的每个标签预测分数?


TensorFlow 是 Google 提供的一个机器学习框架。它是一个开源框架,与 Python 结合使用以实现算法、深度学习应用程序等等。它用于研究和生产目的。它具有优化技术,有助于快速执行复杂的数学运算。这是因为它使用了 NumPy 和多维数组。这些多维数组也称为“张量”。该框架支持使用深度神经网络。

可以使用以下代码行在 Windows 上安装“tensorflow”包:

pip install tensorflow

张量是 TensorFlow 中使用的数据结构。它有助于连接流图中的边。此流图称为“数据流图”。张量只不过是多维数组或列表。

它们可以使用三个主要属性来识别:

  • - 它告诉张量的维数。可以理解为张量的阶数或已定义的张量中的维数。

  • 类型 - 它告诉张量元素关联的数据类型。它可以是一维、二维或 n 维张量。

  • 形状 - 它是行数和列数的总和。

我们正在使用 Google Colaboratory 来运行以下代码。Google Colab 或 Colaboratory 有助于通过浏览器运行 Python 代码,并且无需任何配置即可免费访问 GPU(图形处理单元)。Colaboratory 是在 Jupyter Notebook 之上构建的。

示例

以下是代码片段:

print("Predicting a score for every label")
def get_string_labels(predicted_scores_batch):
   predicted_int_labels = tf.argmax(predicted_scores_batch, axis=1)
   predicted_labels = tf.gather(raw_train_ds.class_names, predicted_int_labels)
   return predicted_labels

代码来源 - https://tensorflowcn.cn/tutorials/load_data/text

输出

Predicting a score for every label

解释

  • 在构建的模型上调用“predict”方法。

  • 这将以原始字符串作为输入,并预测每个标签的分数。

  • 该函数查找分数最高的标签。

  • 此数据显示在控制台上。

更新于:2021-01-19

106 次查看

开启你的 职业生涯

通过完成课程获得认证

开始
广告

© . All rights reserved.