如何使用Python和Tensorflow探索Stack Overflow问题数据集并查看样本文件?


Tensorflow是谷歌提供的机器学习框架。它是一个开源框架,与Python结合使用,可以实现算法、深度学习应用程序等等。它用于研究和生产目的。

可以使用以下代码行在Windows上安装“tensorflow”包:

pip install tensorflow

Keras是ONEIROS(开放式神经电子智能机器人操作系统)项目研究的一部分。Keras是一个用Python编写的深度学习API。它是一个高级API,具有高效的界面,有助于解决机器学习问题。它运行在Tensorflow框架之上。它旨在帮助快速进行实验。它提供了开发和封装机器学习解决方案所需的必要抽象和构建块。

Keras已经存在于Tensorflow包中。可以使用以下代码行访问它。

import tensorflow
from tensorflow import keras

我们使用Google Colaboratory运行以下代码。Google Colab或Colaboratory有助于在浏览器上运行Python代码,无需任何配置,并可免费访问GPU(图形处理单元)。Colaboratory构建在Jupyter Notebook之上。以下是代码片段:

示例

print("The files in the directory are listed out")
list(dataset_dir.iterdir())
print("The stackoverflow questions are present in the 'train/' directory")
train_dir = dataset_dir/'train'
list(train_dir.iterdir())
sample_file = train_dir/'python/1755.txt'
print("A sample file is displayed")
with open(sample_file) as f:
   print(f.read())

代码来源:https://tensorflowcn.cn/tutorials/load_data/text

输出

The files in the directory are listed out
The stackoverflow questions are present in the 'train/' directory
A sample file is displayed
why does this blank program print true x=true.def stupid():. x=false.stupid().print x

解释

  • 列出了目录中的文件。

  • Stack Overflow数据集中文本数据的样本显示在控制台上。

更新于:2021年1月18日

107 次浏览

启动您的职业生涯

通过完成课程获得认证

开始学习
广告