MongoDB - GridFS



GridFS 是 MongoDB 用于存储和检索大型文件的规范,例如图像、音频文件、视频文件等。它是一种用于存储文件的类似文件系统的机制,但其数据存储在 MongoDB 集合中。GridFS 能够存储的文件大小甚至超过其 16MB 的文档大小限制。

GridFS 将文件分成块,并将每个数据块存储在单独的文档中,每个文档的最大大小为 255k。

GridFS 默认使用两个集合fs.filesfs.chunks 来存储文件元数据和块。每个块由其唯一的 _id ObjectId 字段标识。fs.files 充当父文档。fs.chunks 文档中的files_id 字段将块链接到其父级。

以下是 fs.files 集合的示例文档:

{
   "filename": "test.txt",
   "chunkSize": NumberInt(261120),
   "uploadDate": ISODate("2014-04-13T11:32:33.557Z"),
   "md5": "7b762939321e146569b07f72c62cca4f",
   "length": NumberInt(646)
}

该文档指定了文件名、块大小、上传日期和长度。

以下是 fs.chunks 文档的示例文档:

{
   "files_id": ObjectId("534a75d19f54bfec8a2fe44b"),
   "n": NumberInt(0),
   "data": "Mongo Binary Data"
}

将文件添加到 GridFS

现在,我们将使用 GridFS 使用put 命令存储一个 mp3 文件。为此,我们将使用 MongoDB 安装文件夹的 bin 文件夹中提供的mongofiles.exe 实用程序。

打开命令提示符,导航到 MongoDB 安装文件夹的 bin 文件夹中的 mongofiles.exe,然后键入以下代码:

>mongofiles.exe -d gridfs put song.mp3

这里,gridfs 是将文件存储到的数据库的名称。如果数据库不存在,MongoDB 将自动动态创建一个新文档。Song.mp3 是上传的文件名。要查看数据库中的文件文档,可以使用 find 查询:

>db.fs.files.find()

上述命令返回以下文档:

{
   _id: ObjectId('534a811bf8b4aa4d33fdf94d'), 
   filename: "song.mp3", 
   chunkSize: 261120, 
   uploadDate: new Date(1397391643474), md5: "e4f53379c909f7bed2e9d631e15c1c41",
   length: 10401959 
}

我们还可以使用以下代码查看与存储的文件相关的 fs.chunks 集合中存在的所有块,使用上一个查询中返回的文档 ID:

>db.fs.chunks.find({files_id:ObjectId('534a811bf8b4aa4d33fdf94d')})

在我的例子中,查询返回了 40 个文档,这意味着整个 mp3 文档被分成 40 个数据块。

广告