原创|MongoDB入门---GridFS&固定集合&自动增长
经过前段时间的学习,对MongoDB有了一个大概的了解了。那么今天呢,就来看一下新的东西。在MongoDB中,GridFS 用于存储和恢复那些超过16M(BSON文件限制)的文件(如:图片、音频、视频等)。GridFS 也是文件存储的一种方式,但是它是存储在MonoDB的集合中。GridFS 可以更好的存储大于16M的文件。GridFS 会将大文件对象分割成多个小的chunk(文件片段),一般为256k/个,每个chunk将作为MongoDB的一个文档(document)被存储在chunks集合中。GridFS 用两个集合来存储一个文件:fs.files与fs.chunks。每个文件的实际内容被存在chunks(二进制数据)中,和文件有关的meta数据(filename,content_type,还有用户自定义的属性)将会被存在files集合中。下面看一下简单的 fs.files 集合文档:
{ "filename": "test.txt", "chunkSize": NumberInt(261120), "uploadDate": ISODate("2014-04-13T11:32:33.557Z"), "md5": "7b762939321e146569b07f72c62cca4f", "length": NumberInt(646) }
再来看一下简单的 fs.chunks 集合文档:
{ "files_id": ObjectId("534a75d19f54bfec8a2fe44b"), "n": NumberInt(0), "data": "Mongo Binary Data" }
好啦,大家到这里就有一定的了解了。接下来我们使用 GridFS 的 put 命令来存储 mp3 文件。调用 MongoDB 安装目录下bin的 mongofiles.exe工具。首先,打开命令提示符,进入到MongoDB的安装目录的bin目录中,找到mongofiles.exe,并输入下面的代码:
>mongofiles.exe -d gridfs put song.mp3
GridFS 是存储文件的数据名称。如果不存在该数据库,MongoDB会自动创建。Song.mp3 是音频文件名。然后呢,我们来使用以下命令来查看数据库中文件的文档:
>db.fs.files.find()
执行上述命令之后,这里会返回以下文档数据,请看:
{ _id: ObjectId('534a811bf8b4aa4d33fdf94d'), filename: "song.mp3", chunkSize: 261120, uploadDate: new Date(1397391643474), md5: "e4f53379c909f7bed2e9d631e15c1c41", length: 10401959 }
我们可以看到 fs.chunks 集合中所有的区块,以下我们得到了文件的 _id 值,我们可以根据这个 _id 获取区块(chunk)的数据:
>db.fs.chunks.find({files_id:ObjectId('534a811bf8b4aa4d33fdf94d')})
上面的实例中,查询返回了 40 个文档的数据,意味着mp3文件被存储在40个区块中。OK,到这里,就算是介绍完GridFS了。接下来,我们来看一下固定集合。MongoDB 固定集合(Capped Collections)是性能出色且有着固定大小的集合,对于大小固定,我们可以想象其就像一个环形队列,当集合空间用完后,再插入的元素就会覆盖最初始的头部的元素。接下来,我们通过createCollection来创建一个固定集合,且capped选项设置为true:
>db.createCollection("cappedLogCollection",{capped:true,size:10000})
我们还可以指定文档个数,加上max:1000属性:
>db.createCollection("cappedLogCollection",{capped:true,size:10000,max:1000})
然后呢,我们来判断集合是否为固定集合:
【原创|MongoDB入门---GridFS&固定集合&自动增长】
>db.cappedLogCollection.isCapped()
不是的话,如果需要将已存在的集合转换为固定集合可以使用以下命令:
>db.runCommand({"convertToCapped":"posts",size:10000})
通过上面的代码,我们就会将已存在的 posts 集合转换为固定集合。然后我们来看一下,固定集合的查询。固定集合文档按照插入顺序储存的,默认情况下查询就是按照插入顺序返回的,也可以使用$natural调整返回顺序:
>db.cappedLogCollection.find().sort({$natural:-1})
再来看一下,固定集合的特点。固定集合可以插入及更新,但更新不能超出collection的大小,否则更新失败,不允许删除,但是可以调用drop()删除集合中的所有行,但是drop后需要显式地重建集合。在32位机子上一个cappped collection的最大值约为482.5M,64位上只受系统文件大小的限制。
最后呢,就是它的属性以及用法,首先来看属性:
- 属性1:对固定集合进行插入速度极快
- 属性2:按照插入顺序的查询输出速度极快
- 属性3:能够在插入最新数据时,淘汰最早的数据
- 用法1:储存日志信息
- 用法2:缓存一些少量的文档
{ "_id":1, "product_name": "Apple iPhone", "category": "mobiles" }
为此,创建 counters 集合,序列字段值可以实现自动长:
>db.createCollection("counters")
现在我们向 counters 集合中插入以下文档,使用 productid 作为 key:
{ "_id":"productid", "sequence_value": 0 }
sequence_value 字段是序列通过自动增长后的一个值。我们使用以下命令插入 counters 集合的序列文档中:
>db.counters.insert({_id:"productid",sequence_value:0})
接下来我们来创建JavaScript函数。我们将使用 getNextSequenceValue 函数创建一个新的文档,并设置文档 _id 自动为返回的序列值:
>db.products.insert({ "_id":getNextSequenceValue("productid"), "product_name":"Apple iPhone", "category":"mobiles"})>db.products.insert({ "_id":getNextSequenceValue("productid"), "product_name":"Samsung S3", "category":"mobiles"})
就如你所看到的,我们使用 getNextSequenceValue 函数来设置 _id 字段。为了验证函数是否有效,我们可以使用以下命令读取文档:
>db.products.find()
以上命令将返回以下结果,我们发现 _id 字段是自增长的:
{ "_id" : 1, "product_name" : "Apple iPhone", "category" : "mobiles"}{ "_id" : 2, "product_name" : "Samsung S3", "category" : "mobiles" }
好啦,到这里呢,今天的分享就结束了。如果感觉不错的话,请多多点赞支持哦。。。
推荐阅读
- MongoDB,Wondows下免安装版|MongoDB,Wondows下免安装版 (简化版操作)
- 绘本讲师训练营【24期】14/21阅读原创《小黑鱼》
- 绘本讲师训练营7期9/21阅读原创《蜗牛屋|绘本讲师训练营7期9/21阅读原创《蜗牛屋 》
- 【原创】君子之心,常怀敬畏
- 《偶得》
- 绘本讲师训练营【28期】15/21阅读原创《活了100万次的猫》
- 你命令我爱你吧(原创)
- [原创]能见沂山一棵树,胜读十年无用书!
- typeScript入门基础介绍
- 【原创】岫奕诗文《南乡子|【原创】岫奕诗文《南乡子 宴饮席间赠高君》(词林正韵)