原创|MongoDB入门---GridFS&固定集合&自动增长 shell|python|mysql|MongoDB等技术学习

经过前段时间的学习，对MongoDB有了一个大概的了解了。那么今天呢，就来看一下新的东西。在MongoDB中，GridFS 用于存储和恢复那些超过16M（BSON文件限制）的文件(如：图片、音频、视频等)。GridFS 也是文件存储的一种方式，但是它是存储在MonoDB的集合中。GridFS 可以更好的存储大于16M的文件。GridFS 会将大文件对象分割成多个小的chunk(文件片段),一般为256k/个,每个chunk将作为MongoDB的一个文档(document)被存储在chunks集合中。GridFS 用两个集合来存储一个文件：fs.files与fs.chunks。每个文件的实际内容被存在chunks(二进制数据)中,和文件有关的meta数据(filename,content_type,还有用户自定义的属性)将会被存在files集合中。下面看一下简单的 fs.files 集合文档：

{ "filename": "test.txt", "chunkSize": NumberInt(261120), "uploadDate": ISODate("2014-04-13T11:32:33.557Z"), "md5": "7b762939321e146569b07f72c62cca4f", "length": NumberInt(646) }

再来看一下简单的 fs.chunks 集合文档：

{ "files_id": ObjectId("534a75d19f54bfec8a2fe44b"), "n": NumberInt(0), "data": "Mongo Binary Data" }

好啦，大家到这里就有一定的了解了。接下来我们使用 GridFS 的 put 命令来存储 mp3 文件。调用 MongoDB 安装目录下bin的 mongofiles.exe工具。首先，打开命令提示符，进入到MongoDB的安装目录的bin目录中，找到mongofiles.exe，并输入下面的代码：

>mongofiles.exe -d gridfs put song.mp3

GridFS 是存储文件的数据名称。如果不存在该数据库，MongoDB会自动创建。Song.mp3 是音频文件名。然后呢，我们来使用以下命令来查看数据库中文件的文档：

>db.fs.files.find()

执行上述命令之后，这里会返回以下文档数据，请看：

{ _id: ObjectId('534a811bf8b4aa4d33fdf94d'), filename: "song.mp3", chunkSize: 261120, uploadDate: new Date(1397391643474), md5: "e4f53379c909f7bed2e9d631e15c1c41", length: 10401959 }

我们可以看到 fs.chunks 集合中所有的区块，以下我们得到了文件的 _id 值，我们可以根据这个 _id 获取区块(chunk)的数据：

>db.fs.chunks.find({files_id:ObjectId('534a811bf8b4aa4d33fdf94d')})

上面的实例中，查询返回了 40 个文档的数据，意味着mp3文件被存储在40个区块中。OK，到这里，就算是介绍完GridFS了。接下来，我们来看一下固定集合。MongoDB 固定集合（Capped Collections）是性能出色且有着固定大小的集合，对于大小固定，我们可以想象其就像一个环形队列，当集合空间用完后，再插入的元素就会覆盖最初始的头部的元素。接下来，我们通过createCollection来创建一个固定集合，且capped选项设置为true：

>db.createCollection("cappedLogCollection",{capped:true,size:10000})

我们还可以指定文档个数,加上max:1000属性：

>db.createCollection("cappedLogCollection",{capped:true,size:10000,max:1000})

然后呢，我们来判断集合是否为固定集合：
【原创|MongoDB入门---GridFS&固定集合&自动增长】

>db.cappedLogCollection.isCapped()

不是的话，如果需要将已存在的集合转换为固定集合可以使用以下命令：

>db.runCommand({"convertToCapped":"posts",size:10000})

通过上面的代码，我们就会将已存在的 posts 集合转换为固定集合。然后我们来看一下，固定集合的查询。固定集合文档按照插入顺序储存的,默认情况下查询就是按照插入顺序返回的,也可以使用$natural调整返回顺序：

>db.cappedLogCollection.find().sort({$natural:-1})

再来看一下，固定集合的特点。固定集合可以插入及更新,但更新不能超出collection的大小,否则更新失败,不允许删除,但是可以调用drop()删除集合中的所有行,但是drop后需要显式地重建集合。在32位机子上一个cappped collection的最大值约为482.5M,64位上只受系统文件大小的限制。
最后呢，就是它的属性以及用法，首先来看属性：

属性1:对固定集合进行插入速度极快
属性2:按照插入顺序的查询输出速度极快
属性3:能够在插入最新数据时,淘汰最早的数据

再来看一下固定集合的用法：

用法1:储存日志信息
用法2:缓存一些少量的文档

好啦，接下来就是最终要分享的自动增长了。我们都知道，MongoDB 没有像 SQL 一样有自动增长的功能，MongoDB 的 _id 是系统自动生成的12字节唯一标识。但在某些情况下，我们可能需要实现 ObjectId 自动增长功能。由于 MongoDB 没有实现这个功能，我们可以通过编程的方式来实现，以下我们将在 counters 集合中实现_id字段自动增长。首先我们来考虑以下 products 文档。我们希望 _id 字段实现从 1,2,3,4 到 n 的自动增长功能：

{ "_id":1, "product_name": "Apple iPhone", "category": "mobiles" }

为此，创建 counters 集合，序列字段值可以实现自动长：

>db.createCollection("counters")

现在我们向 counters 集合中插入以下文档，使用 productid 作为 key：

{ "_id":"productid", "sequence_value": 0 }

sequence_value 字段是序列通过自动增长后的一个值。我们使用以下命令插入 counters 集合的序列文档中：

>db.counters.insert({_id:"productid",sequence_value:0})

接下来我们来创建JavaScript函数。我们将使用 getNextSequenceValue 函数创建一个新的文档，并设置文档 _id 自动为返回的序列值：

>db.products.insert({ "_id":getNextSequenceValue("productid"), "product_name":"Apple iPhone", "category":"mobiles"})>db.products.insert({ "_id":getNextSequenceValue("productid"), "product_name":"Samsung S3", "category":"mobiles"})

就如你所看到的，我们使用 getNextSequenceValue 函数来设置 _id 字段。为了验证函数是否有效，我们可以使用以下命令读取文档：