NoSQL 数据库兄弟会
1、memcache 介绍
• 很早出现的 NoSql 数据库
• 数据都在内存中,一般不持久化
• 支持简单的 key-value 模式
• 一般是作为缓存数据库辅助持久化的数据库
2、redis 介绍
• 几乎覆盖了 Memcached 的绝大部分功能
• 数据都在内存中,支持持久化,主要用作备份恢复
• 除了支持简单的 key-value 模式,还支持多种数据结构的存储,比如 list、set、hash、zset 等。
• 一般是作为缓存数据库辅助持久化的数据库
• 现在市面上用得非常多的一款内存数据库
3、mongoDB 介绍
• 高性能、开源、模式自由(schema free)的文档型数据库
• 数据都在内存中,如果内存不足,把不常用的数据保存到硬盘
• 虽然是 key-value 模式,但是对 value(尤其是 json)提供了丰富的查询功能
• 支持二进制数据及大型(blob)对象
• 可以根据数据的特点替代 RDBMS ,成为独立的数据库。或者配合 RDBMS,存储特定的数据。
4、列式存储 HBase 介绍
• HBase 是 Hadoop 项目中的数据库。它用于需要对大量的数据进行随机、实时的读写操作的场景中。HBase 的目标就是处理数据量非常庞大的表,可以用普通的计算机处理超过 10 亿行数据,还可处理有数百万列元素的数据表。
redis 的适用场景
1.取最新 N 个数据的操作
比如典型的取你网站的最新文章,通过下面方式,我们可以将最新的 5000 条评论的 ID 放在 Redis 的 List 集合中,并将超出集合部分从数据库获取
使用 LPUSH latest.comments<ID>命令,向 list 集合中插入数据
插入完成后再用 LTRIM latest.comments 0 5000 命令使其永远只保存最近 5000 个 ID
然后我们在客户端获取某一页评论时可以用下面的逻辑(伪代码)
FUNCTION get_latest_comments(start,num_items):
id_list =redis.lrange("latest.comments",start,start+num_items-1)
IFid_list.length < num_items
id_list = SQL_DB("SELECT ... ORDER BY time LIMIT ...")
END
RETURNid_list
END
如果你还有不同的筛选维度,比如某个分类的最新 N 条,那么你可以再建一个按此分类的 List,只存 ID 的话,Redis 是非常高效的。
2.排行榜应用,取 TOP N 操作
这个需求与上面需求的不同之处在于,前面操作以时间为权重,这个是以某个条件为权重,比如按顶的次数排序,这时候就需要我们的 sorted set 出马了,将你要排序的值设置成 sorted set 的 score,将具体的数据设置成相应的 value,每次只需要执行一条 ZADD 命令即可。
3.需要精准设定过期时间的应用
比如你可以把上面说到的 sorted set 的 score 值设置成过期时间的时间戳,那么就可以简单地通过过期时间排序,定时清除过期数据了,不仅是清除 Redis 中的过期数据,你完全可以把 Redis 里这个过期时间当成是对数据库中数据的索引,用 Redis 来找出哪些数据需要过期删除,然后再精准地从数据库中删除相应的记录。
4.计数器应用
Redis 的命令都是原子性的,你可以轻松地利用 INCR,DECR 命令来构建计数器系统。
5.Uniq 操作,获取某段时间所有数据排重值
这个使用 Redis 的 set 数据结构最合适了,只需要不断地将数据往 set 中扔就行了,set 意为集合,所以会自动排重。
6.实时系统,反垃圾系统
通过上面说到的 set 功能,你可以知道一个终端用户是否进行了某个操作,可以找到其操作的集合并进行分析统计对比等。没有做不到,只有想不到。
7.Pub/Sub 构建实时消息系统
Redis 的 Pub/Sub 系统可以构建实时的消息系统,比如很多用 Pub/Sub 构建的实时聊天系统的例子。
8.构建队列系统
使用 list 可以构建队列系统,使用 sorted set 甚至可以构建有优先级的队列系统。
9.缓存
将数据直接存放到内存中,性能优于 Memcached,数据结构更多样化。
redis 的特点
高效性:Redis 读取的速度是 110000 次/s,写的速度是 81000 次/s
原子性:Redis 的所有操作都是原子性的,同时 Redis 还支持对几个操作全并后的原子性执行。
支持多种数据结构:string(字符串);list(列表);hash(哈希),set(集合);zset(有序集合)
稳定性:持久化,主从复制(集群)
其他特性:支持过期时间,支持事务,消息订阅。
版权声明: 本文为 InfoQ 作者【大数据技术指南】的原创文章。
原文链接:【http://xie.infoq.cn/article/2ef05cbea398152efb2cc649f】。
本文遵守【CC-BY 4.0】协议,转载请保留原文出处及本版权声明。
评论