本节内容
-
RabbitMQ队列
- RabbitMQ消息分发轮循
- RabbitMQ持久化
- RabbitMQ公平的消息分发
- RabbitMQ Publish\Subscribe(消息发布\订阅)
- RabbitMQ RPC(Remote Procedure Call)
-
缓存数据库
- Redis
- Memcached
一、RabbitMQ队列
MAC下安装: http://www.rabbitmq.com/install-standalone-mac.html
RabbitMQ和线程、进程的queue一样都是队列,不过线程(threading) queue只能在同一进程下的线程间通信,进程(mutiproess) Queue只能在同一父进程下的各进程间通信,而RabbitMQ可以实现独立进程间的通信,类似的还有ZeroMQ、ActiveMQ等。在Python中可以通过pika(celery、haigha)调用RabbiMQ。
RabbitMQ 在OpenStack中使用比较多。
1.RabbitMQ消息分发轮循
生产者默认会轮循的将队列中的消息分发给多个符合条件的消费者(类似负载均衡)。
通信原理图:

声明消息队列过程:
首先建立一个Connection,Producer和Consumer都是通过Socket连接到RabbitMQ的;然后通过Connection建立Channel,Channel相当于数据流动的通道;最后在Channel上声明队列。
声明队列时指定durable参数为True,队列将持久化;指定exclusive为True,队列为临时队列,关闭consumer后该队列将不再存在。一般情况下建立临时队列并不指定队列名称,rabbitmq将随机起名,通过result.method.queue来获取队列名:
result = channel.queue_declare(exclusive=True)
result.method.queue
声明队列参数durable与exclusive区别:
- durable(队列是否持久化):如果为True,队列将在rabbitmq服务重启后仍存在;如果为False,队列在rabbitmq服务重启前不会消失,不会受consumer关闭的影响。
- exclusive(建立临时队列):当consumer关闭后,该队列就会被删除。
简单实现:
Producer
-
import pika
-
-
#相当于建立一个socket连接
-
connection = pika.BlockingConnection(
-
pika.ConnectionParameters('192.168.3.121')
-
)
-
channel = connection.channel() #声明一个管道
-
-
# 声明queue
-
channel.queue_declare(queue='hello')
-
-
# n RabbitMQ a message can never be sent directly to the queue, it always needs to go through an exchange.
-
channel.basic_publish(exchange='',
-
routing_key='hello', #要发给哪个queque
-
body='Hello World!' #要发送消息内容
-
)
-
print(" [x] Sent 'Hello World!'")
-
connection.close()
consumer
-
import pika,time
-
-
connection = pika.BlockingConnection(pika.ConnectionParameters(
-
'localhost'))
-
-
channel = connection.channel()
-
-
# You may ask why we declare the queue again ‒ we have already declared it in our previous code.
-
# We could avoid that if we were sure that the queue already exists. For example if send.py program
-
# was run before. But we're not yet sure which program to run first. In such cases it's a good
-
# practice to repeat declaring the queue in both programs.
-
channel.queue_declare(queue='hello') #如果queue已经存在什么都不做,防止生产者后启动等情况
-
-
def callback(ch, method, properties, body):
-
print("-->",ch, method, properties) #ch就是channel
-
#time.sleep(30)
-
print(" [x] Received %r" % body)
-
ch.basic_ack(delivery_tag=method.delivery_tag) #必须手动发送给生产者消息处理完确认
-
-
#声明怎么消费消息
-
channel.basic_consume(callback, #如果收到消息就调用callback函数处理消息
-
queue='hello',
-
no_ack=True) #Tell the broker to not expect a response(False)
-
#默认生产者等待一个消费者处理完消息的确认,需手动确认(no_ack=False),然后生产者才从队列中
-
#删除消息,如果消费未处理完,消费者socket断开,生产者自动发送消息给另外的消费者
-
-
print(' [*] Waiting for messages. To exit press CTRL+C')
-
#开始消费,启动就一直运行,没有就卡住
-
channel.start_consuming()
常用的RabbitMQ命令
- Rabbitmqctl list_users
- Rabbitmqctl list_queues
2.RabbitMQ持久化
RabbitMQ中queue以及queue中的消息,默认情况下在RabbitMQ服务停止后就会消失
队列持久化
RabbitMQ服务重启后,queue不消失,但是queue中消息没了。此时代码中生产者端需要在声明queue时加参数durable=True。注意接收消息端声明queue时也要相应的添加参数durable=True。
-
import pika
-
-
#相当于建立一个socket连接
-
connection = pika.BlockingConnection(
-
pika.ConnectionParameters('192.168.3.121')
-
)
-
channel = connection.channel() #声明一个管道
-
-
# 声明queue
-
channel.queue_declare(queue='hello',durable=True) #durable=True队列持久化,服务器宕机不消失(消费者queue声明也要相应加)
-
-
# n RabbitMQ a message can never be sent directly to the queue, it always needs to go through an exchange.
-
channel.basic_publish(exchange='', #指定要发给谁
-
routing_key='hello', #要发给哪个queque
-
body='Hello World!', #要发送消息内容
-
)
-
print(" [x] Sent 'Hello World!'")
-
connection.close()
队列和消息均持久化
RabbitMQ服务重启后,queue以及其中消息不消失。此时代码中生产者端不仅需要持久化queue,还要在发送消息时添加参数。
-
import pika
-
-
#相当于建立一个socket连接
-
connection = pika.BlockingConnection(
-
pika.ConnectionParameters('192.168.3.121')
-
)
-
channel = connection.channel() #声明一个管道
-
-
# 声明queue
-
channel.queue_declare(queue='hello',durable=True) #durable=True队列持久化,服务器宕机不消失(消费者queue声明也要相应加)
-
-
# n RabbitMQ a message can never be sent directly to the queue, it always needs to go through an exchange.
-
channel.basic_publish(exchange='', #指定要发给谁
-
routing_key='hello', #要发给哪个queque
-
body='Hello World!', #要发送消息内容
-
properties=pika.BasicProperties(
-
delivery_mode=2, #make message persistent 消息持久化
-
)
-
)
-
print(" [x] Sent 'Hello World!'")
-
connection.close()
3.RabbitMQ公平的消息分发
消费者端添加参数channel.basic_qos(prefetch_count=1),意思就是告诉RabbitMQ在我这个消费者当前消息还没处理完的时候就不要再给我发新消息了。
-
import pika,time
-
-
connection = pika.BlockingConnection(pika.ConnectionParameters(
-
'localhost'))
-
-
channel = connection.channel()
-
-
# You may ask why we declare the queue again ‒ we have already declared it in our previous code.
-
# We could avoid that if we were sure that the queue already exists. For example if send.py program
-
# was run before. But we're not yet sure which program to run first. In such cases it's a good
-
# practice to repeat declaring the queue in both programs.
-
channel.queue_declare(queue='hello') #如果queue已经存在什么都不做,防止生产者后启动等情况
-
-
def callback(ch, method, properties, body):
-
print("-->",ch, method, properties) #ch就是channel
-
#time.sleep(30)
-
print(" [x] Received %r" % body)
-
ch.basic_ack(delivery_tag=method.delivery_tag) #必须手动发送给生产者消息处理完确认
-
-
channel.basic_qos(prefetch_count=1)#发消息时生产者检测消费者在队列中累积的消息(处理中的)超过1,就不再发消息给该消费者
-
#声明怎么消费消息
-
channel.basic_consume(callback, #如果收到消息就调用callback函数处理消息
-
queue='hello',
-
no_ack=True) #Tell the broker to not expect a response(False)
-
#默认生产者等待一个消费者处理完消息的确认,需手动确认(no_ack=False),然后生产者才从队列中
-
#删除消息,如果消费未处理完,消费者socket断开,生产者自动发送消息给另外的消费者
-
-
print(' [*] Waiting for messages. To exit press CTRL+C')
-
#开始消费,启动就一直运行,没有就卡住
-
channel.start_consuming()
4.RabbitMQ消息发布\订阅(Publish\Subscribe)
如果想让发送的消息被所有的Queue收到,类似广播的效果,这时候就要用到exchange。
Exchange中durable参数指定exchange是否持久化,exchange参数指定exchange名称,type指定exchange类型。Exchange类型有direct,fanout和topic。
Bind是将exchange与queue进行关联,exchange参数和queue参数分别指定要进行bind的exchange和queue,routing_key用来对发布的消息进行分类(过滤)。
Exchange在定义的时候是有类型的,以决定到底是哪些Queue符合条件,可以接收消息
- fanout: 所有bind到此exchange的queue都可以接收消息
- direct: 通过routingKey和exchange决定的那个唯一的queue可以接收消息
-
topic:所有符合routingKey(此时可以是一个表达式)的routingKey所bind的queue可以接收消息
表达式符号说明:
#代表一个或多个字符,*代表任何字符
例:#.a会匹配a.a,aa.a,aaa.a等, *.a会匹配a.a,b.a,c.a等
注:使用RoutingKey为#,Exchange Type为topic的时候相当于使用fanout - headers: 通过headers 来决定把消息发给哪些queue
接收所有消息(exchange type=fanout)
消息publisher
-
import pika
-
import sys
-
-
connection = pika.BlockingConnection(pika.ConnectionParameters(
-
host='localhost'))
-
channel = connection.channel()
-
-
channel.exchange_declare(exchange='logs',
-
exchange_type='fanout')
-
-
message = ' '.join(sys.argv[1:]) or "info: Hello World!"
-
channel.basic_publish(exchange='logs',
-
routing_key='',
-
body=message)
-
print(" [x] Sent %r" % message)
-
connection.close()
消息subscriber
-
import pika
-
-
connection = pika.BlockingConnection(pika.ConnectionParameters(
-
host='localhost'))
-
channel = connection.channel()
-
-
channel.exchange_declare(exchange='logs',
-
exchange_type='fanout')
-
-
result = channel.queue_declare(exclusive=True) # 不指定queue名字,rabbit会随机分配一个名字,exclusive=True会在使用此queue的消费者断开后,自动将queue删除
-
queue_name = result.method.queue #随机生成queue_name
-
-
channel.queue_bind(exchange='logs', #绑定转发器
-
queue=queue_name) #指定一个queue绑定到转发器,转发器发消息到queue就不管了
-
-
print(' [*] Waiting for logs. To exit press CTRL+C')
-
-
def callback(ch, method, properties, body):
-
print(" [x] %r" % body)
-
-
channel.basic_consume(callback,
-
queue=queue_name,
-
no_ack=True)
-
-
channel.start_consuming()
有选择的接收消息(exchange type=direct)
RabbitMQ还支持根据关键字发送,即:队列绑定关键字(routing_key),发送者将数据根据关键字发送到消息exchange,exchange根据关键字判定应该将数据发送至哪个指定队列。
如果Exchange没有发现能够与routing_key匹配的Queue,则会抛弃此消息。
消息publisher
-
import pika
-
import sys
-
-
connection = pika.BlockingConnection(pika.ConnectionParameters(
-
host='localhost'))
-
channel = connection.channel()
-
-
channel.exchange_declare(exchange='direct_logs',
-
exchange_type='direct')
-
-
severity = sys.argv[1] if len(sys.argv) > 1 else 'info'
-
message = ' '.join(sys.argv[2:]) or 'Hello World!'
-
channel.basic_publish(exchange='direct_logs',
-
routing_key=severity,
-
body=message)
-
print(" [x] Sent %r:%r" % (severity, message))
-
connection.close()
消息subscriber
-
import pika
-
import sys
-
-
#选择性接收消息,通过routingKey和exchange决定哪个queue可以接受消息
-
connection = pika.BlockingConnection(pika.ConnectionParameters(
-
host='localhost'))
-
channel = connection.channel()
-
-
channel.exchange_declare(exchange='direct_logs',
-
exchange_type='direct')
-
-
result = channel.queue_declare(exclusive=True)
-
queue_name = result.method.queue
-
-
severities = sys.argv[1:]
-
if not severities:
-
sys.stderr.write("Usage: %s [info] [warning] [error]\n" % sys.argv[0])
-
sys.exit(1)
-
-
for severity in severities:#把所有级别的消息都绑定到该消费者
-
channel.queue_bind(exchange='direct_logs',
-
queue=queue_name,
-
routing_key=severity)
-
-
print(' [*] Waiting for logs. To exit press CTRL+C')
-
-
-
def callback(ch, method, properties, body):
-
print(" [x] %r:%r" % (method.routing_key, body))
-
-
-
channel.basic_consume(callback,
-
queue=queue_name,
-
no_ack=True)
-
-
channel.start_consuming()
更细致的消息过滤(exchange type=topic)
代码与exchange type=direct并无太大区别,不过在消息过滤可以更加精细化。
该模式在进行Queue绑定时,要提供一个该队列关心的主题,如"#.log.#"表示该队列关心所有涉及log的消息(一个routing_key为"MQ.log.error"的消息会被转发到该队列)。 "#"表示0个或若干个关键字,"*"表示一个关键字。如"log.*"能与"log.warn"匹配,无法与"log.warn.timeout"匹配;但是"log.#"能与上述两者匹配。
如果Exchange没有发现能够与routing_key匹配的Queue,则会抛弃此消息。
消息publisher
-
import pika
-
import sys
-
-
connection = pika.BlockingConnection(pika.ConnectionParameters(
-
host='localhost'))
-
channel = connection.channel()
-
-
channel.exchange_declare(exchange='topic_logs',
-
exchange_type='topic')
-
-
routing_key = sys.argv[1] if len(sys.argv) > 1 else 'anonymous.info'
-
message = ' '.join(sys.argv[2:]) or 'Hello World!'
-
channel.basic_publish(exchange='topic_logs',
-
routing_key=routing_key,
-
body=message)
-
print(" [x] Sent %r:%r" % (routing_key, message))
-
connection.close()
消息subscriber
-
import pika
-
import sys
-
-
#更细致的消息过滤,mysql.error,mysql.info
-
connection = pika.BlockingConnection(pika.ConnectionParameters(
-
host='localhost'))
-
channel = connection.channel()
-
-
channel.exchange_declare(exchange='topic_logs',
-
exchange_type='topic')
-
-
result = channel.queue_declare(exclusive=True)
-
queue_name = result.method.queue
-
-
binding_keys = sys.argv[1:]
-
if not binding_keys:
-
sys.stderr.write("Usage: %s [binding_key]...\n" % sys.argv[0])
-
sys.exit(1)
-
-
for binding_key in binding_keys:
-
channel.queue_bind(exchange='topic_logs',
-
queue=queue_name,
-
routing_key=binding_key)
-
-
print(' [*] Waiting for logs. To exit press CTRL+C')
-
-
-
def callback(ch, method, properties, body):
-
print(" [x] %r:%r" % (method.routing_key, body))
-
-
-
channel.basic_consume(callback,
-
queue=queue_name,
-
no_ack=True)
-
-
channel.start_consuming()
-
-
# To receive all the logs run:
-
# python receive_logs_topic.py "#"
-
-
# To receive all logs from the facility "kern":
-
# python receive_logs_topic.py "kern.*"
-
-
# Or if you want to hear only about "critical" logs:
-
# python receive_logs_topic.py "*.critical"
-
-
# You can create multiple bindings:
-
# python receive_logs_topic.py "kern.*" "*.critical"
-
-
# And to emit a log with a routing key "kern.critical" type:
-
# python emit_log_topic.py "kern.critical" "A critical kernel error
5.RabbitMQ RPC(Remote Procedure Call)
消费者接受消息后,处理消息完毕将结果返回给生产者。

RPC Server
-
import pika
-
import time
-
-
connection = pika.BlockingConnection(pika.ConnectionParameters(
-
host='localhost'))
-
-
channel = connection.channel()
-
-
channel.queue_declare(queue='rpc_queue')
-
-
def fib(n):
-
if n == 0:
-
return 0
-
elif n == 1:
-
return 1
-
else:
-
return fib(n - 1) + fib(n - 2)
-
-
def on_request(ch, method, props, body): #props获取rpc_client的channel.basic_publish的properties
-
n = int(body)
-
-
print(" [.] fib(%s)" % n)
-
response = fib(n)
-
-
ch.basic_publish(exchange='',
-
routing_key=props.reply_to, #返回消息给哪个queue
-
properties=pika.BasicProperties(correlation_id= \
-
props.correlation_id),
-
body=str(response))
-
ch.basic_ack(delivery_tag=method.delivery_tag) #消息处理完成,返回确认
-
-
channel.basic_consume(on_request, queue='rpc_queue')
-
-
print(" [x] Awaiting RPC requests")
-
channel.start_consuming()
RPC Client
-
import pika
-
import uuid
-
import time
-
-
class FibonacciRpcClient(object):
-
def __init__(self):
-
self.connection = pika.BlockingConnection(pika.ConnectionParameters(
-
host='localhost'))
-
-
self.channel = self.connection.channel()
-
-
result = self.channel.queue_declare(exclusive=True)
-
self.callback_queue = result.method.queue
-
-
self.channel.basic_consume(self.on_response, #回调函数,只要一收到消息就调用on_response
-
no_ack=True,
-
queue=self.callback_queue)
-
-
def on_response(self, ch, method, props, body):
-
if self.corr_id == props.correlation_id: #返回值uuid是否跟发消息时生成的uuid一致(多条消息返回值处理)
-
self.response = body
-
-
def call(self, n): #发消息
-
self.response = None
-
self.corr_id = str(uuid.uuid4())
-
self.channel.basic_publish(exchange='',
-
routing_key='rpc_queue',
-
properties=pika.BasicProperties(
-
reply_to=self.callback_queue, #让rpc_server返回结果给哪个queue
-
correlation_id=self.corr_id,
-
),
-
body=str(n))
-
while self.response is None:
-
self.connection.process_data_events() #非阻塞版的start_consuming(有消息就收消息,没有就继续执行)
-
print('no msg......')
-
time.sleep(0.5)
-
return int(self.response)
-
-
-
fibonacci_rpc = FibonacciRpcClient()
-
-
print(" [x] Requesting fib(30)")
-
response = fibonacci_rpc.call(30)
-
print(" [.] Got %r" % response)
二、缓存数据库
NoSQL(NoSQL = Not Only SQL ),意即"不仅仅是SQL",泛指非关系型的数据库,随着互联网web2.0网站的兴起,传统的关系数据库在应付web2.0网站,特别是超大规模和高并发的SNS类型的web2.0纯动态网站已经显得力不从心,暴露了很多难以克服的问题,而非关系型的数据库则由于其本身的特点得到了非常迅速的发展。NoSQL数据库的产生就是为了解决大规模数据集合多重数据种类带来的挑战,尤其是大数据应用难题。
NoSQL数据库的四大分类
- 键值(Key-Value)存储数据库
这一类数据库主要会使用到一个哈希表,这个表中有一个特定的键和一个指针指向特定的数据。Key/value模型对于IT系统来说的优势在于简单、易部署。但是如果DBA只对部分值进行查询或更新的时候,Key/value就显得效率低下了。如:Tokyo Cabinet/Tyrant, Redis, Voldemort, Oracle BDB.
- 列存储数据库
这部分数据库通常是用来应对分布式存储的海量数据。键仍然存在,但是它们的特点是指向了多个列。这些列是由列家族来安排的。如:Cassandra, HBase, Riak.
- 文档型数据库
文档型数据库的灵感是来自于Lotus Notes办公软件的,而且它同第一种键值存储相类似。该类型的数据模型是版本化的文档,半结构化的文档以特定的格式存储,比如JSON。文档型数据库可 以看作是键值数据库的升级版,允许之间嵌套键值。而且文档型数据库比键值数据库的查询效率更高。如:CouchDB, MongoDb. 国内也有文档型数据库SequoiaDB,已经开源。
- 图形(Graph)数据库
图形结构的数据库同其他行列以及刚性结构的SQL数据库不同,它是使用灵活的图形模型,并且能够扩展到多个服务器上。NoSQL数据库没有标准的查询语言(SQL),因此进行数据库查询需要制定数据模型。许多NoSQL数据库都有REST式的数据接口或者查询API。 如:Neo4J, InfoGrid, Infinite Graph.
因此,我们总结NoSQL数据库在以下的这几种情况下比较适用:1、数据模型比较简单;2、需要灵活性更强的IT系统;3、对数据库性能要求较高;4、不需要高度的数据一致性;5、对于给定key,比较容易映射复杂值的环境。
NoSQL数据库的四大分类表格分析
|
分类 |
Examples举例 |
典型应用场景 |
数据模型 |
优点 |
缺点 |
|
键值(key-value) |
Tokyo Cabinet/Tyrant, Redis, Voldemort, Oracle BDB |
内容缓存,主要用于处理大量数据的高访问负载,也用于一些日志系统等等。 |
Key 指向 Value 的键值对,通常用hash table来实现 |
查找速度快 |
数据无结构化,通常只被当作字符串或者二进制数据 |
|
列存储数据库 |
Cassandra, HBase, Riak |
分布式的文件系统 |
以列簇式存储,将同一列数据存在一起 |
查找速度快,可扩展性强,更容易进行分布式扩展 |
功能相对局限 |
|
文档型数据库 |
CouchDB, MongoDb |
Web应用(与Key-Value类似,Value是结构化的,不同的是数据库能够了解Value的内容) |
Key-Value对应的键值对,Value为结构化数据 |
数据结构要求不严格,表结构可变,不需要像关系型数据库一样需要预先定义表结构 |
查询性能不高,而且缺乏统一的查询语法。 |
|
图形(Graph)数据库 |
Neo4J, InfoGrid, Infinite Graph |
社交网络,推荐系统等。专注于构建关系图谱 |
图结构 |
利用图结构相关算法。比如最短路径寻址,N度关系查找等 |
很多时候需要对整个图做计算才能得出需要的信息,而且这种结构不太好做分布式的集群方案。 |
1.Redis
redis是业界主流的key-value nosql 数据库之一。和Memcached类似,它支持存储的value类型相对更多,包括string(字符串)、list(链表)、set(集合)、zset(sorted set --有序集合)和hash(哈希类型)。这些数据类型都支持push/pop、add/remove及取交集并集和差集及更丰富的操作,而且这些操作都是原子性的。在此基础上,redis支持各种不同方式的排序。与memcached一样,为了保证效率,数据都是缓存在内存中。区别的是redis会周期性的把更新的数据写入磁盘或者把修改操作写入追加的记录文件,并且在此基础上实现了master-slave(主从)同步。
Redis有0-15共16个db,使用select db_number 切换db。
Redis命令参考文档 : http://doc.redisfans.com/ https://github.com/andymccurdy/redis-py/
Python中通过redis模块调用redis
-
import redis
-
-
r = redis.Redis(host='192.168.3.121', port=6379)
-
r.set('foo', 'Bar')
-
print(r.get('foo'))
连接池
redis-py使用connection pool来管理对一个redis server的所有连接,避免每次建立、释放连接的开销。
-
import redis
-
-
pool = redis.ConnectionPool(host='192.168.3.121', port=6379)
-
r = redis.Redis(connection_pool=pool)
-
r.set('foo', 'Bar')
-
print(r.get('foo'))
1.1 String操作
redis中的String在在内存中按照一个name对应一个value来存储。如图:

set(name, value, ex=None, px=None, nx=False, xx=False)
-
在Redis中设置值,默认,不存在则创建,存在则修改
-
参数:
-
ex,过期时间(秒)
-
px,过期时间(毫秒)
-
nx,如果设置为True,则只有name不存在时,当前set操作才执行
-
xx,如果设置为True,则只有name存在时,岗前set操作才执行
setnx(name, value)
-
设置值,只有name不存在时,执行设置操作(添加)
setex(name, value, time)
-
# 设置值
-
# 参数:
-
# time,过期时间(数字秒 或 timedelta对象)
psetex(name, time_ms, value)
-
# 设置值
-
# 参数:
-
# time_ms,过期时间(数字毫秒 或 timedelta对象)
mset(*args, **kwargs)
-
批量设置值
-
如:
-
mset(k1='v1', k2='v2')
-
或
-
mget({'k1': 'v1', 'k2': 'v2'})
get(name)
-
获取值
mget(keys, *args)
-
批量获取
-
如:
-
mget('ylr', 'wupeiqi')
-
或
-
r.mget(['ylr', 'wupeiqi'])
getset(name, value)
-
设置新值并获取原来的值
getrange(key, start, end)
-
# 获取子序列(根据字节获取,非字符)
-
# 参数:
-
# name,Redis 的 name
-
# start,起始位置(字节)
-
# end,结束位置(字节)
-
# 如: "武沛齐" ,0-3表示 "武"
setrange(name, offset, value)
-
# 修改字符串内容,从指定字符串索引开始向后替换(新值太长时,则向后添加)
-
# 参数:
-
# offset,字符串的索引,字节(一个汉字三个字节)
-
# value,要设置的值
setbit(name, offset, value)
-
# 对name对应值的二进制表示的位进行操作
-
-
# 参数:
-
# name,redis的name
-
# offset,位的索引(将值变换成二进制后再进行索引)
-
# value,值只能是 1 或 0
-
-
# 注:如果在Redis中有一个对应: n1 = "foo",
-
那么字符串foo的二进制表示为:01100110 01101111 01101111
-
所以,如果执行 setbit('n1', 7, 1),则就会将第7位设置为1,
-
那么最终二进制则变成 01100111 01101111 01101111,即:"goo"
-
-
# 扩展,转换二进制表示:
-
-
# source = "武沛齐"
-
source = "foo"
-
-
for i in source:
-
num = ord(i)
-
print bin(num).replace('b','')
-
-
特别的,如果source是汉字 "武沛齐"怎么办?
-
答:对于utf-8,每一个汉字占 3 个字节,那么 "武沛齐" 则有 9个字节
-
对于汉字,for循环时候会按照 字节 迭代,那么在迭代时,将每一个字节转换 十进制数,然后再将十进制数转换成二进制
-
11100110 10101101 10100110 11100110 10110010 10011011 11101001 10111101 10010000
*用途举例,用最省空间的方式,存储在线用户数及分别是哪些用户在线
getbit(name, offset)
# 获取name对应的值的二进制表示中的某位的值 (0或1)
bitcount(key, start=None, end=None)
-
# 获取name对应的值的二进制表示中 1 的个数
-
# 参数:
-
# key,Redis的name
-
# start,位起始位置
-
# end,位结束位置
strlen(name)
-
# 返回name对应值的字节长度(一个汉字3个字节)
incr(self, name, amount=1)
-
# 自增 name对应的值,当name不存在时,则创建name=amount,否则,则自增。
-
-
# 参数:
-
# name,Redis的name
-
# amount,自增数(必须是整数)
-
-
# 注:同incrby
incrbyfloat(self, name, amount=1.0)
-
# 自增 name对应的值,当name不存在时,则创建name=amount,否则,则自增。
-
-
# 参数:
-
# name,Redis的name
-
# amount,自增数(浮点型)
decr(self, name, amount=1)
-
# 自减 name对应的值,当name不存在时,则创建name=amount,否则,则自减。
-
-
# 参数:
-
# name,Redis的name
-
# amount,自减数(整数)
append(key, value)
-
# 在redis name对应的值后面追加内容
-
-
# 参数:
-
key, redis的name
-
value, 要追加的字符串
1.2 Hash操作
hash表现形式上有些像pyhton中的dict,可以存储一组关联性较强的数据 , redis中Hash在内存中的存储格式如下图:

hset(name, key, value)
-
# name对应的hash中设置一个键值对(不存在,则创建;否则,修改)
-
-
# 参数:
-
# name,redis的name
-
# key,name对应的hash中的key
-
# value,name对应的hash中的value
-
-
# 注:
-
# hsetnx(name, key, value),当name对应的hash中不存在当前key时则创建(相当于添加)
hmset(name, mapping)
-
# 在name对应的hash中批量设置键值对
-
-
# 参数:
-
# name,redis的name
-
# mapping,字典,如:{'k1':'v1', 'k2': 'v2'}
-
-
# 如:
-
# r.hmset('xx', {'k1':'v1', 'k2': 'v2'})
hget(name,key)
-
# 在name对应的hash中获取根据key获取value
hmget(name, keys, *args)
-
# 在name对应的hash中获取多个key的值
-
-
# 参数:
-
# name,reids对应的name
-
# keys,要获取key集合,如:['k1', 'k2', 'k3']
-
# *args,要获取的key,如:k1,k2,k3
-
-
# 如:
-
# r.mget('xx', ['k1', 'k2'])
-
# 或
-
# print r.hmget('xx', 'k1', 'k2')
hgetall(name)
-
获取name对应hash的所有键值
hlen(name)
-
# 获取name对应的hash中键值对的个数
hkeys(name)
-
# 获取name对应的hash中所有的key的值
hvals(name)
-
# 获取name对应的hash中所有的value的值
hexists(name, key)
-
# 检查name对应的hash是否存在当前传入的key
hdel(name,*keys)
-
# 将name对应的hash中指定key的键值对删除
hincrby(name, key, amount=1)
-
# 自增name对应的hash中的指定key的值,不存在则创建key=amount
-
# 参数:
-
# name,redis中的name
-
# key, hash对应的key
-
# amount,自增数(整数)
hincrbyfloat(name, key, amount=1.0)
-
# 自增name对应的hash中的指定key的值,不存在则创建key=amount
-
-
# 参数:
-
# name,redis中的name
-
# key, hash对应的key
-
# amount,自增数(浮点数)
-
-
# 自增name对应的hash中的指定key的值,不存在则创建key=amount
hscan(name, cursor=0, match=None, count=None)
- Start a full hash scan with:
HSCAN myhash 0
- Start a hash scan with fields matching a pattern with:
HSCAN myhash 0 MATCH order_*
- Start a hash scan with fields matching a pattern and forcing the scan command to do more scanning with:
HSCAN myhash 0 MATCH order_* COUNT 1000
-
# 增量式迭代获取,对于数据大的数据非常有用,hscan可以实现分片的获取数据,并非一次性将数据全部获取完,从而放置内存被撑爆
-
-
# 参数:
-
# name,redis的name
-
# cursor,游标(基于游标分批取获取数据)
-
# match,匹配指定key,默认None 表示所有的key
-
# count,每次分片最少获取个数,默认None表示采用Redis的默认分片个数
-
-
# 如:
-
# 第一次:cursor1, data1 = r.hscan('xx', cursor=0, match=None, count=None)
-
# 第二次:cursor2, data1 = r.hscan('xx', cursor=cursor1, match=None, count=None)
-
# ...
-
# 直到返回值cursor的值为0时,表示数据已经通过分片获取完毕
hscan_iter(name, match=None, count=None)
-
# 利用yield封装hscan创建生成器,实现分批去redis中获取数据
-
-
# 参数:
-
# match,匹配指定key,默认None 表示所有的key
-
# count,每次分片最少获取个数,默认None表示采用Redis的默认分片个数
-
-
# 如:
-
# for item in r.hscan_iter('xx'):
-
# print item
1.3 List操作
List操作,redis中的List在在内存中按照一个name对应一个List来存储。如图:

lpush(name,values)
-
# 在name对应的list中添加元素,每个新的元素都添加到列表的最左边
-
-
# 如:
-
# r.lpush('oo', 11,22,33)
-
# 保存顺序为: 33,22,11
-
-
# 扩展:
-
# rpush(name, values) 表示从右向左操作
lpushx(name,value)
-
# 在name对应的list中添加元素,只有name已经存在时,值添加到列表的最左边
-
-
# 更多:
-
# rpushx(name, value) 表示从右向左操作
llen(name)
-
# name对应的list元素的个数
linsert(name, where, refvalue, value))
-
# 在name对应的列表的某一个值前或后插入一个新值
-
-
# 参数:
-
# name,redis的name
-
# where,BEFORE或AFTER
-
# refvalue,标杆值,即:在它前后插入数据
-
# value,要插入的数据
r.lset(name, index, value)
-
# 对name对应的list中的某一个索引位置重新赋值
-
-
# 参数:
-
# name,redis的name
-
# index,list的索引位置
-
# value,要设置的值
r.lrem(name, value, num)
-
# 在name对应的list中删除指定的值
-
-
# 参数:
-
# name,redis的name
-
# value,要删除的值
-
# num, num=0,删除列表中所有的指定值;
-
# num=2,从前到后,删除2个;
-
# num=-2,从后向前,删除2个
lpop(name)
-
# 在name对应的列表的左侧获取第一个元素并在列表中移除,返回值则是第一个元素
-
-
# 更多:
-
# rpop(name) 表示从右向左操作
lindex(name, index)
-
# 在name对应的列表中根据索引获取列表元素
lrange(name, start, end)
-
# 在name对应的列表分片获取数据
-
# 参数:
-
# name,redis的name
-
# start,索引的起始位置
-
# end,索引结束位置
ltrim(name, start, end)
-
# 在name对应的列表中移除没有在start-end索引之间的值
-
# 参数:
-
# name,redis的name
-
# start,索引的起始位置
-
# end,索引结束位置
rpoplpush(src, dst)
-
# 从一个列表取出最右边的元素,同时将其添加至另一个列表的最左边
-
# 参数:
-
# src,要取数据的列表的name
-
# dst,要添加数据的列表的name
blpop(keys, timeout)
-
# 将多个列表排列,按照从左到右去pop对应列表的元素
-
-
# 参数:
-
# keys,redis的name的集合
-
# timeout,超时时间,当元素所有列表的元素获取完之后,阻塞等待列表内有数据的时间(秒), 0 表示永远阻塞
-
-
# 更多:
-
# r.brpop(keys, timeout),从右向左获取数据
brpoplpush(src, dst, timeout=0)
-
# 从一个列表的右侧移除一个元素并将其添加到另一个列表的左侧
-
-
# 参数:
-
# src,取出并要移除元素的列表对应的name
-
# dst,要插入元素的列表对应的name
-
# timeout,当src对应的列表中没有数据时,阻塞等待其有数据的超时时间(秒),0 表示永远阻塞
1.4 集合操作
Set操作,Set集合就是不允许重复的列表
sadd(name,values)
-
# name对应的集合中添加元素
scard(name)
-
# 获取name对应的集合中元素个数
sdiff(keys, *args)
-
# 在第一个name对应的集合中且不在其他name对应的集合的元素集合,差集
sdiffstore(dest, keys, *args)
-
# 获取第一个name对应的集合中且不在其他name对应的集合(差集),再将其新加入到dest对应的集合中
sinter(keys, *args)
-
# 获取多一个name对应集合的交集
sinterstore(dest, keys, *args)
-
# 获取多一个name对应集合的交集,再讲其加入到dest对应的集合中
sismember(name, value)
-
# 检查value是否是name对应的集合的成员
smembers(name)
-
# 获取name对应的集合的所有成员
smove(src, dst, value)
-
# 将某个成员从一个集合中移动到另外一个集合
spop(name)
-
# 从集合的右侧(尾部)移除一个成员,并将其返回
srandmember(name, numbers)
-
# 从name对应的集合中随机获取 numbers 个元素
srem(name, values)
-
# 在name对应的集合中删除某些值
sunion(keys, *args)
-
# 获取多一个name对应的集合的并集
sunionstore(dest,keys, *args)
-
# 获取多一个name对应的集合的并集,并将结果保存到dest对应的集合中
sscan(name, cursor=0, match=None, count=None)
sscan_iter(name, match=None, count=None)
-
# 同字符串的操作,用于增量迭代分批获取元素,避免内存消耗太大
1.5 有序集和操作
有序集合,在集合的基础上,为每元素排序;元素的排序需要根据另外一个值来进行比较,所以,对于有序集合,每一个元素有两个值,即:值和分数,分数专门用来做排序。
zadd(name, *args, **kwargs)
-
# 在name对应的有序集合中添加元素
-
# 如:
-
# zadd('zz', 'n1', 1, 'n2', 2)
-
# 或
-
# zadd('zz', n1=11, n2=22)
zcard(name)
-
# 获取name对应的有序集合元素的数量
zcount(name, min, max)
-
# 获取name对应的有序集合中分数 在 [min,max] 之间的个数
zincrby(name, value, amount)
-
# 自增name对应的有序集合的 name 对应的分数
r.zrange( name, start, end, desc=False, withscores=False, score_cast_func=float)
-
# 按照索引范围获取name对应的有序集合的元素
-
-
# 参数:
-
# name,redis的name
-
# start,有序集合索引起始位置(非分数)
-
# end,有序集合索引结束位置(非分数)
-
# desc,排序规则,默认按照分数从小到大排序
-
# withscores,是否获取元素的分数,默认只获取元素的值
-
# score_cast_func,对分数进行数据转换的函数
-
-
# 更多:
-
# 从大到小排序
-
# zrevrange(name, start, end, withscores=False, score_cast_func=float)
-
-
# 按照分数范围获取name对应的有序集合的元素
-
# zrangebyscore(name, min, max, start=None, num=None, withscores=False, score_cast_func=float)
-
# 从大到小排序
-
# zrevrangebyscore(name, max, min, start=None, num=None, withscores=False, score_cast_func=float)
zrank(name, value)
-
# 获取某个值在 name对应的有序集合中的排行(从 0 开始)
-
-
# 更多:
-
# zrevrank(name, value),从大到小排序
zrem(name, values)
-
# 删除name对应的有序集合中值是values的成员
-
-
# 如:zrem('zz', ['s1', 's2'])
zremrangebyrank(name, min, max)
-
# 根据排行范围删除
zremrangebyscore(name, min, max)
-
# 根据分数范围删除
zscore(name, value)
-
# 获取name对应有序集合中 value 对应的分数
zinterstore(dest, keys, aggregate=None)
-
# 获取两个有序集合的交集,如果遇到相同值不同分数,则按照aggregate进行操作
-
# aggregate的值为: SUM MIN MAX
zunionstore(dest, keys, aggregate=None)
-
# 获取两个有序集合的并集,如果遇到相同值不同分数,则按照aggregate进行操作
-
# aggregate的值为: SUM MIN MAX
zscan(name, cursor=0, match=None, count=None, score_cast_func=float)
zscan_iter(name, match=None, count=None,score_cast_func=float)
# 同字符串相似,相较于字符串新增score_cast_func,用来对分数进行操作
1.6 其他常用操作
delete(*names)
-
# 根据删除redis中的任意数据类型
exists(name)
-
# 检测redis的name是否存在
keys(pattern='*')
-
# 根据模型获取redis的name
-
-
# 更多:
-
# KEYS * 匹配数据库中所有 key 。
-
# KEYS h?llo 匹配 hello , hallo 和 hxllo 等。
-
# KEYS h*llo 匹配 hllo 和 heeeeello 等。
-
# KEYS h[ae]llo 匹配 hello 和 hallo ,但不匹配 hillo
expire(name ,time)
-
# 为某个redis的某个name设置超时时间
rename(src, dst)
-
# 对redis的name重命名为
move(name, db))
-
# 将redis的某个值移动到指定的db下 ,如果指定db下已经有了name就不移动
randomkey()
-
# 随机获取一个redis的name(不删除)
type(name)
-
# 获取name对应值的类型
scan(cursor=0, match=None, count=None)
scan_iter(match=None, count=None)
-
# 同字符串操作,用于增量迭代获取key
1.7 管道
redis-py默认在执行每次请求都会创建(连接池申请连接)和断开(归还连接池)一次连接操作,如果想要在一次请求中指定多个命令,则可以使用pipline实现一次请求指定多个命令,并且默认情况下一次pipline 是原子性操作
-
import redis,time
-
-
pool = redis.ConnectionPool(host='192.168.3.121', port=6379)
-
-
r = redis.Redis(connection_pool=pool)
-
-
# pipe = r.pipeline(transaction=False)
-
pipe = r.pipeline(transaction=True)
-
-
pipe.set('name', 'jack')
-
time.sleep(50)
-
pipe.set('role', 'sb')
-
-
pipe.execute()
1.8发布、订阅

redis_helper
-
import redis
-
-
class RedisHelper:
-
-
def __init__(self):
-
self.__conn = redis.Redis(host='192.168.3.121')
-
self.chan_sub = 'fm104.5'
-
self.chan_pub = 'fm104.5'
-
-
def public(self, msg):
-
'''''发消息,广播'''
-
self.__conn.publish(self.chan_pub, msg)
-
return True
-
-
def subscribe(self):
-
'''''订阅'''
-
pub = self.__conn.pubsub() #打开收音机
-
pub.subscribe(self.chan_sub) #调频道
-
pub.parse_response() #准备接收,再次调用才执行
-
return pub
redis_pub
-
from redis_helper import RedisHelper
-
-
obj = RedisHelper()
-
obj.public('hello')
redis_sub
-
from redis_helper import RedisHelper
-
-
obj = RedisHelper()
-
redis_sub = obj.subscribe()
-
-
while True:
-
msg = redis_sub.parse_response()
-
print(msg)
2.Memcached
Memcached 是一个高性能的分布式内存对象缓存系统,用于动态Web应用以减轻数据库负载。它通过在内存中缓存数据和对象来减少读取数据库的次数,从而提高动态、数据库驱动网站的速度。Memcached基于一个存储键/值对的hashmap。其守护进程(daemon )是用C写的,但是客户端可以用任何语言来编写,并通过memcached协议与守护进程通信。
http://www.cnblogs.com/wupeiqi/articles/5132791.html
三、什么时候用关系型数据库,什么时候 用NoSQL?
Go for legacy relational databases (RDBMS) when:
The data is well structured, and lends itself to a tabular arrangement (rows and columns) in a relational database. Typical examples: bank account info, customer order info, customer info, employee info, department info etc etc.
Another aspect of the above point is : schema oriented data model. When you design a data model (tables, relationships etc) for a potential use of RDBMS, you need to come up with a well defined schema: there will be these many tables, each table having a known set of columns that store data in known typed format (CHAR, NUMBER, BLOB etc).
Very Important: Consider whether the data is transactional in nature. In other words, whether the data will be stored, accessed and updated in the context of transactions providing the ACID semantics or is it okay to compromise some/all of these properties.
Correctness is also important and any compromise is _unacceptable_. This stems from the fact that in most NoSQL databases, consistency is traded off in favor of performance and scalability (points on NoSQL databases are elaborated below).
There is no strong/compelling need for a scale out architecture ; a database that linearly scales out (horizontal scaling) to multiple nodes in a cluster.
The use case is not for "high speed data ingestion".
If the client applications are expecting to quickly stream large amounts of data in/out of the database then relational database may not be a good choice since they are not really designed for scaling write heavy workloads.
In order to achieve ACID properties, lots of additional background work is done especially in writer (INSERT, UPDATE, DELETE) code paths. This definitely affects performance.
The use case is not for "storing enormous amounts of data in the range of petabytes".
Go for NoSQL databases when:
There is no fixed (and predetermined) schema that data fits in:
Scalability, Performance (high throughput and low operation latency), Continuous Availability are very important requirements to be met by the underlying architecture of database.
Good choice for "High Speed Data Ingestion". Such applications (for example IoT style) which generate millions of data points in a second and need a database capable of providing extreme write scalability.
The inherent ability to horizontally scale allows to store large amounts of data across commodity servers in the cluster. They usually use low cost resources, and are able to linearly add compute and storage power as the demand grows.
source page https://www.quora.com/When-should-you-use-NoSQL-vs-regular-RDBMS
参考:
http://www.cnblogs.com/alex3714/articles/5248247.html
http://www.cnblogs.com/alex3714/articles/6217453.html
http://www.cnblogs.com/wupeiqi/articles/5132791.html

浙公网安备 33010602011771号