一、celery简介,架构
1 celery:芹菜(跟芹菜没有任何关系)
2 python中的一个分布式任务框架
执行异步任务(对立:同步任务):解决耗时任务,将耗时操作任务提交给celery去异步执行,比如发送短信/邮箱、消息推送、音频处理等等
执行延时任务(5分钟后干一件事):解决延迟任务
执行定时任务:每天,隔几分钟,干什么事:解决周期任务,比如每天统计数据
3 解释
Celery is a project with minimal funding, so we don’t support Microsoft Windows. Please don’t open any issues related to that platform.(不怎么支持windos)
4 celery特点(了解)
可以不依赖任何服务器,通过自身命令,启动服务(内部支持socket)
celery服务为其他项目提供异步解决任务的需求
5 Celery架构
Celery的架构由三部分组成,消息中间件(message,broker)、任务执行单元(worker)和任务执行结果存储(task result store)组成
消息中间件
Celery本身不提供消息服务,但是可以方便的和第三方提供的消息中间件集成。包括RabbiMQ,Redis等等
任务执行单元
worker是Celery提供的任务执行的单元,worker并发的运行在分布式的系统节点中
#任务结果存储
Task result store用来存储Worker执行的任务的结果,Celery支持以不同的方式存储任务的结果,Celery支持以不同的
方式存储任务的结果,包括AMQP,redis等

二、celery基本使用
1 写一个py文件
import celery
#消息中间件
broker='redis://127.0.0.1:6379/1' #1 表示使用redis 1 这个db
#结果存储(redis)
backend='redis://127.0.0.1:6379/2' #2 表示使用redis 2 这个db
#实例化得到的对象,指定中间件和结果存储
app = celery.Celery('test',broker=broker,backend=backend)
@app.task
def add(a,b):
return a+b
@app.task
def mul(a,b):
return a*b
2 提交任务(在其他文件中)
from t_celery import add,mull
res=add.delay(100,4) #delay表示异步
print(res) #id号
3 启动worker
#非window平台:celery worker -A t_celery -l info #info代表日志级别
# windows装eventlet:celery worker -A t_celery -l info -P eventlet
4 查看执行结果
from t_celery import app
from celery.result import AsyncResult
#关键字,变量不能定义为关键字
id='5331c70b-1b51-4a15-aa17-2fa0f7952c00'
if __name__ == '__main__':
res=AsyncResult(id=id,app=app)
if res.successful():
result = res.get()
print(result)
elif res.failed():
print('任务失败')
elif res.status == 'PENDING':
print('任务等待中被执行')
elif res.status == 'RETRY':
print('任务异常后正在重试')
elif res.status == 'STARTED':
print('任务以及开始被执行')
三、celery多任务结构
package_celery: # 项目名
celery_task # celery包名 (启动celery worker的路径)
__init__.py
celery.py # celery 的app,必须叫celery
order_task.py # 任务
user_task.py # 任务
result.py # 结果查询
submit_tast.py # 提交任务
#运行worker(在package_celery目录下执行)
celery worker -A celery_task -l info -P eventlet
#提交任务
from celery_task import order_task,user_task
#提交一个给用户发短信的任务
res=user_task.send_sms.delay('1872465747')
print(res)
#提交一个取消订单任务
res=order_task.cancel_order.delay()
print(res)
# 真实应用场景
-秒杀系统
-不能秒超,使用锁(mysql悲观锁,乐观锁),redis锁
-提高并发量---》把同步做成异步---》使用celery
-前端点击秒杀按钮,向后端发送秒杀请求---》同步操作
-同步操作
-请求来到后端,判断数量是否够,如果够,要生成订单(mysql),订单状态是待支付状 态
-请求返回,告诉前端,秒杀成功
-异步操作
-请求来到后端,提交一个celery任务---》celery任务异步的执行判断数量是否够,如 果够,要生成订单(mysql)
-秒杀是否成功的结果还没有,直接返回了(返回任务id)
-前端启动一个定时任务,每隔5s,向后台发送一个查询请求,查询秒杀任务是否执行完 成(带着任务id查)
-如果是未执行状态,或者执行中---》返回给前端,前端不处理,定时任务继续执行
-又隔了5s,发送查询,查询到秒杀成功的结果,返回给前端,秒杀成功
注意:在用celery多任务结构的时候,启动celery worker 时文件的路径,是celery包名,不是celery文件夹
四、高级使用之延时任务
#celery执行延时任务 #第一种方式:2021年1月7日17点3分12秒发送短信 #from datetime import datetime #eta:延迟多长时间执行,eta需要传时间对象,并且是utc时间 #v1 = datetime(2021,1,7,17,3,12) print(v1) v2 = datetime.utcfromtimestamp(v1.timestamp()) print(v2) #args是真正的函数传的参数,eta传的是时间 res=user_task.send_sms.apply_async( args=['1879531248',],eta=v2)
##第二种方式:隔几秒后执行(用的多) from datetime import datetime from datetime import timedelta ctime = datetime.now() #默认用utc时间 utc_time = datetime.utcfromtimestamp(ctime.timestamp()) time_delay = timedelta(seconds=10)
task_time = utc_time + time_delay #(延迟的时间) print(task_time)
#args(是函数真正传的参数,) eta(是延迟的时间) res=user_task.send_sms.apply_async(args=['18945456456',],eta=task_time)
五、定时任务
# 在celery.py中配置
# 时区
app.conf.timezone = 'Asia/Shanghai'
# 是否使用UTC
app.conf.enable_utc = False
# 任务的定时配置
from datetime import timedelta
from celery.schedules import crontab
app.conf.beat_schedule = {
#要执行几个就配置几个
'send-msg':{
'task': 'celery_task.user_task.send_sms',
# 'schedule': timedelta(hours=24*10),
# 'schedule': crontab(hour=8, day_of_week=1), # 每周一早八点
'schedule': crontab(hour=8, day_of_month=1), # 每月一号早八点
'args': ('18964352112',),
}
}
# 用定时任务必须启动beat,负责每隔3s提交一个任务(自动提交)
celery beat -A celery_task -l info
# 启动worker
celery worker -A celery_task -l info -P eventlet
六、django中使用celery
1 celery是独立的,跟框架没有关系 2 Django-celery第三方模块,兼容性不好,一般不采用 3 目录 celery_task __init__.py celery.py home_task.py order_task.py user_task.py luffyapi
以后使用可以直接复制这个目录结构
七、在路飞中具体使用
7.1 home_task.py
from celery_task.celery import app @app.task def update_banner(): from django.core.cache import cache from django.conf import settings from home import models from home import serializer banners=models.Banner.objects.filter(is_delete=False, is_show=True).order_by('-order')[:settings.BANNER_SIZE] ser = serializer.BannerModelSerializer(instance=banners,many=True) banner_data=ser.data # 拿不到request对象,所以头像的连接base_url要自己组装 for banner in banner_data: banner['img'] = 'http://127.0.0.1:8000%s' % banner['img'] cache.set('banner_data',banner_data) return True
7.2 celery.py
import celery import os # 执行django配置文件,环境变量加入 os.environ.setdefault("DJANGO_SETTINGS_MODULE", "luffyapi.settings.dev") broker='redis://127.0.0.1:6379/1' # 1 表示使用redis 1 这个db backend='redis://127.0.0.1:6379/2' # 2 表示使用redis 2 这个db app=celery.Celery('test',broker=broker,backend=backend, include=['celery_task.order_task','celery_task.user_task','celery_task.home_task'] ) # 时区 app.conf.timezone = 'Asia/Shanghai' # 是否使用UTC app.conf.enable_utc = False # 任务的定时配置 from datetime import timedelta from celery.schedules import crontab app.conf.beat_schedule = { # 'send-msg':{ # 'task': 'celery_task.user_task.send_sms', # # 'schedule': timedelta(hours=24*10), # # 'schedule': crontab(hour=8, day_of_week=1), # 每周一早八点 # 'schedule': crontab(hour=8, day_of_month=1), # 每月一号早八点 # 'args': ('18964352112',), # } 'update-banner':{ 'task': 'celery_task.home_task.update_banner', 'schedule': timedelta(seconds=10), 'args': (), } }
views.py
from celery_task import user_task from celery_task.celery import app from celery.result import AsyncResult def test_celery(request): res_id = request.GET.get('id') if res_id: res = AsyncResult(id=res_id, app=app) if res.successful(): result = res.get() print(result) return HttpResponse('执行完成了,结果是:%s' % result) res = user_task.send_sms.delay('18276345221') return HttpResponse('任务号是:%s' % str(res))
首页轮播图定时更新
1 把首页轮播图接口改成,先去缓存中取,缓存中没有,再去数据库查 2 首页轮播图加入了缓存 3 以后,如果你的接口,请求慢,第一反应就是先使用缓存 4 使用celery定时更新缓存
class BannerView(GenericViewSet, ListModelMixin): queryset = models.Banner.objects.filter(is_delete=False, is_show=True).order_by('-order')[:settings.BANNER_SIZE] serializer_class = serializer.BannerModelSerializer # 改成,先从缓存中取,缓存中如果有,直接返回,没有,再去数据库查 def list(self, request, *args, **kwargs): # 如果缓存中有值,直接取出来返回,速度很快 banner_data = cache.get('banner_data') if banner_data: print('走了缓存') return Response(data=banner_data) # 如果缓存中没有,再走数据,查出来,放到缓存中 res = super().list(request, *args, **kwargs) # 把首页轮播图数据放到缓存中 cache.set('banner_data', res.data) print('没走缓存') return res
浙公网安备 33010602011771号