趣讲 PowerJob 超强大的调度层,开始表演真正的技术了

发表于 3年以前  | 总阅读数:523 次

本文适合有 Java 基础知识的人群

写在前面的碎碎念:终于到了万众期待的调度层原理了。其实很早之前就想动笔把这部分好好给大家讲讲,因为问的人实在是太多了...大部分小伙伴进用户群的第一句话就是:“群猪,请问无锁化调度是怎么实现的?”,剩下的犀利点的小伙伴甚至直接问:“群猪,你这个性能强劲无上限体现在什么地方啊?”。

可惜不巧的是,鄙人在 7 月初给自己安排了一个惊险刺激的大西北旅游,每天不是在坐车就是在前往坐车的路上,虽然感受到了祖国疆域之辽阔、风景之秀丽、文化之璀璨,人累个半死也是确有其事。文章嘛,自然也就是一路鸽到了现在...

那么,是时候表演真正的技术了~

一、调度层概览

PowerJob 目前支持 4 种定时执行策略,分别是 CRON、固定频率、固定延迟 和 API。API 指的是通过 PowerJob 提供的客户端接口直接启动任务的方式,不需要 server 来支持调度,此处忽略。而剩下的 3 种调度策略,根据其执行频率的不同,可以划分为常规任务秒级任务。我们先讲常规任务。

常规任务指由 CRON 表达式指定定时策略的任务,这一类任务的特点是 执行频率不高。 对于这类任务,PowerJob 采用基于数据库轮询的策略来进行调度,具体的原理图如下。

PowerJob 的任务表中,除了维护任务的基础元数据(如任务名称、定时策略、执行器信息等)之外,还会额外增加一个字段 next_trigger_time,也就是下一次调度时间,当任务被成功创建时,系统会使用 CRON 表达式去初始化该字段,保证每一个 CRON 任务都存在可用的下一次调度时间

有了这个字段,具体的调度就好办了。powerjob-server 会启用一个后台线程定期扫描任务表,查找那些由本机调度的、即将执行(即下一次调度时间与当前时间的差值小于系统规定的阈值)的任务。

(这里埋个小小的伏笔,“由本机调度”其实是实现无锁化调度的关键,将在下一篇文章为大家揭秘,本文主要讲述调度流程,因此直接以单机为例)

一旦发现接下来的一段时间内有任务需要被调度执行,就会为这些任务生成执行记录并推入时间轮,最后完成任务的调度。

听起来似乎很平淡无奇的一个流程,存在着那些精彩的设计与实现呢?请听我细细分解~

二、高性能调度——时间轮

假如,现在给你一个任务,要求 2 秒后执行,你会怎么解决的?

最简单的方案,也就是利用休眠。1 秒后执行,那么我让当前线程 sleep 1 秒,不就达到目的了吗?没错,基于线程休眠的特性,可以用三行代码实现一个最简单的定时执行器,但是它的性能嘛...自然也是相当的拉垮...由于每一个任务都需要绑定一个单独的线程,当系统中存在大量任务时,这种方案消耗的资源极其庞大。

那么如何实现高效的调度呢?

也许,就和牛顿被苹果砸出万有引力引力一样,发明时间轮算法的大神,在为寻找高效调度方案而苦恼不已时,低头看了看自己的劳力士~觉得这个表如此的朴实无华的同时,似乎找到了那么一点点灵感~

根据前面分析,线程休眠型调度器之所以低效,是因为它需要用到大量的线程资源,这浪费了大量的 CPU 和内存资源。那么有没有办法来避免这个消耗呢?看着这个表,有人找到了答案。

时间轮是一种高效利用线程资源来进行批量化调度的一种调度模型。把大批量的调度任务全部都绑定到同一个的调度器(一个线程)上面,使用这一个调度器来进行所有任务的管理,触发以及运行,能够高效的管理各种延时任务,周期任务,通知任务等等。

时间轮的算法模型如上图所示,每个时间轮存在着 N 个槽,两个槽之间的间隔时间固定。每走一个时间间隔,指针就向前推进一格,然后开始处理当前槽内的所有任务。指针不断循环推进,直到时间轮中不存在任何任务。

当新增调度任务时,可根据任务的调度时间和当前时间计算出具体的时间槽。为了能以时间复杂度 O(1) 的代价将任务放入指定位置,需要时间槽具有随机访问的能力,为此该部分使用循环数组实现。每一个时间槽对应的任务队列长度不确定,且只需要提供顺序访问能力,为此任务队列使用单向链表实现。

每一个时间轮都有两个必备参数,时间间隔 tickDuration 和 刻度数量 ticksPerWheel。这两个参数也很好理解,时间间隔就是指针转动的频率,刻度数量就是这个表盘内任务槽的数量,拿现实中的手表来说,tickDuration 就是 1,ticksPerWheel 是 12。

讲了那么多理论,这里举个具体的例子来帮助大家理解时间轮(其实时间轮的概念非常好理解,具体的实现也不算很难,可以说是一种性价比超高的数据结构了~)

假如我现在有一个时间间隔为 1 秒,刻度数为 12 的时间轮,现在需要调度 3 个定时任务,分别在 1 秒、6 秒和 13 秒后执行,那么时间轮的工作流程是怎么样的呢?

首先,第一步是任务的插入。由于表盘的设计是环形数据,通过 (预计执行时间 - 时间轮启动时间)% 刻度数 这个公式便能算出该任务的插槽下标,即这些任务会分别被插入到 0、5 和 0 号槽对应的链表中。

完成任务的插入后,接下来就等着调度线程取出任务并执行了。调度线程通过休眠 tickDuration 的方式,循环读取下一个槽中链表中的任务并执行。由于链表中的任务可能不是本轮需要调度的(就比如 13 秒后执行的任务,其实是下一个调度周期才需要执行),需要额外对任务的预计执行时间做判断,只有符合要求的任务才会被调度执行,并从链表中移除。

这样就做到了 1 个线程完成大量任务的调度,兼备性能和效率。唯一的缺点是由于采取了 tickDuration,那么调度会存在着一定的误差。如果你对调度执行的时间精度要求极高,那时间轮可能不是你的菜,否则,还不赶紧抱走?

时间轮的概念讲完了,接下来回归框架本身。PowerJob 所使用的时间轮设计整体参考 Netty,并在一些地方做了定制化处理,比如由于 PowerJob 调度后执行任务有一定的开销(涉及数据库操作),因此除了指针线程,还额外引入了处理线程池来保证调度的精度。源码一共 326 行,有兴趣的话,快去看吧,类名都给你准备好啦!

com.github.kfcfans.powerjob.server.common.utils.timewheel.HashedWheelTimer

三、可靠调度——WAL

可靠调度也是大家广为关注的一个问题,甚至还有同学在 GitHub Issue 留言告诉我他们自研的调度系统在生产环境中遇到的不可靠调度问题:

那么 PowerJob 存在着错过调度的问题吗?答案显然是否定的。(作为一款一直强调极高可用性和稳定性的生产级调度中间件,要是这一点都做不到,那还有脸见人吗?

那么问题又来了,这,又是如何实现的呢?

不知道大家有没有听说过 WAL(Write-Ahead Logging,预写式日志),这是主流关系型数据库(MS SQLServer、MySQL、Oracle)用来确保了事务原子性和持久性的关键技术。WAL 的核心思想是:在数据写入到数据库之前,先写入到日志中。这样,在硬盘数据不损坏的情况下,预写式日志允许存储系统在崩溃后能够在日志的指导下恢复到崩溃前的状态,避免数据丢失。

PowerJob 为了实现任务的可靠调度,也借鉴了该思想。每一个任务被调度执行时,系统都会为其生成一条记录,这条记录包含了该任务实例(任务的一次运行叫任务实例)的预期调度时间。之后,PowerJob 会首先将该记录持久化到数据库中,只有持久化成功后,该任务才会被正式推入时间轮进行调度。

一旦这一台 server 宕机,任务没有被准时执行。其他 server 就能根据已经写入数据库中的任务实例记录将其恢复,做到可靠调度~

也就是说,只要你的系统中还有一台 powerjob-server 活着,就不会有缺失调度的情况。

四、秒级任务

说够了常规任务的调度,让我们来侃侃秒级任务~

秒级任务的特点是运行频率极高(吐槽:这不是废话吗),那么能不能用支持常规任务调度的这套方法来支撑秒级任务的调度呢?

首先是任务的获取。emmm...“一定时间间隔扫描任务表获取待执行任务”,这...等你获取到任务,黄花菜都凉了...这不中啊...没错,使用传统调度方案,第一步就挂了。(我想到了路途艰难,但没想到居然那么难!)

不过,比较聪明的同学可能想到了。既然秒级任务执行频率很高,那 server 获取这个任务后,可以将它保存起来,这样下一次调度就不需要单独查数据库了,而是选择内存遍历,要多快有多快,似乎就解决了这个问题。

然而,这种方式仍不完美。俗话说得好,物以稀为贵,秒级任务的执行频率那么高,在大部分情况下,其实失败个一两次也没什么关系,毕竟立即就会有下一个任务补上。因此,传统任务那一套为了可靠调度而生的机制并不适用于秒级任务,秒级任务使用了那套机制后,也会对数据库产生较大的冲击,导致 PowerJob 整体的性能大幅度下降。那么出路究竟在何方呢?

此时就不得不提解决计算机领域问题的终极神器了:分治。既然不强要求任务执行有非常高的可靠性,那么 powerjob-server 此时就可以放权了。

每一个秒级任务,都会直接被投递到集群中的某一台 powerjob-worker 上,由 powerjob-worker 全权负责执行。而 powerjob-server 此时只需要负责故障恢复即可。

这样一来,server 的压力进一步减轻,同时,由于秒级任务的调度与执行全部落在了 worker 身上,调度的精度也会上升(至少能省下通讯的网络延迟),可谓是一个完美至极的双赢方案。

五、最后

那么以上就是本篇文章全部的内容啦~

本篇文章讲述了 PowerJob 调度层的实现与其中一些精巧的设计。不过限于篇幅,整个调度层其实并没有完全呈现在大家眼前,目前还是犹抱琵琶半遮面的状态~大家最关心的多 server 下任务如何避免重复调度、多 server 如何实现水平的能力扩展本文都没有详细提及,只是简单说了几个字。具体的内容,就放在下一篇文章讲啦~提前剧透一下吧,核心就四个字:分组隔离。等不及的话,自己去代码中寻找答案吧,少年~

PowerJob 项目地址:

https://github.com/KFCFans/PowerJob

本文由哈喽比特于3年以前收录,如有侵权请联系我们。
文章来源:https://mp.weixin.qq.com/s/leFwjW9gOfiuoHzZDgZk3g

 相关推荐

刘强东夫妇:“移民美国”传言被驳斥

京东创始人刘强东和其妻子章泽天最近成为了互联网舆论关注的焦点。有关他们“移民美国”和在美国购买豪宅的传言在互联网上广泛传播。然而,京东官方通过微博发言人发布的消息澄清了这些传言,称这些言论纯属虚假信息和蓄意捏造。

发布于:7月以前  |  808次阅读  |  详细内容 »

博主曝三大运营商,将集体采购百万台华为Mate60系列

日前,据博主“@超能数码君老周”爆料,国内三大运营商中国移动、中国电信和中国联通预计将集体采购百万台规模的华为Mate60系列手机。

发布于:7月以前  |  770次阅读  |  详细内容 »

ASML CEO警告:出口管制不是可行做法,不要“逼迫中国大陆创新”

据报道,荷兰半导体设备公司ASML正看到美国对华遏制政策的负面影响。阿斯麦(ASML)CEO彼得·温宁克在一档电视节目中分享了他对中国大陆问题以及该公司面临的出口管制和保护主义的看法。彼得曾在多个场合表达了他对出口管制以及中荷经济关系的担忧。

发布于:7月以前  |  756次阅读  |  详细内容 »

抖音中长视频App青桃更名抖音精选,字节再发力对抗B站

今年早些时候,抖音悄然上线了一款名为“青桃”的 App,Slogan 为“看见你的热爱”,根据应用介绍可知,“青桃”是一个属于年轻人的兴趣知识视频平台,由抖音官方出品的中长视频关联版本,整体风格有些类似B站。

发布于:7月以前  |  648次阅读  |  详细内容 »

威马CDO:中国每百户家庭仅17户有车

日前,威马汽车首席数据官梅松林转发了一份“世界各国地区拥车率排行榜”,同时,他发文表示:中国汽车普及率低于非洲国家尼日利亚,每百户家庭仅17户有车。意大利世界排名第一,每十户中九户有车。

发布于:7月以前  |  589次阅读  |  详细内容 »

研究发现维生素 C 等抗氧化剂会刺激癌症生长和转移

近日,一项新的研究发现,维生素 C 和 E 等抗氧化剂会激活一种机制,刺激癌症肿瘤中新血管的生长,帮助它们生长和扩散。

发布于:7月以前  |  449次阅读  |  详细内容 »

苹果据称正引入3D打印技术,用以生产智能手表的钢质底盘

据媒体援引消息人士报道,苹果公司正在测试使用3D打印技术来生产其智能手表的钢质底盘。消息传出后,3D系统一度大涨超10%,不过截至周三收盘,该股涨幅回落至2%以内。

发布于:7月以前  |  446次阅读  |  详细内容 »

千万级抖音网红秀才账号被封禁

9月2日,坐拥千万粉丝的网红主播“秀才”账号被封禁,在社交媒体平台上引发热议。平台相关负责人表示,“秀才”账号违反平台相关规定,已封禁。据知情人士透露,秀才近期被举报存在违法行为,这可能是他被封禁的部分原因。据悉,“秀才”年龄39岁,是安徽省亳州市蒙城县人,抖音网红,粉丝数量超1200万。他曾被称为“中老年...

发布于:7月以前  |  445次阅读  |  详细内容 »

亚马逊股东起诉公司和贝索斯,称其在购买卫星发射服务时忽视了 SpaceX

9月3日消息,亚马逊的一些股东,包括持有该公司股票的一家养老基金,日前对亚马逊、其创始人贝索斯和其董事会提起诉讼,指控他们在为 Project Kuiper 卫星星座项目购买发射服务时“违反了信义义务”。

发布于:7月以前  |  444次阅读  |  详细内容 »

苹果上线AppsbyApple网站,以推广自家应用程序

据消息,为推广自家应用,苹果现推出了一个名为“Apps by Apple”的网站,展示了苹果为旗下产品(如 iPhone、iPad、Apple Watch、Mac 和 Apple TV)开发的各种应用程序。

发布于:7月以前  |  442次阅读  |  详细内容 »

特斯拉美国降价引发投资者不满:“这是短期麻醉剂”

特斯拉本周在美国大幅下调Model S和X售价,引发了该公司一些最坚定支持者的不满。知名特斯拉多头、未来基金(Future Fund)管理合伙人加里·布莱克发帖称,降价是一种“短期麻醉剂”,会让潜在客户等待进一步降价。

发布于:7月以前  |  441次阅读  |  详细内容 »

光刻机巨头阿斯麦:拿到许可,继续对华出口

据外媒9月2日报道,荷兰半导体设备制造商阿斯麦称,尽管荷兰政府颁布的半导体设备出口管制新规9月正式生效,但该公司已获得在2023年底以前向中国运送受限制芯片制造机器的许可。

发布于:7月以前  |  437次阅读  |  详细内容 »

马斯克与库克首次隔空合作:为苹果提供卫星服务

近日,根据美国证券交易委员会的文件显示,苹果卫星服务提供商 Globalstar 近期向马斯克旗下的 SpaceX 支付 6400 万美元(约 4.65 亿元人民币)。用于在 2023-2025 年期间,发射卫星,进一步扩展苹果 iPhone 系列的 SOS 卫星服务。

发布于:7月以前  |  430次阅读  |  详细内容 »

𝕏(推特)调整隐私政策,可拿用户发布的信息训练 AI 模型

据报道,马斯克旗下社交平台𝕏(推特)日前调整了隐私政策,允许 𝕏 使用用户发布的信息来训练其人工智能(AI)模型。新的隐私政策将于 9 月 29 日生效。新政策规定,𝕏可能会使用所收集到的平台信息和公开可用的信息,来帮助训练 𝕏 的机器学习或人工智能模型。

发布于:7月以前  |  428次阅读  |  详细内容 »

荣耀CEO谈华为手机回归:替老同事们高兴,对行业也是好事

9月2日,荣耀CEO赵明在采访中谈及华为手机回归时表示,替老同事们高兴,觉得手机行业,由于华为的回归,让竞争充满了更多的可能性和更多的魅力,对行业来说也是件好事。

发布于:7月以前  |  423次阅读  |  详细内容 »

AI操控无人机能力超越人类冠军

《自然》30日发表的一篇论文报道了一个名为Swift的人工智能(AI)系统,该系统驾驶无人机的能力可在真实世界中一对一冠军赛里战胜人类对手。

发布于:7月以前  |  423次阅读  |  详细内容 »

AI生成的蘑菇科普书存在可致命错误

近日,非营利组织纽约真菌学会(NYMS)发出警告,表示亚马逊为代表的电商平台上,充斥着各种AI生成的蘑菇觅食科普书籍,其中存在诸多错误。

发布于:7月以前  |  420次阅读  |  详细内容 »

社交媒体平台𝕏计划收集用户生物识别数据与工作教育经历

社交媒体平台𝕏(原推特)新隐私政策提到:“在您同意的情况下,我们可能出于安全、安保和身份识别目的收集和使用您的生物识别信息。”

发布于:7月以前  |  411次阅读  |  详细内容 »

国产扫地机器人热销欧洲,国产割草机器人抢占欧洲草坪

2023年德国柏林消费电子展上,各大企业都带来了最新的理念和产品,而高端化、本土化的中国产品正在不断吸引欧洲等国际市场的目光。

发布于:7月以前  |  406次阅读  |  详细内容 »

罗永浩吐槽iPhone15和14不会有区别,除了序列号变了

罗永浩日前在直播中吐槽苹果即将推出的 iPhone 新品,具体内容为:“以我对我‘子公司’的了解,我认为 iPhone 15 跟 iPhone 14 不会有什么区别的,除了序(列)号变了,这个‘不要脸’的东西,这个‘臭厨子’。

发布于:7月以前  |  398次阅读  |  详细内容 »
 相关文章
Android插件化方案 5年以前  |  236862次阅读
vscode超好用的代码书签插件Bookmarks 1年以前  |  6848次阅读
 目录