【交易技术前沿】FPGA技术在沪深行情加速的应用

原赋予头衔:【工厂技术开拓的】fpga技术在上海的运用



作者:郑继祥、张建国、张立胜、王先平、李小波、余坚

(招商弥补免费入场券股份限定的公司

摘要:

在弥补免费入场券工厂接防,集市从科学实验中提取的价值转换神速,得益时机昙花一现,扣留更低的时延、更快的答复,述语能精准掌握工厂时机和点位。现场正式舞会门阵列(缩写 fpga)技术与国际公约软件体系的比较地,可预测超低推延,这项技术已使就职于华尔街、高频工厂等接防大放异彩。

招商弥补免费入场券在国际弥补免费入场券公司,fpga技术在弥补免费入场券接防的最初的成运用,因为fpga的计算机硬件沪深集市体系的手脚可以到的范围预期的目的。体系上部位后用户海拔高度认可,为实盘工厂继续弥补亚一百万分表示方法秒级行情服侍。

本文次要引见了健康状况如何手脚可以到的范围预期的目的shangha的计算机硬件变速器扩张。,包孕体系的设计和手脚可以到的范围预期的目的、体系的现实物测量胜利和难以对付的的范围性,怀胎能为在dom中书房和运用fpga技术做出奉献,为开拓人员弥补互相牵连技术介绍人,形成良好的科学与技术生态体系。

症结词:FPGA、沪深Level-2行情、异构设计、行情吃水触摸、全息的行情、Fin-lib、生态体系

一、概述

低工厂时延的应战

在弥补免费入场券工厂接防,得益时机昙花一现,“更低工厂推延”是尽量的财政工厂网球场的心脏目的表示方法。目前国际财政专业的工厂体系大一部分的因为国际公约行情CPU架构,工厂提速在阻碍,使满足没完没了超低延时的工厂需求量。而跟随 FinTech(财政科学与技术)的投入,杂多的算法工厂、量子化工厂起来,财政专业网球场更低工厂推延工夫的“搏斗”不休晋级,变为各大财政机构的心脏应战表示方法。格外最近几年中惯例化工厂在资本集市的片面运用,国际公约的软件技术或以软件为心脏的变速器扩张技术难以使满足一百万分表示方法秒级的实时处置和实时答复的想要。业内均在追求搭建低延时工厂体系的receiver 收音机,因为GPU、FPGA计算机硬件并列地变速器扩张的技术逐步进入弥补免费入场券工厂接防,变为财政科学与技术接防结局的科学与技术随意移动,是华尔街的主流技术表示方法。

缩小工厂推延简略来说执意健康状况如何手脚可以到的范围预期的目的财政从科学实验中提取的价值变速器扩张。FPGA具有计算机硬件正式舞会、低功耗、低延时的点。因为RTL(Register Transfer Level:留下印象转乘级)级的逻辑培养,可专用化化各类对应拟定草案(如TCP/IP拟定草案栈卸货)、杂多的音讯编解码(如呈送所的FAST拟定草案解码)及体系杂多的颗粒度的柄状物,手脚可以到的范围预期的目的从科学实验中提取的价值的并列地和清流的并列地,手脚可以到的范围极低的体系时延和极高的体系使满意。

最初的将FPGA技术成运用于沪深行情体系

最近几年中,跟随国际财政集市的彻底地投入和方面不休范围,业内传达体系往高机能、高可靠、高使满意、低延时的态度投入。第三方财政技术公司,接踵赶出因为FPGA的出示,变明朗地在助长专业,运用FPGA投入各类运用的开拓,如行情、工厂、风控等接防,成效变明朗,为FPGA在弥补免费入场券专业的运用开拓弥补介绍人。

架构的选模标本招商弥补免费入场券远在2016年计划FPGA技术的运用,有组织的FPGA共同工作,启动互相牵连技术测量部评价,所评价的发射历经Net-FPGA、OpenCL+RTL异构、RTL+软件异构等,终极因为财政商用体系的稳定性、体系可范围性、健状性的充满思索,使牢固RTL+软件的异构架构。

说明选择FPGA技术失败行情变速器扩张FPGA共同工作对沪深行情从工厂所将前置机VDE/MDGW至行情运用客户端的时延按某路线发送举行辨析(见图1-1沪深工厂所行情时延示意图),最近的业内均采取软件举行行情解码,弥补行情服侍。这些行情解码服侍时延特有的大,超越10手写本,集市解码软件的从科学实验中提取的价值处置容量限定的,在股市做成某事牛市的压力下,实时性更无法接球保障。2017年FPGA共同工作启动沪深Level-2行情变速器扩张以协议约束,对应用FPGA技术手脚可以到的范围预期的目的沪深Level-2解码及机能举行三番两次地证明,同时运用C++软件和Matlab构成沪深行情解码的同样的事物时刻形成,为RTL加密的作曲和最佳化弥补介绍人,终极手脚可以到的范围预期的目的低至纳秒级的沪市STEP-FAST解码引擎,端到端的处置时延缩小到10一百万分表示方法秒(含系统时延)以下,接球变明朗的提速胜利。

图1-1 沪深工厂所行情时延示意图

千倍的提速胜利

国际弥补免费入场券接防FPGA技术替补队员根本空白,招商弥补免费入场券计算机硬件行情体系举行就职典礼地搭建CPU-FPGA异构设计,设计改编鲜明,高效地使受FPGA的效验。用rtl语言文字开拓陕北二级心脏译码算法,格外沪市STEP-FAST解码算法,解码时延低至纳秒级,同时手脚可以到的范围预期的目的净空的处置使满意。

计算机硬件行情体系表示方法开拓阶段的继续最佳化,经过各项严苛的机能压力份量,手脚可以到的范围预期的目的环回时延在上面10一百万分表示方法秒,机能借款1000倍。采取FPGA凹模上面高度全清流设计使体系手脚可以到的范围净空哼哼哈哈率,实物测量百倍于最近的集市全天的行情流量峰值,可以轻松地应对股市做成某事牛市的流量强暴。与最近的分娩主流行情服侍体系实时份量将按比例放大,显示体系可以手脚可以到的范围预期的目的调和8 ~ 13手写本意见分歧的提速胜利,格外面临复杂的沪市FAST编码,更显示了FPGA解码的难以对付的机能。

并且,计算机硬件行情体系还依行情从科学实验中提取的价值的点设计实时行情从科学实验中提取的价值紧缩同样的事物时刻转乘发射,开拓高效的紧缩/解紧缩算法,非常缩小沪深私下的从科学实验中提取的价值转乘带宽,使沪深任一混合词均享用全集市的FPGA提速取来的超低延时行情服侍。

行情从科学实验中提取的价值的吃水触摸是本体系的要紧结合一部分,在FPGA行情解码的根底先前手脚可以到的范围预期的目的深市全息的行情服侍,后续课题将弥补更多加重于的行情吃水触摸服侍。

二、FPGA技术在沪深行情变速器扩张的设计与手脚可以到的范围预期的目的

因为FPGA的异构架构设计

依事情及范围需求量,对根底计算机硬件选模标本指示方向列举如下:

(1)10GE万兆以太网鼻子,行情源、TCP行情推进运动、组播行情推进运动采取孤独的鼻子。

(2)可专用化化的TOE IP,支撑物TCP、UDP、IGMP、ICMP、ARP、RARP全卸货,且TCP衔接数支撑物无论如何32个。

(3)PCIe Gen3X8,且能共处的Gen1/2/3。

(4)无论如何两个Bank DDR,内存使满意实足8GB。

(5)无论如何两个Bank QDR。

国际公约TCP /IP 拟定草案是因为CPU( Central Processing Unit,中央处置器) 软件手脚可以到的范围预期的目的的,而运用CPU 举行TCP /IP 拟定草案栈处置,在容量不强、效能不高的缺陷,占领弘量的CPU 资源,破坏设备空间及发生弘量功耗,使其性能价格比很低,侵袭机能,万兆以太网的的带宽资源得不到充满的应用。故所选的板卡运用万兆以太网口作为其传达转乘鼻子,支撑物TCP /IP 拟定草案栈的TOE IP是症结表示方法。经过FPGA 来手脚可以到的范围预期的目的TCP /IP 拟定草案栈此外以太网MAC 引航员,将本来属于主CPU 的这一部分任务由额定的计算机硬件环形道如愿以偿,加重CPU 的担子,变速器扩张系统处置的容量,借款体系的机能。体系的可范围性是体系设计的压力表示方法。由下往上分为5美元钞票逻辑改编,包孕FPGA根底表达层、FPGA行情事情层、行情明智地使用层、Host-FPGA鼻子层和Host明智地使用服侍层,改编私下设计开拓禁闭清楚的,底层信任底层模块,召集底层或同层模块的鼻子,上底层私下功用充满解耦,列举如下图2-1所示。

图2-1 体系架构结构图

穿着FPGA根底表达手脚可以到的范围预期的目的孤独的表达功用,弥补丰富的的功用禁闭和清楚的的开拓鼻子。在Host侧与FPGA侧可经过C++方法的API举行直截了当地召集。

2.2 Level-2行情解码引擎

上海弥补免费入场券工厂所传达系统公司(缩写“呈送所”)于2016年营造子孙的低延时行情出版体系LDDS,支撑物多种信源,具有低延时、大流量、易范围、高可如愿以偿的等点,体系在较优的系统周围的事物中调和时延不足1ms。该Level-2 行情体系是因为FAST技术规范、面对专业使就职者的子孙实时行情出版体系。与国际公约的根本行情相形,Level-2行情全部境遇实时,容纳更多的价钱吃水、逐笔成交、定货单等容量和别的总数的传达。上面以呈送所的Level-2行情为例,论述行情解码引擎的手脚可以到的范围预期的目的。

呈送所的LDDS以国际规范的财政传达作物物交换拟定草案(FIX/FAST)为根底,化合奇纳规范的弥补免费入场券工厂从科学实验中提取的价值作物物交换拟定草案(STEP)的点确定从科学实验中提取的价值转乘拟定草案,依我国弥补免费入场券集市从科学实验中提取的价值的点此外Level-2行情容量的点设计在弥补免费入场券集市从科学实验中提取的价值接防具有新颖的算法。FAST拟定草案在保留FIX拟定草案伸缩性的根底上,将集市从科学实验中提取的价值大幅度的紧缩,非常进步了处置变速器。FAST体系大幅扩张Level-2行情所需的转乘带宽(不到这么的25%)和出版体系的累(扩张到这么的10%)

因为呈送所FAST拟定草案的多相,同时依RTL的点,设计出一套并列地、全清流式的高效STEP-FAST解码引擎发射,列举如下图2-2所示,意见分歧行情典型解码并列地处置,依现实运用扩张例化引擎总额,手脚可以到的范围高等的的从科学实验中提取的价值解码哼哼哈哈率。同时做到FAST的XML模板可配,以应对工厂所的更动。

图2-2 呈送所FAST解码引擎结构图

全息的行情

最近的业内千档行情因为深市最新Level-2行情计算所得的盘口功用,它能溃本的10档行情的限度局限,吃水述说个股从下限到变稳定尽量的价钱的付托量和付托明细,让用户对个股的付托明细看得更丰富的,特有的适合于察看微小的的大挂单和垫单的境遇,知识个股集市情况。条件运用顺序自动化辨析后面的个股千档行情的变化,千档行情将变为惯例化工厂的凶器。

计算机硬件行情体系弥补吃水行情触摸鉴赏服侍――全息的行情,即在手脚可以到的范围预期的目的千档行情的根底上,用户可依现实需求量专用化N档行情及其成交付托明细。客户端在收执实时行情的同时,支撑物全息的行情的订阅和收执功用。

三、计算机硬件行情体系的份量末后

机能份量

经过SignalTap器辨析FPGA外部处置时延不足一百万分表示方法秒,涉及动辄N个手写本的软件体系涉及,时延完整可以疏忽不理会。

在开拓计算机硬件行情体系的工艺使泛滥中,同样的事物时刻开拓补充的份量体系,份量体系次要包孕仿照行情源、回放行情源及客户端自动化份量顺序结合。回放行情源运用真实工厂所行情从科学实验中提取的价值贴纸举行克制速率的回放,以对计算机硬件行情体系在意见分歧哼哼哈哈率下举行合法性、稳定性及体系使满意等份量。

运用回放行情源,将回放速率调至软件限定,份量体系的处置使满意,末后显示沪市的峰值处置使满意高达200万笔/s,深市的峰值处置使满意高达300万笔/s。相涉及最近的(2019年1月)的行情,计算机硬件行情体系处置使满意百倍于最近的日内行情流量峰值,周旋股市做成某事牛市的流量强暴绰绰有余。

在手脚可以到的范围FPGA体系使满意上极限预先阻止,总计达体系不熟练的呈现反压,体系时延相当从容不迫的,这也FPGA体系的优点表示方法,不在CPU的体系调整成绩,在上极限使满意在屋内的任性流量,其间延都是正规军坚定性的。

实时申博胜利将按比例放大份量

计算机硬件行情体系在工厂所托管机房上部位后,为份量实时行情的提速机能,在一台份量领导者上参加摆设FPGA行情客户端和最近的公司分娩常态运用的软件行情客户端,两套体系接入完全相等地行情源,以保障单方在同样的事物开始线上。在份量领导者上运转机能份量顺序,穿着运转两个专卖CPU的线状物参加将两个客户端收到的行情从科学实验中提取的价值打上工夫戳,然后经过孤独的写贴纸线状物将从科学实验中提取的价值写贴纸。列举如下图3-1所示。收集整天的的从科学实验中提取的价值(2018-11-20),在收盘后运转从科学实验中提取的价值辨析将按比例放大顺序将两个体系的行情从科学实验中提取的价值举行同样的事物条行情从科学实验中提取的价值的婚配,如愿以偿同样的事物行情两个体系推进运动到份量领导者的工夫差,同样工夫差执意FPGA体系相涉及软件行情体系的提速工夫。

图3-1 实时申博份量示意图

份量计算总数末后显示:软件行情体系,端到端的处置时延约13手写本(含系统时延),而计算机硬件行情体系低至10一百万分表示方法秒,机能借款1000倍。

四、涉及范围性的思索

人所共知,采取RTL方法举行开拓,在RTL设计的能共处的性、范围性较差的缺陷,当预安装的功用开拓如愿以偿后,呈现新的需求量或功用更动时,开拓份量公转会很无尽的,故应在体系设计之初在架构上思索体系范围性的成绩,以应对集市的转换和客户的需求量。

(1) 饰面支撑物沪深双集市

最近的沪深工厂所私下行情从科学实验中提取的价值不共享,体系在沪深机房参加处置应和工厂所的从科学实验中提取的价值。思索到即将到来的能够沪深工厂所吐艳行情共享,设计在同样的事物块板上能同时处置沪深行情从科学实验中提取的价值解码推进运动,只需经过底层软件举行分派,那就够了手脚可以到的范围预期的目的饰面支撑物沪深双集市,无用的修正FPGA的RTL设计。

支撑物沪深双集市同时能用于最佳化沪深行情同样的事物时刻时延,应用沪市FAST行情的高紧缩率,直截了当地在将沪市未解码的FAST从科学实验中提取的价值同样的事物时刻到深市,由深市FPGA举行解码,于是可以更进一步最佳化沪市太难了市的行情同样的事物时刻时延。

(2) 因为异构的行情吃水触摸服侍

行情从科学实验中提取的价值吃水触摸服侍在架构上仍采取CPU-FPGA异构设计发射,将复杂的处置分派到Host,需求变速器扩张的一部分停车场FPGA。比如最近的的全息的行情服侍是因为行情从科学实验中提取的价值的吃水触摸服侍,应用CPU手脚可以到的范围预期的目的行情从科学实验中提取的价值触摸计算,创造的全息的行情从科学实验中提取的价值经过FPGA弥补的低延时转乘穿堂将从科学实验中提取的价值推进运动于客户端,在保障机能的同时非常缩小开拓的财政困难和Time to Market的工夫。

计划做成某事专用化化例子计算服侍将采取类推的方式手脚可以到的范围预期的目的。当CPU的计算碰到阻碍时,将会把计算趾骨的一部分下沉到FPGA手脚可以到的范围预期的目的,将体系的机能使受到最优,同时保障开拓的时。

五、FPGA技术运用的下一步尝试

跟随计算机硬件行情体系运转境遇及杂多的将按比例放大份量,证明FPGA技术运用于国际弥补免费入场券接防的有实行可能。行情以协议约束的成试水,为下一步FPGA运用于工厂变速器扩张等扩张忠诚。FPGA技术的超低延时、净空使满意、高稳定性等优点在财政技术接防将前程似锦,即将到来的怀胎能变为国际财政接防的主流技术表示方法。

在以协议约束开拓工艺使泛滥中,认识到FPGA RTL级的开拓财政困难太大、门槛太高、开拓公转太长,变明朗地在变幻无常的财政接防,开拓公转能够确定以协议约束的成败。经过与Intel公司工匠的深刻沟通,若软件开拓人员采取OpenCL技术举行开拓将会非常进步以协议约束的开拓效能,缩小以协议约束Time to Market的工夫。

OpenCL是第一体面对异构体系的并列地培养规范,是一体一致的培养周围的事物,便于软件开拓人员开拓出异构的高机能体系。与国际公约的RTL设计使泛滥相形,OpenCL运用类C的高层培养语言文字举行设计,高等的改编地举行设计的摘要,加密的可重用性、可范围性与RTL相形将会有质的飞跃。

在FPGA技术在弥补免费入场券专业开动阶段,作为先驱,趟过的不少坑,走过不少绕道,认识到构成专业技术生态圈的要紧性,为使FPGA技术能接球更进一步运用,课题做以下的尝试:

(1) 与Intel、Cytech等计算机硬件使坚固吃水共同工作,将目前的计算机硬件行情体系封装成根底BSP。

(2) 行情吃水触摸互相牵连鉴赏事情算法运用OPENCL开拓。

(3) 运算Kernel经过IO-Channel的方法直截了当地运用FPGA计算机硬件行情,手脚可以到的范围预期的目的最低消费的时延。

(4) 平台供第三方财政事情开拓者进专事情模块开拓、证明和运转。

对即将到来的举行更多的想象,怀胎可以运用OpenCL等优级语言文字手脚可以到的范围预期的目的的事情模块包孕专用化化例子计算、Tick级行情排列计算、个股选择能力限价计算、的股本随意移动计算等运用,将专业行情事情模块封装到fin-lib库中,该手脚可以到的范围预期的目的与召集软件库相等地适当的。



免责供述回到搜狐,检查更多

责任编辑:

发表评论