Fintech核心技术及其在期货市场中的应用
大数据
基本定义
大数据指的是一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。大数据通过对海量数据的收集、处理和展示,使人类第一次可以无限接近真实地了解自然和社会,从而揭示规律,预测未来。大数据能够帮助各行各业的企业从原本毫无价值的海量数据中挖掘出用户的需求,使数据能够从量变到质变,真正产生价值。近年来,经过多年的发展和积累,在互联网及智能硬件快速普及的当下,数据以爆炸方式增长,数据无论是在数量、速度还是种类上都发生了显著的变化。
资料来源:36Kr
技术构成
大数据技术,就是从各种类型的数据中快速获得有价值信息的技术。大数据领域已经涌现出了大量新的技术,从数据处理流程来看,大数据技术可以分为5个部分:数据采集,数据存储,数据清洗,数据挖掘,数据可视化。数据采集有硬件采集,如RFID射频数据、传感器数据,有软件采集,如社交网络交互数据及移动互联网数据。数据存储就包括NoSQL,Hadoop等等。数据清洗包括语义分析,流媒体格式化等等。数据挖掘包括关联分析,回归分析,聚类分析等等。数据可视化包括Web可视化等等。
资料来源:作者
从大数据产业链来看,从底层架构到上层应用,基本上整个产业链是按照数据处理流程所需的大数据技术进行布局的。首先从数据源获取海量数据,然后经过有效的分析处理从而可以支撑大数据应用,完成“数据→信息→知识→决策”的一整套数据到应用变现链条。大数据挖掘、强化、分析这些中间技术环节构成了整个大数据产业的必要工具。过去几年对大数据挖掘、强化、分析的投资与建设已经帮助大数据工具在2015年基本成型,大数据工具走向成熟,开始能有效、及时、深入地处理、分析大数据源提供的海量数据,挖掘其中的价值从而支撑大数据应用。2015年是大数据应用元年也是大数据走向落地的关键年。
资料来源:中银国际
在期货市场的应用模式
构建大数据中心在期货市场中很多方面都大有可为。首先,在监管模式允许的范围内,探索接入外部期货公司数据、保证金监控中心及互联网数据,通过海量交易数据对投资者行为进行分析,可以大幅度提高期货交易所和期货公司客户服务和产品服务的精准度,增强客户体验。其次,可以对期货公司及其子公司的大数据进行整合,进行深入挖掘,通过投资者交易行为的分析,为期货交易所以及其他机构监管、监察以及采取风险控制提供数据支持,不断提升监管效率。再次,在大数据的基础上,建设交易者信用评价系统将有助于交易所完善风控、推动会员业务创新。同时,能够为未来保证金监管制度的发展和完善提供技术支持。
1、基于大数据的资源共享,建立大数据平台系统,完善风险控制与投资者行为分析。
期货公司应当针对自己的特色有选择性地收集相关数据,同时形成自身的逻辑体系。重视经纪业务的,不妨对投资者的投资偏好、客户来源等方面做具体的收集,为更好地服务经纪业务做铺垫;重视投研部分的,本身就对数据非常敏感,那么大数据方面应当尽可能地在数据的精确性、时效性等方面做更多的整理,同时也应当尽可能搜集产业链数据,为形成完整的基本面分析链条做铺垫;产品设计和程序化则可能需要更多高频数据,从中寻求一定的交易规律。
通过不同的数据源对期货交易数据的不断收集,可以形成规模可观的大数据资源库。依托于大数据资源库,期货交易所集团、期货公司与其母公司、以及股东单位旗下公司拥有的巨量的客户资源都可以得到有效的整合和共享。一方面,以大数据分析为基础,通过海量交易数据对投资者行为进行分析,提高期货交易所和期货公司客户服务和产品服务的精准度,助推高端服务以及定制化服务,增强客户体验。另一方面,随着期货公司设立风险管理子公司以及资产管理子公司,业务的种类增加,复杂程度提高,风险也在不断加大,并且由于这些业务都是在子公司层面开展,因此可能存在监管盲区。可以对期货公司及其子公司的大数据进行整合,进行深入挖掘,通过投资者交易行为的分析,为期货交易所以及其他机构所监管、监察以及采取风险控制提供数据支持,不断提升监管效率。
资料来源:夏步刚等(2016)
围绕“以客户为中心”的理念,期货公司在大数据应用上的实践和研究开始逐步加速。以南华期货为例,在大数据和IT的支持下,公司战略性地开发了基于客户数据池的个性化服务体系,该体系建立在CRM系统之上,可以根据客户的行为分析,为客户提供实时的、针对性的策略服务、风险管理产品以及对客户交易行为的诊断,让客户在风险管理和投资管理上得到提升。
值得注意的是,无论在客户风险控制还是公司风险控制上,大数据都可以极大地提升期货公司处理风险的能力。业内人士指出,一方面,期货公司可以在云计算的基础上,建立统一的服务器进行从业人员管理平台,完成合规性风控和道德风险最小化管理。另一方面,由于有了数据支撑,期货公司比过去更了解客户的交易模式、交易行为等,可以对其进行市场风险监控、合规风险监控。
2、基于大数据用户画像进行定制服务,开发期货理财产品,提供期货财富管理服务。
基于大数据进行用户画像,期货公司能在法律范围内提前获知客户的一些个人身份信息及信用信息等基本信息,接着就或准备相应的保证金、佣金的价格以及对应偏好的交易品种的基础信息以及研究报告等(交易偏好被获知),通过设计相应的交易程序来满足客户的需求,甚至不排除能够提供针对性的资产管理服务。未来参与交易的投资者可能更偏向于购买或者交易期货公司提供的财富管理服务,而非单纯地自身去进行交易,那么大数据就能够为客户进行量身定做,提供个性化的金融服务。
据悉,美国期货公司经营客户的三大步骤即了解客户的需求和投资偏好,设计交易程序、策略和量化模型,提供合适的产品组合以供交易。与此对应的是,随着大数据的引入,国内客户的交易模式、交易习惯也会发生一些大的改变,高频交易、量化交易方式或被更多采用。由于大数据所涉数据相对客观,回避风险的时间周期较短,客户可能越来越注重通过大数据来挖掘交易模型,再依据交易模型设计更多的低风险理财产品。
而对于中国的期货市场来说,目前还鲜有类似的金融理财产品推出,如果能在风险可控的前提下,与期货资产管理业务相结合,通过合理的产品设计和风险控制措施,推出基于保证金、结算准备金余额的类似于“余额宝”的低风险理财产品,不但能有效拓展期货市场的产品创新,降低出金率,还能有效地推动期货资产管理业务规模的增长与影响力的提升。
云计算
基本定义
云计算是指一种按使用量付费的模式,这种模式提供可用的、便捷的、按需的网络访问,进入可配置的计算资源共享池(资源包括网络、服务器、存储、应用软件、服务),这些资源能够被快速提供,而只需投入很少的管理工作,或与服务供应商进行很少的交互。
资料来源:广证恒生
云计算有3种服务模式:IaaS、PaaS及SaaS,这其实就是云计算的三个分层。基础设施在最下端,平台在中间,软件在顶端,分别是Infrastructure-as-a-Service(IaaS),Platform-as-a-Service(PaaS),Software-as-a-Service(SaaS),区别在于云端提供服务种类不同。IaaS公司会提供场外服务器,存储和网络硬件,用户可以租用,从而节省了维护成本和办公场地。PaaS公司在网上提供各种开发和分发应用的解决方案,比如虚拟服务器和操作系统,这让分散的工作团队之间的合作变得更加容易。SaaS与用户的接触更广泛,任何一个远程服务器上的应用都可以通过网络来运行,这些都可以称作SaaS。
云计算有4种部署模式:公有云、私有云、社区云、混合云,区别在于受众范围不同。公有云一般是由云服务运营商搭建,面向公众的云计算类型;私有云是部署在企业内部,服务于内部用户的云计算类型;社区云是由数个有共同利益关系或目标的企业和组织共同构建的云计算业务,其服务面向这几个组织的内部人员;混合云则是包含了两种以上类型的云计算形式。
资料来源:广证恒生
技术构成
云计算一共有6大核心技术,除了构成基础设施的IaaS硬件层以外,还有编程模型、海量数据分布式存储技术、海量数据管理技术、虚拟化技术以及云平台管理技术。而且云计算的每种技术都有相应的开源程序。
资料来源:广证恒生
在期货市场的应用模式
1、建立基于云平台的虚拟营业部,降低运营成本。
当前期货业最经典的商业模式还是经纪业务,由于手续费的降低,同时还由于租金上涨、业绩拖累、客户不稳定等因素,很多期货公司将考虑关闭营业部。云计算正在改变着期货公司的经营模式,许多期货营业部在向网点与互联网+的方向上转型,将其转移到基于云计算的互联网上,网上交易或将解决线下经营的种种难题。
云端服务模式下,云技术突破了地域、时间的限制,人们可以随时随地利用互联网和通信设备完成业务办理,这使得虚拟营业部成为金融机构未来业务发展的方向。以期货市场为例,在保证金监控中心、期货交易所等多方监管下,建立基于云平台的虚拟营业部是利用电子化服务手段提供非柜台服务,将营业部的功能迁移到云端网络环境之中。借助于应用软件、手机客户端等工具,实现网络开户、合约买卖和资金划转,在技术上已经完全可以实现。相对于传统网点,虚拟营业部具有成本低、效率更高、覆盖面更广的优势,并有助于期货公司在总部层面实现大数据管理与监控。依托互联网的云计算平台技术的成熟将为期货营业部降低成本,期货公司营业部通过公司云平台可以解决员工业务终端问题,且可以有效降低会员公司的经营成本;云平台的利用大大降低了新设期货营业部的建设成本和建设周期,有利于期货公司快速部署新的营业网点。其次,目前,期货公司对高端客户资源的争夺日益激烈,高端客户对期货公司的可选择性也越来越多。这要求期货公司在原来的“行情交易服务”的基础上,结合市场需求,强化对高端客户的高端服务以及定制化服务,以服务品牌替代佣金竞争,顺应期货市场的转型发展。
2、借助于云计算,整合信息与资源,构建期货企业的云联盟服务系统。
近年来,随着信息技术的革新,证券期货行业信息技术已完成规范化和标准化的转变,随之而来的买方市场和卖方市场对于信息系统及资源的需求越来越丰富、专业。传统的软件服务、信息行情服务、托管服务资源的分散,消耗市场直接参与者巨大的时间成本、交易成本,也加大了证券期货经纪公司与交易所和市场投资者的沟通成本,无法快速整合与集成优势信息技术优势资源,并快速反馈给市场。
针对以上问题,期货行业可以构建期货云联盟服务系统,将服务器、存储、网络、安全、运营和应用以集成的解决方案结合在一起,实现从基础设施到应用再到整个生命周期的自动化,从而形成完整的期货业务解决方案。
具体而言,期货企业可借助云计算技术,建立一些有共同利益(如交易、安全需求、策略目标考虑等)并打算共享计算资源、网络资源、软件和服务能力的企业联盟组织,即期货企业云联盟。基于企业联盟内的网络互连优势和技术易于整合等特点,通过对企业联盟内各种计算能力进行统一服务形式的整合,结合企业联盟内的用户需求共性,实现面向企业用户需求的云计算联盟服务模式。
系统主要采用联盟“服务中心-成员中心-服务终端”的多层次交易服务体系结构。其中用户可采用多种访问手段包括移动设各通过互联网与服务终端相联系,以便执行相应的操作。联盟成员中也主要部署相应的交易节点系统,通过注册和同步把数据、交易和订单等资源信息反馈到联盟中必,实现企业间的服务资源访问和共享,从而完成企业信息资源整合。其云联盟服务系统总体拓扑图如下所示。
资料来源:尚广安(2014)
每个成员的服务节点系统基于Hadoop构建云计算环境,通过标准网络协议实现服务信息资源的发布和访问,并通过统一的云服务接口,实现对不同环境下异构的主机、存储和数据库等资源的统一管理,屏蔽了底层软硬件资源的分布性和异构性,为用户提供单点登录和个性化界面,实现对异构资源的透明访问、整合和利用。
成员的服务节点系统逻辑结构分为3层:第1层为数据层,利用云数据库实现异构数据的存储和连接访问服务,提供云环境下数据库资源的异构透明性和数据源聚合;第2层是核心层,基于SOA框架下提供服务目录和代理中也功能的服务接口,解决成员企业间的服务集成和组合等更高次的要求,可实现期货企业系统的咨询服务,交易服务和业务服务等功能;第3层是面向用户提供的期货交易服务使用的界面和接口,其节点系统层次结构如下所示。
资料来源:尚广安(2014)
3、基于云计算,提高量化投资的计算性能、安全系数和交易效率。
量化交易改变了传统的交易方式,高频交易、算法交易等程序化交易方式在国外非常普遍,它们在提升市场效率的同时,也隐含对市场、交易所的极大伤害。在云计算模型下,投资者需要在云端对量化模型经过海量历史数据的仿真测试,来确定投资策略与动向。既要考虑量化投资的交易信息系统是否可以安全稳定地运行,也要考虑系统是否存在漏洞与缺陷,系统是否经过安全认证等。
一种量化投资技术,都可能涉及复杂的数据处理、存储并要涉及高级的机器学习技术。伴随着大数据技术,云计算服务形成了一种新的商业计算模型,它将计算任务分布在大量计算机构成的资源池(也称为云)上,使用户能够按需获取计算力、存储空间和信息服务,云计算当前是计算机技术世界的热点,也代表了未来的技术趋势。量化投资也必然在这种新形式下特别是云计算的影响下发生新的改变,这是大势所趋。过去不少投资者为了提高复杂的量化数据模型的计算速度,往往采用高性能计算策略,但是由于内存的限制或者处理能力的限制,部分复杂的量化模型的计算往往在一段时间内后不得不半途终止计算。为了应付更加一般意义的复杂数学模型的计算出现此类问题,而云环境下的高性能计算,能为期货行业的程序化交易和量化投资中复杂数学模型的计算提供了可能,并可以用于量化投资的策略模型的具体计算。如在亚马逊EC2的云平台的结果基本上可以与双核高性能计算(HPC)相媲美。
资料来源:叶伟(2016)
目前,期货程序化交易的运算时间量级早已经到了毫秒级,这意味着每500毫秒一次推送的高频数据,为策略运算提供了巨大的演算空间。速度上的优势意味着投资者能更快捕捉到投资机会,更低的冲击成本,以及更多样化的策略空间,对速度的追求推动投资者改进算法,选择更好的平台,尝试更新的概念。云计算平台有着非常强的运算能力,同时云平台还可以为投资者提供个性化的定制服务,把投资者的投资策略和算法都搬到云端进行,此外交易所的公共云还可以在云端开放高频数据,给会员公司以及投资者更好的数据信息服务。期货公司可以在云平台开发策略定制服务、相关程序化工具、一系列不同风险收益特征的对冲、投机及组合策略研究模型。随着我国金融市场的发展,期货品种不断丰富,未来的期权交易给市场带来了多样性,国内金融市场将出现越来越多的对冲、期现套利、统计套利等较为复杂的交易策略,而这些策略的运用和实施对程序化交易、算法交易提出了更多的需求和更高的要求。
在监管方面,最近中国证监会也颁布了新的监管法规,强调了程序化交易系统的测试,量化投资的程序化交易者可以在“公有云”上进行测试,而不用建立公司自己的计算中心,从而能降低系统测试的成本。2014年,国内东部沿海城市也出现了由国外海归牵头的金融算法交易云平台系统,将为技术缺乏的中小投资者提供一系列交易策略解决方案,帮助中小投资者用较低的成本来使用先进的计算机程序、大数据、统计套利模型和算法策略进行风险对冲。
区块链
基本定义
区块链(Block Chain)是基于分布式记账原理,使用去中心化共识机制维护一个完整的、分布式的、不可篡改的账本数据库,类似于一个公共、透明、海量的记账簿。区块链起初是比特币的一种底层技术,实现比特币交易的自动记录,且环环相扣、不可修改、不可删除,每笔记录交易信息公开且准确无误。
资料来源:EY
技术构成
核心技术
区块链是一个开放式的不受单一组织控制(由整个分布式网络维护)的分布式“账本”(分布式数据结构)。该技术融合了P2P网络、密码学和共识机制三类成熟技术,实现了去中心化交易过程中节点之间信息可靠传递、交易账户安全和节点之间传递的信息不会被修改(可靠的交易系统必须保证交易者账户安全以及交易不被篡改)。
资料来源:方正证券
共识机制
共识机制是区块链技术的核心,目前常见的共识机制除运用于比特币的 POW(Proof of Work,工作量证明)外,还有 POS(Proof of Stake,权益证明), DPOS(Delegate Proof of Stake,股份授权证明)等。
POW:POW 机制是首个区块链应用比特币采用的共识机制,基于非对称加密原理,节点需要花费很大的算力解决一个数学难题(每个节点解决的数学难题的初始条件不同,但难度相同)才获得记账权限,而且其他节点可以很轻松地验证试图记账的节点的答案是否正确(POW 机制解决的数学难题具有难求解、易验证的特点)。此外,算法会评估每个节点的算力,并根据算力分配投票权限,某节点想要作弊时,必须获得系统51%票数,因此需要有系统51%算力,因而需要花费极高的成本。
POS:该机制背后的思想是,系统出问题时,持币越多的人面临的潜在损失越大,因而持币越多作弊的动机越小,从而给与其更多的记账机会,但在每一次记账后则减小其相应的下次记账概率,一段时间没有记账则增加其记账概率。
DPOS:在POS 机制基础上向前一步, 首先是投票选出一批代表性的节点(如101 个),然后这些代表性的节点再选出一个节点负责记录,其他节点核对记录,更大程度提高记账的效率。
资料来源:长江证券
基础架构
区块链的基础架构包括区块、区块头、创始区块及区块链分叉。区块用于记录数据,一旦书写就很难修改或移除;区块头由三组区块元数据组成,第一组链接前一区块,第二组即难度、时间戳和nonce,与挖矿竞争相头,第三组是merkle树根,是用来总结区块中所有交易的数据结构;创始区块是区块链的第一个区块,沿任一区块循链向后回溯,最终都将到达创始区块;从创始区块开始即会出现分叉,当创建两个区块的时间仅差几秒时,就会出现一个分叉区块,从而区块链的长度被拉长。
资料来源:方正证券
从技术角度理解,区块就是一种可检索、不能篡改的数据结构,它是前十位数字为 0 的超长随机数密码,必须指定上一区块,才能实现有序排列。而从应用角度理解,区块是定时记录一部分交易数据的全网公开并保护每个人交易稳私的账单。传统账单的页码是连续的数字,而区块链账单的页码是还需要指定上一页的页码,才能将账单有序排列。
网络架构
区块链的网络架构非常灵活,按照节点授权方式可分为:公共区块链、联盟区块链和私有区块链。
资料来源:36Kr
公共区块链(公有链,Public Blockchain):公共区块链是指全世界任何人都可读取的、任何人都能发送交易且交易能获得有效确认的、任何人都能参与其中共识过程的区块链。公共区块链的安全由“加密数字经济”维护——“加密数字经济”采取工作量证明机制或权益证明机制等方式,将经济奖励和加密数字验证结合了起来,并遵循着一般原则:每个人从中可获得的经济奖励,与对共识过程作出的贡献成正比。这些区块链通常被认为是“完全去中心化”的。
联盟区块链(联盟链,Federated Blockchain):联盟区块链是指其共识过程受到预选节点控制的区块链。区块链或许允许每个人都可读取,或者只受限于参与者,或走混合型路线。这些区块链可视为“部分去中心化”。 如R3 CEV银行联盟。
私有区块链(私有链,Private Blockchain):完全私有的区块链是指其写入权限仅在一个组织手里的区块链。读取权限或者对外开放,或者被任意程度地进行了限制。如Nasdaq用的Linq。
三大网络架构都充分利用了区块链技术去中心化、去中介信用、数据可靠性等特点,只是在节点的接入和共识机制的建立方面存在区别。
资料来源:方正证券
主要特点
区块链技术可以在互相不信任的节点之间建立去中心化的信用体系。网络中的节点之间可以相互不信任,各个节点只需要信任区块链运行的算法本身(各节点对算法达成共识,如果某个节点对算法不信任就没有加入网络的需求),整个网络就可以实现可靠的交易和数据存储。区块链技术的主要特点是去中心化、不可篡改和加密安全性等。
- 特点一:去中心化。区块链的核心思想是去中心化,是分布式记录、分布式储存、分布式传播,数据的传输不再依赖某个中心节点,而是 P2P 的直接传输。它基于密码学原理而非信用,全网络的每个节点都依据共识开源协议,自由安全地传输数据。所有交易记录是对全网络公开的,每个节点都负责数据的记录、储存,没有中心化或第三方机构负责管理,一个节点出现问题,其他节点会继续数据的更新和存储,通过去中心化的方式,维持系统稳定运行,信息完整可靠。
资料来源:华金证券
- 特点二:不可篡改。区块链的不可篡改性由工作量证明机制与共识机制共同保证,最长的链条才被全网公认。一旦被记录,信息就不能被随意篡改,若要篡改,链条会出现分支,需要耗费大量的算力,只有当算力达到全网络总和的51%时才能修改已经被记录的信息,这样做的成本是巨大的,实现的可能性极低。
资料来源:方正证券
- 特点三:加密安全性。区块链通过数学方法解决了信任问题,依靠非对称加密和可靠数据库完成了信用背书从而不需要借助第三方机构来进行担保验证,只需信任共同算法即可建立互信。 非对称加密是通过利用公钥与私钥的配合而实现的。每个参与者都可用公钥来加密一段信息,而要解密时只有信息的拥有者才能用对应的私钥来接收。私钥的接收使用电子签名来验证,确保信息为真正的持有人发出。非对称加密将交换摩擦边界降到最低,保护个人隐私,确保加密安全。 这些优点的叠加可以解决两个长期存在于加密数字货币行业问题:“双花”问题(去中心化)和“拜占庭”将军问题(工作量机制)。
资料来源:中信证券
在期货市场的应用模式
将区块链技术引入到期货市场中必将为该市场带来翻天覆地的变化,强有力地促进期货市场的发展。
1、基于分布式总账技术,区块链在期货市场中的应用主要是智能合约。
分布式总账技术(DLT)在期货等衍生品交易的交易后周期的使用预计会:(1)让自动化创造实质性的操作效率;(2)减少贸易和初始结算之间的时间差;(3)释放资本;(4)减少双边的对手风险。
区块链中的分布式总账技术(DLT)可以允许交易商和其他市场参与者来创造期货等衍生品的智能合约,让传统由后台系统、中台系统、抵押品管理及其他人事来完成的任务和功能自动执行。这些衍生品合同本质上是加了“算法”(也就是能形成计算机代码基础的逻辑指令)并用法律语言来描述的法定协议。
某些目前正在发展中的分布式账本能够允许参与者开发并进入期货等衍生品智能合同。这些“可编程的”分布式账本能够公布和记录的不仅仅是贸易和结算记录,还有智能合约的条款和“输出”,例如合同股价,价格变动押金的结算,原始押金的计算,原始押金的保管,债务更替和净额结算,以及与对手违约相关的出清存货管理。
但具体到某些场外衍生品业务来说,在集成区块链技术时,需对其技术体系进行裁剪,以满足实际的应用场景。
资料来源:宋涛、戈峰(2016)
人工智能
基本定义
人工智能(Artificial Intelligence, AI)是研究、开发用于模拟、延伸和扩展人类智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是对人的意识、思维的信息过程的模拟,其在初级阶段实现对简单劳动的替代,第二阶段则尝试替代复杂劳动。目前,人工智能尚在发展初期,代替人脑来进行决策尚早,但至少可以做到大规模的量化、替代部分人力分析的层面。
技术构成
技术架构
从技术分层的视角来看,人工智能可分为基础层、技术层和应用层三个层面,基础层最靠近“云”,应用层最靠近“端”。基础层作为人工智能技术的技术支持,各个细分技术必不可少,如大数据、云计算、智能芯片、传感器及智能硬件等,特别是大数据,其为人工智能技术层面的发展提供了数据基础;在技术层面,人工智能技术包括语音识别、图像识别、生物特征识别、机器学习、知识图谱、自然语言处理等;在应用层面,人工智能包括计算智能、感知智能和认知智能,目前尚未实现具有完整认知功能的人工智能。
资料来源:作者
在人工智能产业链中,基础层是构建生态的基础,价值最高,需要长期投入进行战略布局;通用技术层是构建技术护城河的基础,需要中长期进行布局;解决方案层直戳行业痛点,变现能力最强。
资料来源:云栖智库
核心技术
人工智能核心技术包括语音识别、图像识别、生物特征识别、机器学习、知识图谱、自然语言处理等。
语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。语音识别技术主要包括特征提取技术、模式匹配准则及模型训练技术三个方面。
图像识别技术是指利用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对象的技术。
生物特征识别技术是指利用人体生物特征进行身份认证的一种技术。更具体一点,生物特征识别技术就是通过计算机与光学、声学、生物传感器和生物统计学原理等高科技手段密切结合,利用人体固有的生理特性和行为特征来进行个人身份的鉴定。
机器学习(Machine Learning, ML)技术是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。
知识图谱技术是基于现有数据的再加工,包括关系数据库中的结构化数据、文本或XML中的非结构化或半结构化数据、客户数据、领域本体知识以及外部知识,通过各种数据挖掘、信息抽取和知识融合技术形成一个统一的全局的知识库。
自然语言处理(Natural Language Processing, NLP)技术是专门研究人与计算机交互的语言问题,其大致可分为两个层面,一个是浅层分析,如分词,词性标注,这些技术一般只需对句子的局部范围进行分析处理;另一个层面是对语言进行深层的处理,需要对句子进行全局分析。其中深层语言分析又可以分为三个层次:句法分析、语义分析、语用分析。
在期货市场的应用模式
人工智能在期货市场中的应用主要是用机器学习等技术促进量化投资和程序化交易。
1、将机器学习应用到期货产品风险定价中去。
将机器学习引入到期货模型的定制和数据挖掘过程中,来进行风险定价。比如对期货做市模式建立模型,通过数据本身来进行拟合,具体通过图形和非结构化的数据,让机器识别这些数据的定价,做期货的定价进行拟合。在做的过程中,发现机器学习对RMSE(均方根误差)传统的做法有所提高,可以在期货定价上降低成本。未来机器学习完全可以用到期货风险定价相关的一系列业务过程当中去。
2、将机器学习应用到期货订单高频交易中去。
证券市场的交易机制可以分为报价驱动市场(Quote-driven Market和订单驱动市场(Order-driven Market)两类,前者依赖做市商提供流动性,后者通过限价单订单提供流动性,交易通过投资者的买进委托和卖出委托竞价所形成。中国的证券市场属于订单驱动市场,包括股票市场和期货市场。
订单簿的动态建模,主要有两种方法,一种是经典计量经济学方法,另一种是机器学习方法。国内期货市场属于订单驱动型市场,下图是股指期货主力合约IF1312的Level-1行情订单簿截图。从上面直接获得的信息并不多,基础信息就包括买一价、卖一价、买一量和卖一量。在国外的某些学术论文中,和订单簿对应的还有信息簿(Message Book),包括最明细的订单撮合数据,包括每个订单的下单量、成交价、订单类型等信息,由于国内市场不公开信息簿的信息,因此超高频交易我们只能依赖订单簿。
资料来源:民生证券
下图是典型的机器学习交易策略的系统架构图,包括订单簿数据、特征发现、模型构建与验证和交易机会几个主要模块,值得注意的是,交易过程是由行情事件触发的,tick行情的到达是其中一个事件。
资料来源:民生证券
3、将机器学习应用到期货量化投资策略中去。
我们用一个神经网络和深度学习的例子来说明。分别利用单隐层神经网络和深度学习模型对股指期货数据进行建模,并根据前t时刻的价格、交易数据和技术指标对t时刻的收盘价的涨跌进行预测,预测的结果如下表所示:
资料来源:白凯敏(2016)
结果表明,简单神经网络和深度神经网络最终预测能力有限,但理论上来说只要有超过百分之五十的预测准确率,仍然是有套利机会存在的。
总的来说,无论是单隐层的神经网络还是深度学习模型,对股指期货均有一定的预测能为,而且深度学习相对于单隐层的神经网络来说预测能力更强。根据模型结果来看,是有一定的套利机会存在的,但是由于我们的预测只是做了方向性的预测,只预测了涨跌但是并没有给出预测具体的涨跌幅度,而在实际中需要考虑到交易费用的问题以及一分钟内可能出现的大幅度波动达到止损点等因素以及训练时间的问题,因此我们的模型在实际中并不能保证绝对有效,仅作为实际量化投资中的一种参考方法。
网友评论