基于RNN的期货市场量化择时交易分析

2023-06-25 00:50潘越颖
理财·收藏版 2023年3期
关键词:期货价格期货市场期货

潘越颖

循环神经网络(Recurrent NeuralNetwork, RNN)是一種用于处理序列数据的神经网络。相比一般的神经网络来说,RNN模型能够处理序列变化的数据。比如某个单词的意思会因为上文提到的内容不同而有不同的含义,RNN模型就能够很好地解决这类问题。而量化择时是通过进行买入择时因子的编写、分解模式一步一步对策略进行回测、卖出择时因子的实现对股票的买入和抛出时间进行评估分析,从而达到持股人利益最大化的策略。

有效市场假说认为:假如市场是有效的,那么市场中价格总是能够及时、准确且充分地反映所有相关的信息。根据不同的资本市场所处的信息环境下,有效市场可以分为弱式有效、半强式有效和强式有效三种形式。在有效市场的假说下,投资者不能依据历史信息来获得超额收益,因为历史信息已经全部体现在当前标的的价格上。学术界有很多对我国金融市场有效性的研究,普遍认为国内金融市场满足弱式有效,但也存在一定的争议。本文基于股指期货中具有代表性的沪深300期货历史交易数据信息,对其进行量化择时投资,通过不断训练模型,进而推演到商品期货中具有典型代表的期货,最终通过金融期货与商品期货的组合,从而降低风险,使利润最大化。最后相比不同时期的投资组合收益差与成本差来证明通过该择时方法选定的期货投资组合可以获得一定的超额收益。

一、研究内容

期货市场是一个充满了不确定性的市场,属于高风险高回报的市场,期货价格时间序列具有非线性及高噪声的数据特征,对其精确预测依旧十分困难。交易者要想做到稳定盈利还是需要一套完整的交易系统的。没有一个好的交易系统不仅不能盈利,还可能造成长期亏损的危险。一套好的交易系统是要在交易中不断进行一步步完善的。

期货市场,随着时间的推移,会产生具有顺序的一系列数字,这些数字是具有序列特性的,由于时间的动态变化,使得自变量和因变量二者之间的关系也会随之发生变动,本次研究主要着眼于排除随机扰动项、现货市场对期货价格影响后,滞后1到5阶的历史数据对期货价格未来走势的影响,从而对买入或卖出期货的时机进行大致选择,使其机会成本最小。神经网络能够发现并刻画数据自身复杂的内部结构特征,也能自适应地学习和构建数据非线性的复杂关系,不会对输入变量施加限制,也具备更好的迁移学习性质,因此非常适合处理如期货价格这样的金融数据。RNN对具有序列特性的数据非常有效,它能挖掘数据中的时序信息以及语义信息,利用RNN的这种能力,使深度学习模型在解决时序分析等问题时有所突破。

我们希望建立一个基于循环神经网络(RNN)的非线性预测模型,研究期货市场量化择时交易策略。

二、研究方法

(一)定量分析法

我将使用定量分析法使人们对期货市场的认识进一步精确化,对市场变动的认识更加理性,以便更加科学地参与期货市场,把握本质,理清关系,预测期货市场金融期货及大宗商品期货的变动情况,来确定不同时间段股指期货与商品期货的投资组合,从而使预期收益率最大化。

(二)文献资料调研法

在研究之初,我深入学习了《深度学习》一书中与循环神经网络相关的部分,对于一些难以理解的部分采取了在线查阅资料以及组内讨论的形式,在数据获取阶段主要通过知网中的参考文献部分,去寻找沪深300期货价格变动的历史数据,同时阅读了大量关于期货市场的相关资料,帮助我们明晰整体思路,并做下一步规划,去探求单个大宗商品的价格规律。

三、研究结果

通过RNN这种神经网络来预测某种商品的定价,而影响期货市场价格变动的因素又有很多,因此,我们要在诸多不确定性中找到确定性,通过交易方向、入市点、持仓方法的选择以及资金管理,使期货市场的高收益在不同交易次数之间发生偏移。

通过收集大量资料,对期货市场上不同种类的商品有大致的了解;然后根据市场现状,来确定我们具体需要构建的RNN模型种类;之后,利用组内人员专业优势,尝试建模;建模完成后,套入某具有代表性的期货产品在过去某一个时间步的数据,通过观察信息在某个时间步向前的计算输出和损失,以及先后计算梯度,通过契合度测试模型的可行性,并不断修改、不断验证,从而训练一个成功的RNN模型,并将训练好的模型运用于不同种类的期货产品中,预测其未来走势,大体思路为从金融期货推演到不同种类的商品期货,最终在不同的时间选取有效的投资组合,力求在相同投机需求下分散风险,尽可能地提高收益率。

我们运用建立的模型预测该期货未来一段时间的价格走势。然后收集了三种典型的金融期货——沪深300、中证500、中证1000,四类商品期货中的典型期货——农产品中的美豆粕2301、基本金属中的COMEX铜、能源化工WTI原油、贵金属中的COMEX黄金等数据,以期对模型的正确性进行检验。但该模型对于不同种类的期货预测准确性和适用性有差异。该模型用于数据集较少的期货时,模型拟合程度较低,数据可信度差;该模型用于数据集较多的期货价格预测时,拟合程度高,数据可信度好。因此可以得出该模型可用于长期期货价格预测的特点。

四、创 新 点

(一)引入量化择时

量化择时的优势主要体现在:其一,量化择时拥有客观性。在交易过程中,量化择时任何操作均不是人为进行的,全部都是运用计算机系统开展预算与测试。因此,这样便成功地避免了投资人员心理因素和主观情绪等方面的因素对投资过程中带来的负面影响。在量化择时过程中,借助计算机来构建量化择时模型,并对市场大数据开展分析,只需确保使用的模型符合投入市场的应用要求。其二,量化择时具有可控性。跟传统投资项目相比,量化择时拥有可控性。相比传统的投资项目,量化择时的投资范围更广, 并且通过应用技术能够将风险降至最低水平,把风险控制在可以接受的范围中。正因为量化择时拥有这一优势,能够让投资者在承担最小风险的基础上获得较大的收益。其三,量化择时具有高效性。量化择时是将计算机、金融、数学等包含在内的多种学科融合形成的一类高效投资模型,将各个学科的作用发挥出来,再经信息处理后借助大数据来帮助投资者作出科学的投资。换而言之,量化择时的数据是经计算机处理后的,因此投资决策更科学,极大地减少了人员的工作负担,提升了投资决策的高效性。

(二)引入RNN

运用Python建立了基于RNN的期货市场预测模型,并使用沪深300股指期货数据进行了检验,训练集准确率与测试集准确率都较为满意。

利用建立好的模型预测具有代表性的四类大宗商品期货价格走势,经过不断调整模型,来获得近3个月的预测值与真实值的走势图,使R^2等于95%,最终确定近3个月使收益率最大的最优投资组合。

(三)引入Origin

Origin是一个具有电子数据表前端的图形化用户界面软件。Origin支持各种各样的2D/3D图形。Origin中的数据分析功能包括统计、信号处理、曲线拟合以及峰值分析。Origin中的曲线拟合是采用基于Levernberg-Marquardt算法(LMA)的非线性最小二乘法拟合。Origin强大的数据导入功能,支持多种格式的数据,包括ASCII、Excel、NI TDM、DIADem、NetCDF、SPC等等。图形输出格式多样,例如JPEG、GIF、EPS、TIFF等。内置的查询工具可通过ADO访问数据库数据。

总的来讲,Origin在数据分析方面功能更强大,从操作上来讲,Origin更容易上手;此外,Origin还能满足数据拟合的功能,内嵌了非常丰富的函数库,相较于其他平台,数据拟合变得更加容易操作,更加灵活。

猜你喜欢
期货价格期货市场期货
纸浆期货市场相关数据
美棉出口良好 ICE期货收高
新冠疫情对黄金期货价格的干预影响研究
国内尿素期货小幅上涨
肥料企业该如何面对尿素期货市场?
红枣期货价格大涨之后怎么走
量化投资在期货市场的有效应用
生猪期货离我们还有多远?
中粮期货 忠良品格
基于ARIMA模型的沪铜期货价格预测研究