❶ 求支持向量机预测股票价格的MATLAB程序,谢谢!
这个,可多啊,我有
❷ 机器学习在量化交易里面有多大的用处
曾有朋友问过,国内现在量化领域机器学习应用的少,是否因为效果不如简单的策略。其实,把机器学习应用在量化交易上始终面临着两难,却并不是无解的两难。很多时候并不是机器学习不work,而是真正懂如何用正确科学的统计思维使用Machine Learning的人才太少。
机器学习涉及到特征选择、特征工程、模型选择、数据预处理、结果的验证和分析等一整套建模流程,广义角度来说就不单单是模型选择的问题。所以,如果认为“用支持向量机成功预测股票涨跌” 这样的研究,就是把机器学习应用于量化交易,这种狭义的认识无疑是买椟还珠,对机器学习领域散落遍地的珍珠视而不见。如果把机器学习的崛起放在历史进程中考量,无非就是趋势的延续:现在,可通过系统的数据分析证实过去模糊不定的经验,机器学习算法将未曾被察觉的规律得以浮现纸面。
在我看来,未来的发展概有两个方向:
1.针对量化交易的统计学习算法被提出,使其适合于噪声大,分布不稳定的金融数据分析;
2.对于机器学习的热情回归理性,从工具为导向回归到问题为导向。
针对如何以问题为导向,在机器学习算法中挑选合适的工具,分享一些思路。
1.多因子模型的因子权重计算
当我们在构建多因子模型且已经选定了一系列因子之后,要如何根据不同的市场情况调整各个因子的权重呢?在以往的研究中发现,与其它算法相比较,随机森林算法对于存在非线性、噪音和自变量共线性的训练集的分析结果更出色。所以,目前在多因子模型的权重上,采用当期收益率对上期因子进行随机森林回归分析,以确定下一期多因子模型的因子权重。
2.缺失值处理
处理缺失值在金融的量化分析中是个无可避免的问题。选取合理的缺失值处理方法,依赖于数据本身的特点、数据缺失的情况、其对应的经济学意义,以及我们需要使用数据进行何种计算。在尝试构建多因子模型时,我们选择了两种缺失值替换方法:(1)采用期望最大化算法 来用同一变量的已知数据对缺失值进行极大似然估计。(2)把模型中包含的所有因子作为特征变量,并赋予其相同的权重,再采用机器学习中的K-近邻算法来寻找最相似的标的,保证缺失值替换后,不会强化一部分因子的影响力。
其实在量化领域,机器学习解决着线性模型天生的缺陷或弊端,所以还是有着很深的介入的。除去凸优化、降维(提取市场特征)等领域的应用,目前“非动态性”和“非线性”是两个重要的弊端。金融关系之间并非静态,很多时候也不是线性的。统计学习的优势此时就会体现出来,它们能够迅速地适应市场,或者用一种更“准确的”方式来描述市场。
在国内,机器学习在量化内应用跟领域有很大的关系,跟频率也有很大的关系。比如,CTA的运用可能就要多于股票,它处理数据的维度要远小于股票,获取市场的长度和动态又强于股票。股票市场的momentum要弱于期货市场的momentum,它的趋势与股票相比更明显和低噪声。这些特征对于机器学习发挥作用都更加有利。
很可能国内一些交易执行算法的设计上就借鉴了机器学习。我们可以通过学习订单薄特征,对下一期盘口变化做一些概率上的预测,经过一定样本的训练之后,可以显著地提升算法表现。
而我仍谨慎看好深度学习等机器学习方法的原因在于,在认识市场上,现行的大部分方法与这些方法并不在一个维度上,这个优势让它们与其他方法相比,捕捉到更多的收益。也就是说,一个新的认识市场的角度才能带来alpha。
❸ 怎么利用svm对时间序列进行建模
SVM理论是在统计学习理论的基础上发展起来的,由于统计学习理论和SVM方法对有限样本情况下模式识别中的一些根本性的问题进行了系统的理论研究,很大程度上解决了以往的机器学习中模型的选择与过学习问题、非线性和维数灾难、局部极小点问题等。应用SVM进行回归预测的步骤具体如下:
1)实验规模的选取,决定训练集的数量、测试集的数量,以及两者的比例;2)预测参数的选取;3)对实验数据进行规范化处理;4)核函数的确定;5)核函数参数的确定。其中参数的选择对SVM的性能来说是十分重要的,对于本文的核函数使用RBF核函数,对于RBF核函数,SVM参数包括折衷参数C、核宽度C和不敏感参数E。目前SVM方法的参数、核函数的参数选择,在国际上都还没有形成统一的模式,也就是说最优SVM算法参数选择还只能是凭借经验、实验对比、大范围的搜寻和交叉检验等进行寻优。实际应用中经常为了方便,主观设定一个较小的正数作为E的取值,本文首先在C和C的一定范围内取多个值来训练,定下各个参数取值的大概范围,然后利用留一法来具体选定参数值
股价时间序列的SVM模型最高阶确定
股价数据是一个时间序列,从时间序列的特征分析得知,股价具有时滞、后效性,当天的股价不仅还与当天各种特征有关,还与前几天的股价及特征相关,所以有必要把前几天的股价和特征作为自变量来考虑。最高阶确定基本原理是从低阶开始对系统建模,然后逐步增加模型的阶数,并用F检验对这些模型进行判别来确定最高阶n,这样才能更客观反映股票价格的时滞特性。具体操作步骤如下:假定一多输入单输出回归模型有N个样本、一个因变量(股价)、m- 1个自变量(特征),由低阶到高阶递推地采用SVM模型去拟合系统(这儿的拓阶就是把昨天股价当做自变量,对特征同时拓阶),并依次对相邻两个SVM模型采用F检验的方法判断模型阶次增加是否合适[ 7]。对相邻两模型SVM ( n)和SVM ( n+ 1)而言,有统计量Fi为:Fi=QSVR (n)- QSVR( n+1)QSVR (n)1N - m n - (m -1)mi =1,2,,, n(1)它服从自由度分别为m和(N - m n - (m -1) )的F分布,其中QSVR (n)和QSVR( n+1)分别为SVR ( n)和QSVR( n+1)的剩余离差平方和,若Fi< F(?,m, N-m n- (m-1) ),则SVM (n )模型是合适的;反之,继续拓展阶数。
前向浮动特征筛选
经过上述模型最高阶数的确定后,虽然确定了阶数为n的SVM模型,即n个特征,但其中某些特征对模型的预测精度有不利影响,本文采用基于SVM和留一法的前向浮动特征特征筛选算法选择对提高预测精度有利影响的特征。令B= {xj: j=1,2,,, k}表示特征全集, Am表示由B中的m个特征组成的特征子集,评价函数MSE (Am)和MSE (Ai) i =1,2,,, m -1的值都已知。本文采用的前向浮动特征筛选算法如下[9]:1)设置m =0, A0为空集,利用前向特征筛选方法寻找两个特征组成特征子集Am(m =2);2)使用前向特征筛选方法从未选择的特征子集(B -Am)中选择特征xm +1,得到子集Am+1;3)如果迭代次数达到预设值则退出,否则执行4);4)选择特征子集Am+1中最不重要的特征。如果xm+1是最不重要的特征即对任意jXm +1, J (Am +1- xm+1)FJ(Am +1- xj)成立,那么令m = m +1,返回2) (由于xm+1是最不重要的特征,所以无需从Am中排除原有的特征);如果最不重要的特征是xr( r =1,2,,, m )且MSE (Am+1- xr) < MSE (Am)成立,排除xr,令A'm= Am+1- xr;如果m =2,设置Am= A'm,J (Am) = J (A'm), ,返回2),否则转向步骤5);5)在特征子集A'm中寻找最不重要的特征xs,如果MSE (A'm- xs)EM SE (Am-1),那么设置Am= A'm, MSE (Am)= MSE (A'm),返回2);如果M SE (A'm- xs) < M SE (Am -1),那么A'm从中排除xs,得到A'm-1= Am- xs,令m = m -1;如果m =2,设置Am= A'm, MSE (Am) = MSE (A'm)返回2),否则转向5)。最后选择的特征用于后续建模预测。
预测评价指标及参比模型
训练结果评估阶段是对训练得出的模型推广能力进行验证,所谓推广能力是指经训练后的模型对未在训练集中出现的样本做出正确反应的能力。为了评价本文模型的优劣,选择BPANN、多变量自回归时间序列模型( CAR)和没有进行拓阶和特征筛选的SVM作为参比模型。采用均方误差(mean squared error, MSE)和平均绝对误差百分率(mean ab-solute percentage error, MAPE)作为评价指标。MSE和MAP定义如下:M SE=E(yi- y^i)2n( 2)MAPE=E| yi- y^i| /yin( 3)其中yi为真值, y^i为预测值, n为预测样本数。如果得出M SE, MAPE结果较小,则说明该评估模型的推广能力强,或泛化能力强,否则就说明其推广能力较差
❹ SVM回归预测程序问题,求帮助
《MATLAB神经网络30个案例分析》里面有一个用SVM做股票开盘价分析的程序
他里面有这么几句版
ts = sh(2:m,1);
tsx = sh(1:m-1,:);
%归一化权 。。。
model = svmtrain(TS,TSX,cmd);
[predict,mse, decision_values] = svmpredict(TS,TSX,model);
他这个不是在用训练集预测自己吗?这样有什么意义?
另外我的时间序列每次只有一个数据,预测的时候是不是就只有一个特征?
谢谢!!
❺ 谁有SVM模型股价预测的MATLAB程序
还不如预测彩票呢....
你的输入量很重要
程序很简单,两句话,训练和预测,(如果给钱)你给我数据我给你写
❻ 支持向量机能用到对 股票估值上吗
支持向量机SVM(Support Vector Machine)作为一种可训练的机器学习方法,依靠小样本学习后的模型参数进行导航星提取,可以得到分布均匀且恒星数量大为减少的导航星表 基本情况 Vapnik等人在多年研究统计学习理论基础上对线性分类器提出了另一种设计最佳准则。其原理也从线svm 产品
性可分说起,然后扩展到线性不可分的情况。甚至扩展到使用非线性函数中去,这种分类器被称为支持向量机(Support Vector Machine,简称SVM)。支持向量机的提出有很深的理论背景。 支持向量机方法是在近年来提出的一种新方法。 SVM的主要思想可以概括为两点: (1) 它是针对线性可分情况进行分析,对于线性不可分的情况,通过使用非线性映射算法将低维输入空间线性不可分的样本转化为高维特征空间使其线性可分,从而 使得高维特征空间采用线性算法对样本的非线性特征进行线性分析成为可能;(2) 它基于结构风险最小化理论之上在特征空间中建构最优分割超平面,使得学习器得到全svm 系列产品
局最优化,并且在整个样本空间的期望风险以某个概率满足一定上界。 在学习这种方法时,首先要弄清楚这种方法考虑问题的特点,这就要从线性可分的最简单情况讨论起,在没有弄懂其原理之前,不要急于学习线性不可分等较复杂的情况,支持向量机在设计时,需要用到条件极值问题的求解,因此需用拉格朗日乘子理论,但对多数人来说,以前学到的或常用的是约束条件为等式表示的方式,但在此要用到以不等式作为必须满足的条件,此时只要了解拉格朗日理论的有关结论就行。
❼ 利用BP神经网络预测股票价格走势
参考 matlab神经网络30例 中有一个股票预测的案例
我觉得svm做这个更好
❽ 河南沙沟西铅锌银矿
沙沟西铅锌银矿位于河南洛宁县西南部,产于华北地台南缘卢氏-栾川-南召-方城多金属成矿带中,为太华群变质岩系构造破碎带中的薄脉型铅锌银矿。因为该类型矿床矿体薄,一般为0.1~0.5米,单矿体长多为几米至几十米,矿化沿走向和倾向都很不稳定,按我国的铜铅锌矿地质勘查规范和一般工业指标,难以圈定矿体,计算资源量/储量。
加拿大希尔威金属有限公司考察了该矿,对民采坑道进行编录以后发现,沿含矿的构造破碎带走向和倾向,矿体尖灭再现。每千米沿脉坑道,小矿体的累计长度平均约为300米。对这类极薄的不稳定矿体,加拿大希尔威金属有限公司提出的勘查方案是,主要用坑内钻控制含矿的构造破碎带的位置,用坑道控制矿体,探求资源量/储量。
中方合作伙伴、探矿权人河南省有色金属地质勘查局的开放意识强,遵循商业性矿产勘查的运作规则,只用了2个月的时间,就和希尔威金属有限公司的全资子公司——维克托矿业公司达成了合资协议,于2004年4月成立了河南法恩德矿业有限公司。中方投入沙沟西探矿权54.2平方千米,占22.5%的权益,外方投入现金376万美元,完成挣股期的投入后,占77.5%的权益。根据合资协议法计算,该探矿权价值为110万美元,约合人民币906万元。
河南法恩德矿业有限公司一成立,立即投入快速勘查。从2004年4月~2006年8月,共投入钻探30 304米,坑探37 053米。在13条矿脉上,共计探获推定和确定资源量矿石81.1万吨,含银1 535克/吨、铅26.48%、锌8.61%;推测资源量矿石126.4万吨,含银1 426克/吨、铅25.47%、锌8.39%。累计探获各级资源量,银3 022吨、铅53.2万吨、锌17.4万吨。
在勘查期间,投资机构以私募的方式,在2005年2月15日和2月22日,以1.5加元/股的价格购买了公司50万股和150万股,2005年8月31日又以3.2加元/股的价格购买了公司200万股。筹集勘查资金940万加元。同时配售了相应的认股权。由于勘查资金充足,希尔威金属有限公司提前完成了挣股期的投入,挣得河南法恩德矿业有限公司77.5%的权益。
在勘查阶段,希尔威金属有限公司根据沙沟西矿床银铅锌的品位,按矿石中银10.94加元/盎司、金261.4加元/盎司、铅0.66加元/磅、锌1.34加元/磅,作了概略性经济评价,预计开发后的利润水平高,决定提前开始开发的准备。2005年4月3个采矿竖井开工。2005年7月长沙有色金属研究院开始选矿和其他工程试验。2006年2月通过了采矿的环境评价报告,并请南非的采矿工程师设计了适合于极薄矿体的削壁充填法的采矿方案。2006年3月30日取得了采矿证,至此矿山投产。
从开始勘查到矿山投产,只用了2年时间。矿山投产后的第二个季度,即2006年3季度,开始向持有希尔威金属有限公司股票的股民分红,每股0.11加元。矿山的投产促使公司进一步扩大勘查,收购了和沙沟西矿区相邻的后坪沟等2个矿权,并建设了一座600吨/日的选矿厂。
由于希尔威金属有限公司的良好表现,矿业分析家给予该公司很好的评价。选择了市场意识和开放意识强的合作伙伴;根据矿床的产出特点,突破中国国内有关规范的要求,选择合适的勘查方法,因地制宜地开展勘查;勘查初期就开展概略性经济评价,做出合理的勘查决策;大规模的快速勘查,在迅速控制了部分富矿的资源量以后,超前做好矿山开拓和选厂建设,快速转入矿山开采;公司的现金流,由负值转为正值,不必增股筹资来维持勘查,公司从初级勘查公司向矿业公司转型;采矿的收入支持了公司扩大勘查和开发;投资初级勘查公司的股民,提前得到了分红。这已成为初级勘查公司发展的一种新模式。公司的股票从2004年3季度的0.4~0.5加元/股,到2006年4季度涨到17~20加元/股,上涨约40倍(图10-3)。投资者在希尔威金属有限公司,得到了高风险的超额回报。希尔威金属有限公司董事长兼CEO冯锐,在中国获得地质学士和硕士学位,在加拿大获得博士学位,从1995年起就开始探索中外合资勘查开发矿产之路,在1997~2003年的全球性勘查低潮中,坚持不懈。他的市场条件下矿产勘查开发理念、选择项目的特殊视角、在我国国内的勘查开发实践经验、快速的决策方式,值得其他勘查公司借鉴。
2006年12月18日,多伦多证券交易所主板将希尔威金属有限公司列为计算全球标准普尔指数的公司。希尔威金属有限公司是加拿大矿业界在中国投资矿产勘查最成功的初级勘查公司,它的业绩起了示范作用,鼓舞了其他初级勘查公司和投资者到中国投资矿产勘查的信心。
图10-3 希尔威金属有限公司的股价(上市符号SVM)