❶ 求支持向量機預測股票價格的MATLAB程序,謝謝!
這個,可多啊,我有
❷ 機器學習在量化交易裡面有多大的用處
曾有朋友問過,國內現在量化領域機器學習應用的少,是否因為效果不如簡單的策略。其實,把機器學習應用在量化交易上始終面臨著兩難,卻並不是無解的兩難。很多時候並不是機器學習不work,而是真正懂如何用正確科學的統計思維使用Machine Learning的人才太少。
機器學習涉及到特徵選擇、特徵工程、模型選擇、數據預處理、結果的驗證和分析等一整套建模流程,廣義角度來說就不單單是模型選擇的問題。所以,如果認為「用支持向量機成功預測股票漲跌」 這樣的研究,就是把機器學習應用於量化交易,這種狹義的認識無疑是買櫝還珠,對機器學習領域散落遍地的珍珠視而不見。如果把機器學習的崛起放在歷史進程中考量,無非就是趨勢的延續:現在,可通過系統的數據分析證實過去模糊不定的經驗,機器學習演算法將未曾被察覺的規律得以浮現紙面。
在我看來,未來的發展概有兩個方向:
1.針對量化交易的統計學習演算法被提出,使其適合於雜訊大,分布不穩定的金融數據分析;
2.對於機器學習的熱情回歸理性,從工具為導向回歸到問題為導向。
針對如何以問題為導向,在機器學習演算法中挑選合適的工具,分享一些思路。
1.多因子模型的因子權重計算
當我們在構建多因子模型且已經選定了一系列因子之後,要如何根據不同的市場情況調整各個因子的權重呢?在以往的研究中發現,與其它演算法相比較,隨機森林演算法對於存在非線性、噪音和自變數共線性的訓練集的分析結果更出色。所以,目前在多因子模型的權重上,採用當期收益率對上期因子進行隨機森林回歸分析,以確定下一期多因子模型的因子權重。
2.缺失值處理
處理缺失值在金融的量化分析中是個無可避免的問題。選取合理的缺失值處理方法,依賴於數據本身的特點、數據缺失的情況、其對應的經濟學意義,以及我們需要使用數據進行何種計算。在嘗試構建多因子模型時,我們選擇了兩種缺失值替換方法:(1)採用期望最大化演算法 來用同一變數的已知數據對缺失值進行極大似然估計。(2)把模型中包含的所有因子作為特徵變數,並賦予其相同的權重,再採用機器學習中的K-近鄰演算法來尋找最相似的標的,保證缺失值替換後,不會強化一部分因子的影響力。
其實在量化領域,機器學習解決著線性模型天生的缺陷或弊端,所以還是有著很深的介入的。除去凸優化、降維(提取市場特徵)等領域的應用,目前「非動態性」和「非線性」是兩個重要的弊端。金融關系之間並非靜態,很多時候也不是線性的。統計學習的優勢此時就會體現出來,它們能夠迅速地適應市場,或者用一種更「准確的」方式來描述市場。
在國內,機器學習在量化內應用跟領域有很大的關系,跟頻率也有很大的關系。比如,CTA的運用可能就要多於股票,它處理數據的維度要遠小於股票,獲取市場的長度和動態又強於股票。股票市場的momentum要弱於期貨市場的momentum,它的趨勢與股票相比更明顯和低雜訊。這些特徵對於機器學習發揮作用都更加有利。
很可能國內一些交易執行演算法的設計上就借鑒了機器學習。我們可以通過學習訂單薄特徵,對下一期盤口變化做一些概率上的預測,經過一定樣本的訓練之後,可以顯著地提升演算法表現。
而我仍謹慎看好深度學習等機器學習方法的原因在於,在認識市場上,現行的大部分方法與這些方法並不在一個維度上,這個優勢讓它們與其他方法相比,捕捉到更多的收益。也就是說,一個新的認識市場的角度才能帶來alpha。
❸ 怎麼利用svm對時間序列進行建模
SVM理論是在統計學習理論的基礎上發展起來的,由於統計學習理論和SVM方法對有限樣本情況下模式識別中的一些根本性的問題進行了系統的理論研究,很大程度上解決了以往的機器學習中模型的選擇與過學習問題、非線性和維數災難、局部極小點問題等。應用SVM進行回歸預測的步驟具體如下:
1)實驗規模的選取,決定訓練集的數量、測試集的數量,以及兩者的比例;2)預測參數的選取;3)對實驗數據進行規范化處理;4)核函數的確定;5)核函數參數的確定。其中參數的選擇對SVM的性能來說是十分重要的,對於本文的核函數使用RBF核函數,對於RBF核函數,SVM參數包括折衷參數C、核寬度C和不敏感參數E。目前SVM方法的參數、核函數的參數選擇,在國際上都還沒有形成統一的模式,也就是說最優SVM演算法參數選擇還只能是憑借經驗、實驗對比、大范圍的搜尋和交叉檢驗等進行尋優。實際應用中經常為了方便,主觀設定一個較小的正數作為E的取值,本文首先在C和C的一定范圍內取多個值來訓練,定下各個參數取值的大概范圍,然後利用留一法來具體選定參數值
股價時間序列的SVM模型最高階確定
股價數據是一個時間序列,從時間序列的特徵分析得知,股價具有時滯、後效性,當天的股價不僅還與當天各種特徵有關,還與前幾天的股價及特徵相關,所以有必要把前幾天的股價和特徵作為自變數來考慮。最高階確定基本原理是從低階開始對系統建模,然後逐步增加模型的階數,並用F檢驗對這些模型進行判別來確定最高階n,這樣才能更客觀反映股票價格的時滯特性。具體操作步驟如下:假定一多輸入單輸出回歸模型有N個樣本、一個因變數(股價)、m- 1個自變數(特徵),由低階到高階遞推地採用SVM模型去擬合系統(這兒的拓階就是把昨天股價當做自變數,對特徵同時拓階),並依次對相鄰兩個SVM模型採用F檢驗的方法判斷模型階次增加是否合適[ 7]。對相鄰兩模型SVM ( n)和SVM ( n+ 1)而言,有統計量Fi為:Fi=QSVR (n)- QSVR( n+1)QSVR (n)1N - m n - (m -1)mi =1,2,,, n(1)它服從自由度分別為m和(N - m n - (m -1) )的F分布,其中QSVR (n)和QSVR( n+1)分別為SVR ( n)和QSVR( n+1)的剩餘離差平方和,若Fi< F(?,m, N-m n- (m-1) ),則SVM (n )模型是合適的;反之,繼續拓展階數。
前向浮動特徵篩選
經過上述模型最高階數的確定後,雖然確定了階數為n的SVM模型,即n個特徵,但其中某些特徵對模型的預測精度有不利影響,本文採用基於SVM和留一法的前向浮動特徵特徵篩選演算法選擇對提高預測精度有利影響的特徵。令B= {xj: j=1,2,,, k}表示特徵全集, Am表示由B中的m個特徵組成的特徵子集,評價函數MSE (Am)和MSE (Ai) i =1,2,,, m -1的值都已知。本文採用的前向浮動特徵篩選演算法如下[9]:1)設置m =0, A0為空集,利用前向特徵篩選方法尋找兩個特徵組成特徵子集Am(m =2);2)使用前向特徵篩選方法從未選擇的特徵子集(B -Am)中選擇特徵xm +1,得到子集Am+1;3)如果迭代次數達到預設值則退出,否則執行4);4)選擇特徵子集Am+1中最不重要的特徵。如果xm+1是最不重要的特徵即對任意jXm +1, J (Am +1- xm+1)FJ(Am +1- xj)成立,那麼令m = m +1,返回2) (由於xm+1是最不重要的特徵,所以無需從Am中排除原有的特徵);如果最不重要的特徵是xr( r =1,2,,, m )且MSE (Am+1- xr) < MSE (Am)成立,排除xr,令A'm= Am+1- xr;如果m =2,設置Am= A'm,J (Am) = J (A'm), ,返回2),否則轉向步驟5);5)在特徵子集A'm中尋找最不重要的特徵xs,如果MSE (A'm- xs)EM SE (Am-1),那麼設置Am= A'm, MSE (Am)= MSE (A'm),返回2);如果M SE (A'm- xs) < M SE (Am -1),那麼A'm從中排除xs,得到A'm-1= Am- xs,令m = m -1;如果m =2,設置Am= A'm, MSE (Am) = MSE (A'm)返回2),否則轉向5)。最後選擇的特徵用於後續建模預測。
預測評價指標及參比模型
訓練結果評估階段是對訓練得出的模型推廣能力進行驗證,所謂推廣能力是指經訓練後的模型對未在訓練集中出現的樣本做出正確反應的能力。為了評價本文模型的優劣,選擇BPANN、多變數自回歸時間序列模型( CAR)和沒有進行拓階和特徵篩選的SVM作為參比模型。採用均方誤差(mean squared error, MSE)和平均絕對誤差百分率(mean ab-solute percentage error, MAPE)作為評價指標。MSE和MAP定義如下:M SE=E(yi- y^i)2n( 2)MAPE=E| yi- y^i| /yin( 3)其中yi為真值, y^i為預測值, n為預測樣本數。如果得出M SE, MAPE結果較小,則說明該評估模型的推廣能力強,或泛化能力強,否則就說明其推廣能力較差
❹ SVM回歸預測程序問題,求幫助
《MATLAB神經網路30個案例分析》裡面有一個用SVM做股票開盤價分析的程序
他裡面有這么幾句版
ts = sh(2:m,1);
tsx = sh(1:m-1,:);
%歸一化權 。。。
model = svmtrain(TS,TSX,cmd);
[predict,mse, decision_values] = svmpredict(TS,TSX,model);
他這個不是在用訓練集預測自己嗎?這樣有什麼意義?
另外我的時間序列每次只有一個數據,預測的時候是不是就只有一個特徵?
謝謝!!
❺ 誰有SVM模型股價預測的MATLAB程序
還不如預測彩票呢....
你的輸入量很重要
程序很簡單,兩句話,訓練和預測,(如果給錢)你給我數據我給你寫
❻ 支持向量機能用到對 股票估值上嗎
支持向量機SVM(Support Vector Machine)作為一種可訓練的機器學習方法,依靠小樣本學習後的模型參數進行導航星提取,可以得到分布均勻且恆星數量大為減少的導航星表 基本情況 Vapnik等人在多年研究統計學習理論基礎上對線性分類器提出了另一種設計最佳准則。其原理也從線svm 產品
性可分說起,然後擴展到線性不可分的情況。甚至擴展到使用非線性函數中去,這種分類器被稱為支持向量機(Support Vector Machine,簡稱SVM)。支持向量機的提出有很深的理論背景。 支持向量機方法是在近年來提出的一種新方法。 SVM的主要思想可以概括為兩點: (1) 它是針對線性可分情況進行分析,對於線性不可分的情況,通過使用非線性映射演算法將低維輸入空間線性不可分的樣本轉化為高維特徵空間使其線性可分,從而 使得高維特徵空間採用線性演算法對樣本的非線性特徵進行線性分析成為可能;(2) 它基於結構風險最小化理論之上在特徵空間中建構最優分割超平面,使得學習器得到全svm 系列產品
局最優化,並且在整個樣本空間的期望風險以某個概率滿足一定上界。 在學習這種方法時,首先要弄清楚這種方法考慮問題的特點,這就要從線性可分的最簡單情況討論起,在沒有弄懂其原理之前,不要急於學習線性不可分等較復雜的情況,支持向量機在設計時,需要用到條件極值問題的求解,因此需用拉格朗日乘子理論,但對多數人來說,以前學到的或常用的是約束條件為等式表示的方式,但在此要用到以不等式作為必須滿足的條件,此時只要了解拉格朗日理論的有關結論就行。
❼ 利用BP神經網路預測股票價格走勢
參考 matlab神經網路30例 中有一個股票預測的案例
我覺得svm做這個更好
❽ 河南沙溝西鉛鋅銀礦
沙溝西鉛鋅銀礦位於河南洛寧縣西南部,產於華北地台南緣盧氏-欒川-南召-方城多金屬成礦帶中,為太華群變質岩系構造破碎帶中的薄脈型鉛鋅銀礦。因為該類型礦床礦體薄,一般為0.1~0.5米,單礦體長多為幾米至幾十米,礦化沿走向和傾向都很不穩定,按我國的銅鉛鋅礦地質勘查規范和一般工業指標,難以圈定礦體,計算資源量/儲量。
加拿大希爾威金屬有限公司考察了該礦,對民采坑道進行編錄以後發現,沿含礦的構造破碎帶走向和傾向,礦體尖滅再現。每千米沿脈坑道,小礦體的累計長度平均約為300米。對這類極薄的不穩定礦體,加拿大希爾威金屬有限公司提出的勘查方案是,主要用坑內鑽控制含礦的構造破碎帶的位置,用坑道控制礦體,探求資源量/儲量。
中方合作夥伴、探礦權人河南省有色金屬地質勘查局的開放意識強,遵循商業性礦產勘查的運作規則,只用了2個月的時間,就和希爾威金屬有限公司的全資子公司——維克托礦業公司達成了合資協議,於2004年4月成立了河南法恩德礦業有限公司。中方投入沙溝西探礦權54.2平方千米,佔22.5%的權益,外方投入現金376萬美元,完成掙股期的投入後,佔77.5%的權益。根據合資協議法計算,該探礦權價值為110萬美元,約合人民幣906萬元。
河南法恩德礦業有限公司一成立,立即投入快速勘查。從2004年4月~2006年8月,共投入鑽探30 304米,坑探37 053米。在13條礦脈上,共計探獲推定和確定資源量礦石81.1萬噸,含銀1 535克/噸、鉛26.48%、鋅8.61%;推測資源量礦石126.4萬噸,含銀1 426克/噸、鉛25.47%、鋅8.39%。累計探獲各級資源量,銀3 022噸、鉛53.2萬噸、鋅17.4萬噸。
在勘查期間,投資機構以私募的方式,在2005年2月15日和2月22日,以1.5加元/股的價格購買了公司50萬股和150萬股,2005年8月31日又以3.2加元/股的價格購買了公司200萬股。籌集勘查資金940萬加元。同時配售了相應的認股權。由於勘查資金充足,希爾威金屬有限公司提前完成了掙股期的投入,掙得河南法恩德礦業有限公司77.5%的權益。
在勘查階段,希爾威金屬有限公司根據沙溝西礦床銀鉛鋅的品位,按礦石中銀10.94加元/盎司、金261.4加元/盎司、鉛0.66加元/磅、鋅1.34加元/磅,作了概略性經濟評價,預計開發後的利潤水平高,決定提前開始開發的准備。2005年4月3個采礦豎井開工。2005年7月長沙有色金屬研究院開始選礦和其他工程試驗。2006年2月通過了采礦的環境評價報告,並請南非的采礦工程師設計了適合於極薄礦體的削壁充填法的采礦方案。2006年3月30日取得了采礦證,至此礦山投產。
從開始勘查到礦山投產,只用了2年時間。礦山投產後的第二個季度,即2006年3季度,開始向持有希爾威金屬有限公司股票的股民分紅,每股0.11加元。礦山的投產促使公司進一步擴大勘查,收購了和沙溝西礦區相鄰的後坪溝等2個礦權,並建設了一座600噸/日的選礦廠。
由於希爾威金屬有限公司的良好表現,礦業分析家給予該公司很好的評價。選擇了市場意識和開放意識強的合作夥伴;根據礦床的產出特點,突破中國國內有關規范的要求,選擇合適的勘查方法,因地制宜地開展勘查;勘查初期就開展概略性經濟評價,做出合理的勘查決策;大規模的快速勘查,在迅速控制了部分富礦的資源量以後,超前做好礦山開拓和選廠建設,快速轉入礦山開采;公司的現金流,由負值轉為正值,不必增股籌資來維持勘查,公司從初級勘查公司向礦業公司轉型;采礦的收入支持了公司擴大勘查和開發;投資初級勘查公司的股民,提前得到了分紅。這已成為初級勘查公司發展的一種新模式。公司的股票從2004年3季度的0.4~0.5加元/股,到2006年4季度漲到17~20加元/股,上漲約40倍(圖10-3)。投資者在希爾威金屬有限公司,得到了高風險的超額回報。希爾威金屬有限公司董事長兼CEO馮銳,在中國獲得地質學士和碩士學位,在加拿大獲得博士學位,從1995年起就開始探索中外合資勘查開發礦產之路,在1997~2003年的全球性勘查低潮中,堅持不懈。他的市場條件下礦產勘查開發理念、選擇項目的特殊視角、在我國國內的勘查開發實踐經驗、快速的決策方式,值得其他勘查公司借鑒。
2006年12月18日,多倫多證券交易所主板將希爾威金屬有限公司列為計算全球標准普爾指數的公司。希爾威金屬有限公司是加拿大礦業界在中國投資礦產勘查最成功的初級勘查公司,它的業績起了示範作用,鼓舞了其他初級勘查公司和投資者到中國投資礦產勘查的信心。
圖10-3 希爾威金屬有限公司的股價(上市符號SVM)