2015年7月20日 星期一

從巨量資料分析方法找台日韓兌美元匯率機率密度函數

話說台灣是以出口為導向的國家,新台幣匯率的穩定與否與國際情勢深深地影響台灣出口狀況。所以在匯率相關文獻上,例如,王泓仁(2005)使用結構式自我迴歸模型探討央行持有國外資產淨額變動率、銀行隔夜拆款利率、M2變動率、自然對數下之CPI、自然對數下之工業生產指數、新台幣兌美元匯率、外貿比例、貿易條件為內生變數進行匯率與其他變數關係討論,另外使用GARCH討論新台幣匯率成長率之波動。

蔡聰勇(2006)以ARCH模型分析日本央行干預日元兌美元匯率對新台幣匯率波動影響。何棟欽(2001)則是建立誤差校正模型(ECM),使用隔夜拆款利率、基本放款利率、存款利率與10年期中央公債次級市場利率,發現台灣央行的存放款利率調整無僵固性,短期利率傳遞至公債利率效果不佳,但長天期存款利率則較為理想。傅澤偉、黃國安、林曼莉(2014)比較僵固型價格貨幣理論模型、資產組合平衡模型與行為均衡匯率模型,認為僵固型價格貨幣理論模型為佳。

不過這些分析匯率之模型多仍建構在
  1. 線性模型上,即使是GARCH模型也是一樣。
  2. 誤差是常態分配上。

事實上,在資料定序的基礎上,各國匯率不太可能是常態分配,即使解釋變數放入後的迴歸模型也是一樣。這不只是假迴歸問題,而需要從根本討論起。

在巨量資料分析下,若選擇1779/1/1至2015/04/17期間的日資料,可發現新台幣匯率之機率密度函數是可以被找到的。


左圖為日元兌美元匯率之機率密度函數圖、中間圖為韓元兌美元匯率之機率密度函數圖、右圖為新台幣兌美元匯率之機率密度函數圖。觀察圖形可知,

  1. 從全距與變異數來看,新台幣兌美元匯率 < 日元兌美元匯率 < 韓元兌美元匯率
  2. 從偏態、峰態與變異係數來看,新台幣兌美元匯率 < 韓元兌美元匯率 < 日元兌美元匯率
  3. 從機率密度函數圖來看,台日韓匯率都有雙峰傾向
  4. 從特定匯率值出現機率來說,台灣有39.83%最大機率盯住特定匯率值、日本有3.87%最大機率盯住特定匯率值、南韓僅有0.58%最大機率盯住特定匯率值

南韓在外匯市場上的干預是最少的,這是起源於1997年南韓為了度過東南亞金融風暴而向IMF借款救經濟時,要求依據國際組織之外匯管制規範,不再高度干預外匯市場。因此,在匯率的機率密度函數圖表當中特別明顯可以看到這樣的結果。

資料如何算巨量?

巨量資料顧名思義即是大量的資料,然而資料量多大才算是巨量呢?
誰能說得清?1個億?10個億?


現階段的開放資料(open data),哪個是有上億資料?若整個資料庫來說確實有,但對於分析人員來說,特定幾個資料表才是重點。例如,貨幣政策的研究員在意利率、貨幣供給量、國內生產毛額、發行定期存單量。若由最大時間單位的變數決定(季),且假設從1955年至2014年皆有資料,則60年*4,此時,每個變數有240筆資料,本例有4個變數,所以共計960筆資料。
這不算是巨量資料,但可視為母體資料,並且資料量會隨時間而增加,所以每次估算就需納入最新資料。這無法預測非常準確,但可以增加準確性。


不過,這可否使用巨量資料分析呢?
答案是可以的!王冠先與李玫郁(2015)提出之巨量資料分析方法可以應用在此分析上。
步驟1:建立各變數之機率分配
步驟2:由各分配生成1億筆資料,共計4億筆資料
步驟3:跑數學模型,得到資料特徵之數學模式

在這過程中,對軟體商來說,
  1. 資料要讀得進;
  2. 能為資料定序。

對分析人員來說,
  1. 資料代表性與正確性;
  2. 能為資料檢測。

總而言之,巨量資料方法的應用將不侷限樣本大小或僅能模擬出來的資料。

另一種資料就是財務金融資料,例如,股票現階段的記錄上可細分至20秒一筆記錄值,累積資料起來就相當驚人,動輒上百萬筆資料,更近似於巨量資料概念。於是,在分析與研究上,更需要巨量資料分析方法。

巨量資料分析方法的免費電子書已經在 PUPU電子書商城 上架。對巨量資料來說,定序是非常重要的,這樣才能從中找到資料的數學模式,繼續從事相關研究分析,提供策略參考。