會有這樣整理動作,是因為ezChart大大從11/1開始不提供1.x版使用的日轉檔資料(不過使用2.x版的大大不用擔心,2.x版好像已經提供轉到1.x版的模組了)
而我有一些自己寫的東西是用到1,x版的資訊,所以最後就決定自己來產生日轉檔資料。


目前轉檔資料到明天加入期指資料後,應該就跟ezChart大大原先提供的日轉檔資料部分相同,不過其中一些編碼方式會跟ezChart大大原先提供的不同,同時也為了讓之後要使用我產生的轉檔資料的人知道資料來源是如何來的,因此利用這篇文章來告訴有興趣的人,另外也讓大家看看我目前的資料來源是否有問題(原則上以台灣證券交易所、櫃檯買賣中心、公開資訊觀測站及期貨交易所,除非以上沒有方便蒐集的資訊才找另外的網站),或是有更好的資料取得網站(免費的)可以提供給我,最後也希望有熱心的大大可以一起來加入整理資料的動作,讓每天提供檔案的時間能比較早!

 

PS:

2010/09/12 update:已更新新版轉檔程式,使用新版公開資訊觀測站的上櫃股息資料,另外也額外處理上市股息資料可能造成轉檔程式無法往下轉檔問題。

2011/02/20:更新新版轉檔程式,將原先使用excel巨集取得的檔案,改為直接從櫃買中心網頁下載 



以下是各個轉檔來源資料的說明:
1.日資料檔(yymmdd.dly,EX:961026.dly)
(1)上市股息股利資料:台灣證券交易所 - 市場公告 - 除權除息 - 預告表,存成以下檔名(EX:TWT48WT20071026.csv)
(2)上櫃股息股利資料:

     A. 如使用舊版轉檔程式,取得檔案步驟如下:舊版公開資訊觀測站 - 公告查詢 - 公司股利分派公告資料彙總表,查詢結果出來後用全選複製的方式到notepad,存成以下檔名(EX:TWT48OT20071026.csv)

     B. 如使用新版轉檔程式,取得檔案步驟如下:到新版公開資訊觀測站的此網址(http://mops.twse.com.tw/mops/web/t108sb27),選擇完畢後,按"搜尋"按鈕,資料列出後,再按"另存csv"按鈕,存成以下檔名(EX:TWT48OT20100912.csv)

2010091201.bmp


(3)上市個股日資料:台灣證券交易所 - 盤後資訊 - 每日收盤行情,存成以下檔名(EX:A11220071026ALL_1.csv)
(4)上櫃個股日資料:櫃檯買賣中心 - 上櫃股票交易資訊 - 盤後資訊 - 上櫃股票行情,存成以下檔名(EX:K00120071026.csv) 
(5)上市類股資訊:使用聚財網資訊(http://stock.wearn.com/today.asp),將表中資料複製到excel中整理存檔(以tab鍵分隔,存成IDXWTyyyymmdd.txt檔)
(6)上櫃類股資訊:利用兩個來源檔案資料整理並加上從Yahoo Kimo找出的上櫃成交量資訊後,利用excel中整理存檔(以tab鍵分隔,存成IDXOTyyyymmdd.txt檔)
櫃檯買賣中心 - 上櫃股票交易資訊 - 指數資料 - 上櫃各類股指數
櫃檯買賣中心 - 上櫃股票交易資訊 - 歷史熱門資料 - 類股成交價量比重
(7)期指資料:期貨交易所每日行情資料下載(http://www.taifex.com.tw/chinese/3/3_1_2.asp),存成以下檔名(TUTURES20071026.csv)

2.外資持股檔(yymmdd.fdl,EX:961026.fdl)

(1)上市外資持股:台灣證券交易所 - 三大法人 - 外資投資持股統計,存成以下檔名(EX:MI_QFIIS-20071026.csv)
(2)上櫃外資持股:櫃檯買賣中心 - 上櫃股票交易資訊 - 三大法人 - 外資投資持股統計,查詢結果出來後用全選複製的方式到notepad,存成以下檔名(EX:K00320071026.csv)

3.融資融券檔(yymmdd.mdl,EX:961026.mdl)

(1)上市融資融券:台灣證券交易所 - 融資融券 - 融資融券餘額,存成以下檔名(EX:A11220071026_1.csv)
(2)上櫃融資融券:櫃檯買賣中心 - 上櫃股票交易資訊 - 融資融券 - 融資融券餘額表,存成以下檔名(EX:mgstoff_20071026.csv) 


接下來說明我整理產生的轉檔資料跟ezChart大大資料不同的地方

1.增加上櫃類股日資訊:此部分是新增的,不過因為櫃買中心的資料也沒有很完整,所以只提供自己能整出來的部分,以下是存於ezChart的編碼及名稱
IDX44    紡纖類
IDX45    機械類
IDX50    鋼鐵類
IDX54    電子類
IDX55    營建類
IDX56    航運類
IDX57    觀光類
IDX47    化工類
IDX41    生技醫療
IDX53    半導體類
IDX61    電腦週邊
IDX62    光電業類
IDX30    通信網路
IDX31    電子零件
IDX32    電子通路
IDX52    資訊服務
IDXOT    櫃檯指數

 

2.期指資料編碼方式改變:此部分與ezChart大大目前提供的編碼方式不同(因為我也不知道ezChart大大的編碼定義),所以我重新定義編碼方式,編碼方式會以每日取得資料中的契約及交割月份合併起來,以下是範例說明

契約名稱:GD
交割月份:200710
編碼名稱:GD7A (其中7為年份,值從0 ~ Z,A為月份,值從0 ~ C)

 

3.20100103更新關於TDR資料部分:因為ezChart只能容納5碼資料,所以2009/12/15之後的TDR資料都無法進入ezChart中。為了解決此問題,故將6碼TDR資料進行轉換,以便能在ezChart中顯示相關資訊,以下就舉例說明

原股號:910322(康師傅)
轉換規則:將前兩碼以英文代號替換(90 ~ 99 分別以A ~ J 替換)
轉換後股號:B0322

20100103ezChart.jpg




最後說明一下要使用這種方式延續使用ezChart的想法

1.因為使用與ezChart大大相同的原始檔案格式,所以可以沿用ezChart程式原來的機制進行更新,也不用考慮其它方式可能會產生的問題。

2.只要有人願意進行資料整理工作的話,像國外交易所的資訊(如道瓊指數、恆生指數.....)都可以在修改部分程式後產生在轉檔資料中匯進去ezChart。


以上這些資訊如果有錯誤的地方,還請各位告知一下,謝謝!

arrow
arrow
    全站熱搜

    小小上班族 發表在 痞客邦 留言(122) 人氣()