用Pandas Dataframe来架构起金融股票数据的内部形态

用Pandas Dataframe来架构起金融股票数据的内部形态

2. 金融股票数据的另一个形态,怎样在业务内部流动,同时怎样避免错误

前一篇讲解了股票的原始状态,那麽在业务过程中,数据会变成怎样的形态,来完成众多奇奇怪怪的业务呢,以下将会解答。

 

首先,任何股票都有机会停市,退市。或者退市了再二次上市。

例子,阿里爸爸(9988.HK)在港交所二次上市。

再例如,富力地产(2777.HK),12供2股的方法向市场增发当天,停牌一天。

这种情况下,某些股票的数据就会断断续续,不连贯。

那麽惟一叁考的标准,就只有大盘指数的数据,才是最信得过的依靠。

因此把数据拿了回来,应该用大市指数的交易日,作为整个Dataframe的index,然后注入其他股票数据在这Dataframe,才能最完整地保证不出错。

 

 

 

以上数据全是乱编,不用细看。

假设邵匡概念基金,在1月9日~1月10日之间停牌分红,那麽该2天就不会有收市价。

可其他股票0700腾讯,1299友邦是正常交易日。

 

所以这就避免了很多业务问题,如:

a. 邵匡概念基金和友邦的过往5天股价对比图,由於邵匡概念基金是停牌,所以那2天不能画到股价线。这避免了拿错了1月2日,1月3日,1月7日,1月8日,1月11日,这样5个交易日的数据。

b. 计算含多只股票的板块的贝塔值,波动率等,由於邵匡概念基金和该2天停牌,那麽计算均值应该是(370+82)/2,(腾讯+友邦)/2。而不是(370+82+0)/3,(腾讯+友邦+邵匡概念)/3,这样计算肯定寻死。