码迷,mamicode.com
首页 > 其他好文 > 详细

股票量化交易中,如何确定高质量的历史数据

时间:2020-07-01 12:27:16      阅读:112      评论:0      收藏:0      [点我收藏+]

标签:mamicode   财务   alt   load   不包含   现金   http   概述   应该   

一、数据概述

  • 数据字段:量价数据(如开盘价、最低价、最高价、成交量、成交额、总市值等)、财务数据(如净利润TTM、现金流TTM、净资产、总资产、总负债、净利润(当季)等)、另类数据(主要是资金流入流出数据,如中户资金买入额、中户资金卖出额等)
    注:对股票量化投资来说,财务数据是非常重要的
  • 数据的排序
  • 对停牌数据的展示形式

二、是否包含退市股票
不包含退市股票,数据就是不完整,最终得到的结论就是不准确的
退市股票代表比较差的股票,如果回到早些时候,这些退市股票还未退市,又不知道这些股票未来会退市,间接地就用到了“未来函数”,会使得策略表现的“更好”

  • A股退市比例不高,但在美股、港股退市很高,需要格外注意
  • 二战时的飞机(幸存者偏差)

三、是否包含全部历史时间

  • 选股策略:一盘从06、07年开始,一是覆盖了两个牛熊周期,二是财务数据的改革
  • 择时策略:最好更早

技术图片

四、注意财务数据发布时间
从wind数据库下载的数据,比如市盈率更新过早,有可能会用到一个“未来函数”,比如,SH6000026中远海能2019年1月2日就将财报数据进行了更新,但2018年的年财报数据在2019年3月28日才公布,会导致量化投资策略的误差

  • TTM:最近12个月(Trailing Twelve Months)
    在wind数据库中,每股受益会发现是年报财务数据的数据,但当发布季度报表了,数据应该更新,但并没有更新

五、注意股票的曾用名

技术图片

股票的曾用名的用处

对股票的涨停价格很重要(连续涨停、次新股)
ST决定涨跌幅

六、如何计算股票的复权价格

技术图片

当发生除权操作时,只有对其进行计算复权价格才能继续后续的操作。
涨跌幅、前收盘价才是最重要的
前收盘价与当日的收盘价进行比较得到涨跌幅

观:刑不行《量化投资中,如何获取高质量股票历史数据》小结

股票量化交易中,如何确定高质量的历史数据

标签:mamicode   财务   alt   load   不包含   现金   http   概述   应该   

原文地址:https://www.cnblogs.com/whiteBear/p/13218469.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!