本资源提供了一个基于Python构建的股票多因子选股模型,涵盖PCA因子合成与等权重因子合成方法,并采用综合打分策略。附带完整因子数据集压缩包,便于用户快速实践和研究。
Python多因子选股模型包含以下步骤:
1. 因子数据合并:将多个来源的因子数据整合到一起。
2. 行业内中性化处理:消除行业因素对股票价格的影响,使各行业内股票之间的比较更加公平有效。
3. 数据标准化:确保不同量纲的数据在计算过程中具有可比性。
4. 异常值和离群点处理:剔除异常数据以提高模型的稳定性和准确性。
5. PCA因子合成:利用主成分分析法提取关键因子,减少维度的同时保留大部分信息。
6. 等权重因子合成:赋予各因子相同的权重进行综合评价。
7. 综合打分方法(IC值计算):通过计算信息系数来衡量各个因子的有效性,并据此对股票做出评分。
8. 策略回测:选取排名前20的股票构成投资组合,模拟交易过程以评估策略效果。
9. 收益曲线绘制:展示模型在历史数据上的表现情况。
该选股模型所使用的成长与估值类因素包括但不限于:
- 成长因子:
- EV/EBITDA(企业倍数)
- PB(MRQ)(市净率,最近一季度末值)
- PCF(现金净流量TTM)和PCF(经营现金流TTM) (市现率,过去12个月数据)
- PE(TTM) 和PE(TTM,扣除非经常性损益) (市盈率)
- PS(TTM)(市销率)
- 股息收益率(最近十二月)
- 估值因子:
- 净利润增长率
- 总资产、净资产和经营现金流同比增长率
- 基本每股收益增长速度
- 利润总额及营业总收入的同比变化情况