只不过我不使用Gplearn,而使用Deap,其余是一样的。
研报原文地址
这篇研报的标题为【金融工程】专题:期货多因子系列(七):利用遗传规划挖掘商品期货截面因子,由中信期货研究所金融工程团队撰写。以下是研报的要点总结: 遗传规划算法介绍:研报首先介绍了遗传规划算法的原理,这是一种仿生启发式算法,可以用于因子挖掘。遗传规划通过模拟自然界的进化过程,从随机生成的公式群体开始,逐渐生成符合特定目标的公式群体。 适应度函数:适应度函数用于评估遗传规划中个体的适应度,即个体与目标个体的相符程度。在因子挖掘中,可以使用因子的RankIC、RankICIR或夏普比率等指标作为适应度。 公式树的进化方式:研报详细解释了遗传规划中的公式树进化方式,包括杂交变异、子树变异、Hoist变异和点变异。 gplearn包的使用与改进:作者使用Python的gplearn包进行商品期货的截面因子挖掘,并对gplearn进行了改进,以适应因子挖掘的需求,包括修改输入变量维度、扩充算子函数集和自定义适应度函数。 截面选期因子挖掘流程:研报展示了如何使用改进后的gplearn进行因子挖掘,包括样本选择、回测细节、单因子回测方法和遗传规划流程。 挖掘结果:作者挖掘了5个具有较好选期能力的截面Alpha因子,并提供了这些因子的年化收益率、年化波动、夏普比率、最大回撤和卡玛比率等回测结果。 风险提示:研报指出,报告中的资产配比和模型应用仅为回溯举例,并不构成推荐建议,提醒投资者注意风险。 总结与思考:研报总结了遗传规划在因子挖掘中的应用,并指出了其存在的缺点,如随机性强、易产生过拟合和因子复杂度高等。同时,提出了改进方向,包括进行特征工程和加入时序交叉验证步骤。 附录:研报提供了遗传规划挖掘因子过程中使用的算子函数列表。
整体而言,这篇研报详细介绍了遗传规划算法在商品期货截面因子挖掘中的应用,并展示了实际的挖掘流程和结果,同时对遗传规划算法的优缺点进行了深入分析,并提出了改进建议。
|