AI量化实验室

 找回密码
 立即注册
查看: 451|回复: 7

改进了deap的fitness和metrics

[复制链接]

61

主题

135

帖子

531

积分

管理员

积分
531
发表于 2024-8-21 11:07:58 | 显示全部楼层 |阅读模式
我们目前投入使用的因子挖掘,基于两个框架,deap和gplearn,deap做一点点改动,就可以完美应用于多标的截面因子挖掘。而gplearn如果要支持三维数据,则需要很多改动,但gplearn的优点是代码读起来很顺畅。
——也许我会考虑把gplearn应用于单标的,比如CTA的时序因子挖掘
从结果来看,传统研报里说的IC分析,其实不科学。IC就是因子与收益率的平均相关系数。这个相关系数只能说,可能说能解释一部分,有一定的关系,但关系是什么?如果你把时间分成两段来看,有可能前半段正相关,后半段负相关,然后一平均,看起来这个值还可以。


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

×

61

主题

135

帖子

531

积分

管理员

积分
531
 楼主| 发表于 2024-8-21 11:27:16 | 显示全部楼层
这个因子是:'sqrt(log(ts_delta(volume, 20)))'

1

主题

3

帖子

11

积分

量化新人

积分
11
发表于 2024-8-21 12:15:44 | 显示全部楼层
有可能前半段正相关,后半段负相关,然后一平均,看起来这个值还可以。
——结论是什么,怎么破?

61

主题

135

帖子

531

积分

管理员

积分
531
 楼主| 发表于 2024-8-21 12:28:56 | 显示全部楼层
_KK_ 发表于 2024-8-21 12:15
有可能前半段正相关,后半段负相关,然后一平均,看起来这个值还可以。
——结论是什么,怎么破? ...

没办法,只能说ic不靠谱。
或者说因子失效了。

0

主题

3

帖子

54

积分

注册会员

积分
54
发表于 2024-8-22 14:43:34 | 显示全部楼层
所以可能还要因子择时,多个因子滚动周期分别计算ic,发现连续几期ic不行的话就换因子……

61

主题

135

帖子

531

积分

管理员

积分
531
 楼主| 发表于 2024-8-22 14:48:22 | 显示全部楼层
shiwujiang 发表于 2024-8-22 14:43
所以可能还要因子择时,多个因子滚动周期分别计算ic,发现连续几期ic不行的话就换因子…… ...

对的,定期更新,看稳定性。

3

主题

10

帖子

157

积分

注册会员

积分
157
发表于 2024-8-22 16:23:46 来自手机 | 显示全部楼层
ailabx 发表于 2024-8-22 14:48
对的,定期更新,看稳定性。

有没有可能用机器学习总结出来因子表现的好坏条件呢?这样就可以嫁接一个择时模型在因子使用上。不知道,这样是否能进一步提高策略效能(当然,另一个前提得有相关性较低的因子库)?

0

主题

1

帖子

14

积分

量化新人

积分
14
发表于 2024-8-22 18:54:31 | 显示全部楼层
总感觉是标的是etf的原因?策略逻辑本质上是成交量放大?
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

AI量化实验室 ( 京ICP备16049031号-2 )

GMT+8, 2024-9-20 05:22 , Processed in 0.065602 second(s), 20 queries .

Powered by Discuz! X3.5

Copyright © 2001-2024 Tencent Cloud.

快速回复 返回顶部 返回列表