终极裁决 关于量化系统参数优化的全面剖析

终极裁决 关于量化系统参数优化的全面剖析群内好友关于量化系统参数是否优化一个问题讨论激烈 关键有人搬出 TB 老总陈剑灵老板 这样的大佬都提到的话题 我都不来蹭个热度 太对不起同在广东这片创新的天了 今天闲暇时光就针对这个现实而具体的问题 根据多年打脸经验和实操历程做一次全面剖析

欢迎大家来到IT世界,在知识的湖畔探索吧!

终极裁决 关于量化系统参数优化的全面剖析

群内好友关于量化系统参数是否优化一个问题讨论激烈。关键有人搬出TB老总陈剑灵老板,这样的大佬都提到的话题,我都不来蹭个热度,太对不起同在广东这片创新的天了。

终极裁决 关于量化系统参数优化的全面剖析

今天闲暇时光就针对这个现实而具体的问题,根据多年打脸经验和实操历程做一次全面剖析。其实本着内心,像这样具体的问题,弄不好我解答出来都有可能遇到“抗拒之声”,但是我是个追求极致的人,我要做到的是:放之四海而皆准!

终极裁决 关于量化系统参数优化的全面剖析

参数是这个世界的基石,当然也是模型搭建的基础,由于没有唯一性,确定性,芸芸众生为了找到无敌于世界的参数乐此不疲。

好多量化初学者,拿到一个简单的交易模型,不管是网上买的还是自己搭建的,回测当中都会遇到,明明理论已经很过硬,代码编译也无错误,理论上的开仓点和平仓点都是预设的位置出现,但是一看回测报告就扎心了。

终极裁决 关于量化系统参数优化的全面剖析

回撤这么大?这么辣鸡?又被骗了钱还伤了感情。你还会思考一个问题?万一我的入场点是下面圆圈处

终极裁决 关于量化系统参数优化的全面剖析

几年不赚钱,我敢确定你会蚌埠住的,即使这样具有普适性和高效的策略你都会打退堂鼓!我一生才多少年?在这个上面几年都亏钱?我不是吃多了就是脑子有病。但是呢?模型的基础理论摆在那里,你又没办法修改底层逻辑,甚至没有能力亦或是勇气重构,也或者修改出来更垃圾,这时候你就只有一条路可走了,优化参数

说干就干:

终极裁决 关于量化系统参数优化的全面剖析

终极裁决 关于量化系统参数优化的全面剖析

综合评分最高是 27-3

终极裁决 关于量化系统参数优化的全面剖析

果然“直了”,这样是否可行?也行也不行!为什么?

这个模型的参数本质是个时间参数,原码是20日,9日,现在变成27日,3日,对于未来不可预测的底层逻辑,其实这两个只代表过去,根本不能代表将来一定会好。万一等两个月你再回测,最佳参数是33日,5日呢?试问你该如何面对?如果你再更改,那么你在优化的路上就停不下来。

第一条:时间周期参数优化要慎重,防止过拟合和过极端甚至“孤岛”参数

终极裁决 关于量化系统参数优化的全面剖析

从敏感性测试来看圆圈内的日线周期都在1个标准差范围内,方框内2个标准差范围就是极限高低值了。那么回归现实,我们要确定一个才能“生产”啊,针对上图我的建议如下:

终极裁决 关于量化系统参数优化的全面剖析

那么我们就该选择圆圈内这个中心极点,这个属于正态分布最佳点,如果你的策略不是“坑货”这个点理论上衰败和兴盛的范围就会在一个标准差内,这样可以有效防止因为你的参数影响让你模型崩溃。

这里我们就不得不回顾一下小学二年级学的“标准差”定义

标准差(Standard Deviation)是一种描述数据的离散程度的统计量。标准差表示数据集合中每个数值与数据集平均值的偏离程度,越大表示该数据集合整体的离散程度越大,越小表示数据集合整体的离散程度越小,19世纪末,由英国统计学家卡尔·皮尔逊(Karl Pearson)首先提出。

标准差的计算公式为,先计算每个数值与平均数的差,然后求其平方值,再把所有平方值相加后除以总数,最后再对结果进行平方根运算。如果是对整个总体进行计算,则标准差记为σ,如果是对样本进行计算,则标准差记为s。

终极裁决 关于量化系统参数优化的全面剖析

整体标准差

终极裁决 关于量化系统参数优化的全面剖析

样本标准差

在国家计量技术规范中, 标准差的正式名称是标准偏差, 简称标准差,标准差的名称有10余种, 如总体标准差、 母体标准差、 均方根误差、 均方根偏差、 均方误差、 均方差、 单次测量标准差和理论标准差等。

标准差的值越小,表示数据集合整体的分布越紧密,平均数代表数据的代表值更加准确;标准差的值越大,表示数据集合整体的分布越分散,平均数代表数据的代表值的可信度就降低了。标准差是统计学中非常重要的一个概念,可以帮助人们更好地理解和分析数据分布规律,进而进行更加科学和准确的推断和决策。

还不得不回顾一下小学二年级学的“正态分布”定义
对于同一总体画频率分布图,观察的样本逐渐增多,组段不断细分,直条的宽度逐渐变窄,最终顶端接近一条平滑的曲线,呈现为大部分集中在平均值附近,且越远离平均值出现频率越低,形成中间高两侧逐渐下降并对称的频率密度曲线,就是正态分布。

终极裁决 关于量化系统参数优化的全面剖析

正态分布图(很关键)

在μ±σ区间内(正负1个标准差范围内),面积占总体的68.27%。

在μ±2σ区间内(正负2个标准差范围内),面积占总体的95.44%。

在μ±3σ区间内(正负3个标准差范围内),面积占总体的99.74%。

为什么要提这两个很普通的概念

第二条:已经得到数学界或者世界公认许可的值,不建议优化。

终极裁决 关于量化系统参数优化的全面剖析

这里讲我读书时候的一个场景,数学课上老师让我背一条数学公理,但是我背错了,老师说“你想与全世界为敌吗?”我们处在三维的世界,好多理论是“确定”的,你在没有推翻它之前最好就不要挑衅它的权威。

标准差正态分布这些已经证明了他的通用性你就用不着白费心思优化他了!

举个例子:

终极裁决 关于量化系统参数优化的全面剖析

我们常见的BOLL线通道2个标准差理论上已经可以囊括95.45%的K线,你偏偏为了极少数的行情给3个或者4个甚至5个就绝对没有必要了。

要有舍有得思维,你先把这90%以内的行情吃住,就已经可以够吃了。

第三条:关于止损幅度的参数,优化注意事项。

一条铁律,如果你模型有止盈的设计,盈利至少要大于止损3倍(特别是趋势跟踪类模型)才开始执行,因为不管历史现实亦或是理论推导,趋势跟踪模型大数据得出,成功的概率不会超过50%,不要几次“恰到好处”把你止损掉就随便更改这个最低值。

当然你像我一样绝对自信,你有把握把你进出场成功概率超过我给的上限值,你缩小你的盈亏比也无可厚非,毕竟天外天,人外人无处不在。

终极裁决 关于量化系统参数优化的全面剖析

会当凌绝顶 一览众山小

第四条:优化的“雕虫小计”

还是拿BOLL说事,不是说2个标准差是最佳吗?预防大家一样,举例是趋势跟踪策略,想入场早那么一丢丢,预防集中报单造成滑点,形成冲击成本,那么你用1.999(举例),这样就有那么一点先进场的“优势”,当然这在我眼中属于“雕虫小计”而已。

这里我本人就不喜欢参数优化,我一般操作流程是,先固定周期,比方日线:99%都是20日,这个20你别小瞧,这个值很有讲究,突破这个值,刚好也是突破四周和月线(每个月几乎也只有4周上下几天错差)的值,所以好多“老鸟”把20日称为“生命线”也是有其道理的。

终极裁决 关于量化系统参数优化的全面剖析

周期确定,然后加载全市场所有品种直接从他有第一个数据开始,通跑一遍,首先验证在无穷无尽的走势中,保证策略不会崩掉。这点至关重要,这是我基础“信心”的起点,然后剔除诸如粳米,动力煤,晚籼稻等等这些既没持仓也没成交量的品种,再次跑一遍。

这样两次确认逻辑没错,接下来逐个找出历史中位参数(听好不是最优参数),然后再把有些品种的持仓和止损都完善,历史回测都是一手一手干,现实碳酸锂一手,玉米也一手,那就有点犯傻的行为了。

比方有的策略写的是2%止损亦或是20跳止损,这显然也不合理,小品种还可以,生猪这些随便一天100-400的点差跳动,显然也是不合理,10年债这些几年都难碰到2%的波幅,所以针对性对各个商品,历史波幅修改波动率止盈止损是非常有必要的,这个属于完善,不属于优化。

第五:有的回撤不是真回撤谨防你犯眼睛错误!

终极裁决 关于量化系统参数优化的全面剖析

上面就是典型的吃干抹净,大圆圈处的回撤,属于属于行情波折,根本不是你策略新开平仓造成的收益回撤,也就是说这个行情他就是这样,这你都还优化,那么行情只有给你走出45°的斜线你才满意。这就非常扯了。

总之优化有必要,是个“系统性工程”,而不是简单靠计算机穷举就一了百了然后想躺赢,如果真那么简单随意,这条路上就没有那么多倒下去的“枯骨残骸”,其实只要你底层逻辑够硬,不优化也未尝不是一种选择,所谓“不变应万变”,真正的大佬一个简单云条件单就可以了。

今天到此为止!下一篇《你如何才可能在期货市场暴富—你其实需要一次抢车位的游戏时机》你们的点赞关注和转发是我永远前进的动力。

终极裁决 关于量化系统参数优化的全面剖析

免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://itzsg.com/98391.html

(0)
上一篇 5天前
下一篇 5天前

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们YX

mu99908888

在线咨询: 微信交谈

邮件:itzsgw@126.com

工作时间:时刻准备着!

关注微信