S*********g 发帖数: 5298 | 1 用了2个简单技术
1)很简单,很naive的data mining来预测第二天的涨跌。这部分单独运行的话,本身也
是赚的,不过曲线没这么smooth。08年那段,和TA组合之后,drawdown小了很多。 这
部分需要两个个参数,一个是用来training的时间长度,一个是分cluster时候的参数。
没有对这2个参数进行优化,参数的选择基本上是拍脑袋选的。
2)很简单的TA来决定long还是short,这里有一个参数。这个参数也是没有经过特别的
优化,效果还是相当robust的。TA这部分是很久以前就做完了的,算式out of sample
test了一段时间了。这个部分单独运行的话,在2002年之前本来是小亏的。 Data
mining部分把2002年之前亏钱的变成了持平或者小赚。11年data mining部分基本不改
变TA这部分的效果。
所有trade在close的时候做,不做day trading。
另外解释一下第三张图里的leverage的意思,position = leverage * AUM / price |
S******n 发帖数: 1009 | 2 交易在close时候做,你用的close价格作为买入价吗?
sample
【在 S*********g 的大作中提到】 : 用了2个简单技术 : 1)很简单,很naive的data mining来预测第二天的涨跌。这部分单独运行的话,本身也 : 是赚的,不过曲线没这么smooth。08年那段,和TA组合之后,drawdown小了很多。 这 : 部分需要两个个参数,一个是用来training的时间长度,一个是分cluster时候的参数。 : 没有对这2个参数进行优化,参数的选择基本上是拍脑袋选的。 : 2)很简单的TA来决定long还是short,这里有一个参数。这个参数也是没有经过特别的 : 优化,效果还是相当robust的。TA这部分是很久以前就做完了的,算式out of sample : test了一段时间了。这个部分单独运行的话,在2002年之前本来是小亏的。 Data : mining部分把2002年之前亏钱的变成了持平或者小赚。11年data mining部分基本不改 : 变TA这部分的效果。
|
S*********g 发帖数: 5298 | 3 是的,实际操作会有slippage,但是这个slippage相对于PL来说会是很小的一个值。
【在 S******n 的大作中提到】 : 交易在close时候做,你用的close价格作为买入价吗? : : sample
|
w*******o 发帖数: 6125 | 4 有个疑问,你为什么特意强调了一下"08年那段,用了data mining之后,drawdown小了很多",08年那段很坏,drawdown很大,应该也是事情过去了之后才知道的吧? 你这个会不会像很多Backtest一样,不知不觉就Overfitting了呢?
sample
【在 S*********g 的大作中提到】 : 用了2个简单技术 : 1)很简单,很naive的data mining来预测第二天的涨跌。这部分单独运行的话,本身也 : 是赚的,不过曲线没这么smooth。08年那段,和TA组合之后,drawdown小了很多。 这 : 部分需要两个个参数,一个是用来training的时间长度,一个是分cluster时候的参数。 : 没有对这2个参数进行优化,参数的选择基本上是拍脑袋选的。 : 2)很简单的TA来决定long还是short,这里有一个参数。这个参数也是没有经过特别的 : 优化,效果还是相当robust的。TA这部分是很久以前就做完了的,算式out of sample : test了一段时间了。这个部分单独运行的话,在2002年之前本来是小亏的。 Data : mining部分把2002年之前亏钱的变成了持平或者小赚。11年data mining部分基本不改 : 变TA这部分的效果。
|
S*********g 发帖数: 5298 | 5 是的,任何模型都有curve fitting和over fitting的可能。
我是尽可能去避免优化参数的,在拍脑袋取参数值的时候,也是要事先做些思考。
而不是靠优化去选取的。另外一个,我尽量用最简单的技术,最少的参数来做。
2008年drawdown那部分,我应该是说反了。TA的部分单独运行的话没什么drawdown,
反而是data mining部分单独运行的话drawdown比较大。结合在一起的话,07年底的那
里,TA本来是赚的,现在变成了drawdown,但是drawdown也比data mining的时候要小
很多。
主要的利润是TA部分出来的,datamining部分是过滤了一部分trade。
【在 w*******o 的大作中提到】 : 有个疑问,你为什么特意强调了一下"08年那段,用了data mining之后,drawdown小了很多",08年那段很坏,drawdown很大,应该也是事情过去了之后才知道的吧? 你这个会不会像很多Backtest一样,不知不觉就Overfitting了呢? : : sample
|
r*m 发帖数: 16380 | 6 木有看懂。
SPY涨了2倍多, 你的也涨了2倍多,只是中间没有大跌, 是这样吗? |
S*********g 发帖数: 5298 | 7 1. 这个TA的特点是02年之前基本不好使,这个在业界里是已经知道了的东西。02年之
后挺好使的。
2. 像你说的那样,risk adjusted return高的系统,可以上leverage。
【在 r*m 的大作中提到】 : 木有看懂。 : SPY涨了2倍多, 你的也涨了2倍多,只是中间没有大跌, 是这样吗?
|
L********0 发帖数: 38 | 8 Hi there,
I am learning some data mining right now.
Can I know what kind of data mining technique and software you are using? it
is just some time series analysis or some non-linear regression?
just curious.
THANKS!!
sample
【在 S*********g 的大作中提到】 : 用了2个简单技术 : 1)很简单,很naive的data mining来预测第二天的涨跌。这部分单独运行的话,本身也 : 是赚的,不过曲线没这么smooth。08年那段,和TA组合之后,drawdown小了很多。 这 : 部分需要两个个参数,一个是用来training的时间长度,一个是分cluster时候的参数。 : 没有对这2个参数进行优化,参数的选择基本上是拍脑袋选的。 : 2)很简单的TA来决定long还是short,这里有一个参数。这个参数也是没有经过特别的 : 优化,效果还是相当robust的。TA这部分是很久以前就做完了的,算式out of sample : test了一段时间了。这个部分单独运行的话,在2002年之前本来是小亏的。 Data : mining部分把2002年之前亏钱的变成了持平或者小赚。11年data mining部分基本不改 : 变TA这部分的效果。
|
S*********g 发帖数: 5298 | 9 用了matlab的 kmeans和hmmestimate
it
【在 L********0 的大作中提到】 : Hi there, : I am learning some data mining right now. : Can I know what kind of data mining technique and software you are using? it : is just some time series analysis or some non-linear regression? : just curious. : THANKS!! : : sample
|
L********0 发帖数: 38 | 10 Thanks!!
【在 S*********g 的大作中提到】 : 用了matlab的 kmeans和hmmestimate : : it
|
J*****n 发帖数: 4859 | 11
sample
so, when you apply this method to other index (e.g. Dow, QQQQ), what's the
curve?
【在 S*********g 的大作中提到】 : 用了2个简单技术 : 1)很简单,很naive的data mining来预测第二天的涨跌。这部分单独运行的话,本身也 : 是赚的,不过曲线没这么smooth。08年那段,和TA组合之后,drawdown小了很多。 这 : 部分需要两个个参数,一个是用来training的时间长度,一个是分cluster时候的参数。 : 没有对这2个参数进行优化,参数的选择基本上是拍脑袋选的。 : 2)很简单的TA来决定long还是short,这里有一个参数。这个参数也是没有经过特别的 : 优化,效果还是相当robust的。TA这部分是很久以前就做完了的,算式out of sample : test了一段时间了。这个部分单独运行的话,在2002年之前本来是小亏的。 Data : mining部分把2002年之前亏钱的变成了持平或者小赚。11年data mining部分基本不改 : 变TA这部分的效果。
|
c********r 发帖数: 92 | 12 这个TA是咋做的?用的啥指标?
sample
【在 S*********g 的大作中提到】 : 用了2个简单技术 : 1)很简单,很naive的data mining来预测第二天的涨跌。这部分单独运行的话,本身也 : 是赚的,不过曲线没这么smooth。08年那段,和TA组合之后,drawdown小了很多。 这 : 部分需要两个个参数,一个是用来training的时间长度,一个是分cluster时候的参数。 : 没有对这2个参数进行优化,参数的选择基本上是拍脑袋选的。 : 2)很简单的TA来决定long还是short,这里有一个参数。这个参数也是没有经过特别的 : 优化,效果还是相当robust的。TA这部分是很久以前就做完了的,算式out of sample : test了一段时间了。这个部分单独运行的话,在2002年之前本来是小亏的。 Data : mining部分把2002年之前亏钱的变成了持平或者小赚。11年data mining部分基本不改 : 变TA这部分的效果。
|