G***G 发帖数: 16778 | 1 股票模型预测,我用的是Hidden Markov Model
我用股票的前一个月的数据,
和每天对应的candlestick pattern
总共60个点
来预测明天的结局。
数据来源是yahoo,每天更新。
预测很快,只需要0.01秒. |
s****1 发帖数: 708 | |
G********p 发帖数: 3504 | |
G***G 发帖数: 16778 | 4 对。
markov chain
最大的好处是,这个模型不仅能预测明天的,
它还能预测下一年的每一天的数值。
也就是说你能知道你手上的股票会不会长期贬值或者赢利。
虽然个别天数不准,比如aapl预测为101,但是不影响对中长期的预测。
不影响对趋势的预测。
比如: lake,它就预测的非常准。
【在 s****1 的大作中提到】 : Markov
|
w*******e 发帖数: 91 | 5 what language?
R,weka,matlab,...
【在 G***G 的大作中提到】 : 股票模型预测,我用的是Hidden Markov Model : 我用股票的前一个月的数据, : 和每天对应的candlestick pattern : 总共60个点 : 来预测明天的结局。 : 数据来源是yahoo,每天更新。 : 预测很快,只需要0.01秒.
|
G***G 发帖数: 16778 | 6 R
【在 w*******e 的大作中提到】 : what language? : R,weka,matlab,...
|
P*C 发帖数: 6109 | 7
公司价值是 未来 现金流折现的净现值 而且经济活动变化影响也很大 你就以过去数据
分析是不是太简单了
【在 G***G 的大作中提到】 : 对。 : markov chain : 最大的好处是,这个模型不仅能预测明天的, : 它还能预测下一年的每一天的数值。 : 也就是说你能知道你手上的股票会不会长期贬值或者赢利。 : 虽然个别天数不准,比如aapl预测为101,但是不影响对中长期的预测。 : 不影响对趋势的预测。 : 比如: lake,它就预测的非常准。
|
r*m 发帖数: 16380 | |
s****1 发帖数: 708 | 9 你先用历史数据展示下你的模型的准确率
【在 G***G 的大作中提到】 : R
|
P*C 发帖数: 6109 | 10
刚想说这句就被你抢了词
【在 s****1 的大作中提到】 : 你先用历史数据展示下你的模型的准确率
|
|
|
m*********h 发帖数: 5449 | |
G***G 发帖数: 16778 | 12 98%
【在 s****1 的大作中提到】 : 你先用历史数据展示下你的模型的准确率
|
s****1 发帖数: 708 | 13 哈哈
【在 G***G 的大作中提到】 : 98%
|
G***G 发帖数: 16778 | 14 历史数据是我的training set,它的预测率几乎是98%.
很准的。
这也是,你看我给出的预测值,虽然不准,有的101,有的5
但是总是在那个范围内。看上不还是挺像的一个值。
没有把aapl预测成10.1,或者lake预测成20.5
【在 P*C 的大作中提到】 : : 刚想说这句就被你抢了词
|
s****1 发帖数: 708 | |
l*****u 发帖数: 12114 | 16 这么简单的模型这么简单的计算这么高的命中率,督公真是牛中龙凤,得左脑即可安天
下。
【在 G***G 的大作中提到】 : 98%
|
s****1 发帖数: 708 | 17 你试试1990-2010的当training set,预测下后面几年,看看你的准确率。
【在 G***G 的大作中提到】 : 历史数据是我的training set,它的预测率几乎是98%. : 很准的。 : 这也是,你看我给出的预测值,虽然不准,有的101,有的5 : 但是总是在那个范围内。看上不还是挺像的一个值。 : 没有把aapl预测成10.1,或者lake预测成20.5
|
G***G 发帖数: 16778 | 18 这是训练模型。当然预测率高了。
如果训练模型不高的话,怎么去预测未知数据?
【在 l*****u 的大作中提到】 : 这么简单的模型这么简单的计算这么高的命中率,督公真是牛中龙凤,得左脑即可安天 : 下。
|
m*****s 发帖数: 1471 | 19 这,你不会所有你来backtesting的历史数据你都拿来做training set了吧
【在 G***G 的大作中提到】 : 历史数据是我的training set,它的预测率几乎是98%. : 很准的。 : 这也是,你看我给出的预测值,虽然不准,有的101,有的5 : 但是总是在那个范围内。看上不还是挺像的一个值。 : 没有把aapl预测成10.1,或者lake预测成20.5
|
G***G 发帖数: 16778 | 20 这个预测准确性只有57%左右。
我用的2014上半年的数据来预测2014下半年的。
【在 s****1 的大作中提到】 : 你试试1990-2010的当training set,预测下后面几年,看看你的准确率。
|
|
|
G***G 发帖数: 16778 | 21 365天之内
【在 m*****s 的大作中提到】 : 这,你不会所有你来backtesting的历史数据你都拿来做training set了吧
|
m*********h 发帖数: 5449 | 22 你的数据是指什么呢?
【在 G***G 的大作中提到】 : 这个预测准确性只有57%左右。 : 我用的2014上半年的数据来预测2014下半年的。
|
t****y 发帖数: 27 | 23 obviously, you are overfitting your model in training data set... |
s****1 发帖数: 708 | 24 你这个显然不对。一般建模,一部分数据用来建模,一部分用来检测performance.你把
建模用的数据再来预测一遍,当然准确率高了。
【在 G***G 的大作中提到】 : 这是训练模型。当然预测率高了。 : 如果训练模型不高的话,怎么去预测未知数据?
|
G***G 发帖数: 16778 | 25 yahoo上下载的每天的股票数据
【在 m*********h 的大作中提到】 : 你的数据是指什么呢?
|
s****1 发帖数: 708 | 26 差不多就是扔硬币。哈哈
【在 G***G 的大作中提到】 : 这个预测准确性只有57%左右。 : 我用的2014上半年的数据来预测2014下半年的。
|
G***G 发帖数: 16778 | 27 是的。说了这么多,我只是和大家分享一下我的思路。抛砖引玉
希望大家一起来编写更强大的预测模型。
【在 s****1 的大作中提到】 : 差不多就是扔硬币。哈哈
|
t****y 发帖数: 27 | 28 No, if he can consistently have this accuracy, the model is really valuable.
【在 s****1 的大作中提到】 : 差不多就是扔硬币。哈哈
|
m*********h 发帖数: 5449 | 29 是OHLC价格么?
【在 G***G 的大作中提到】 : yahoo上下载的每天的股票数据
|
G***G 发帖数: 16778 | 30 对。你还要编程算出candlestick pattern
光OHLC, 预测意义不大。
【在 m*********h 的大作中提到】 : 是OHLC价格么?
|
|
|
t****y 发帖数: 27 | 31 You model is too simple. Many things you need to consider in order to create
something useful, eg. data preprocessing like prevent data snopping/ data
bias etc. cross validation/ forward validation, ...
【在 G***G 的大作中提到】 : 是的。说了这么多,我只是和大家分享一下我的思路。抛砖引玉 : 希望大家一起来编写更强大的预测模型。
|
q********g 发帖数: 10694 | 32 我觉得吧,这个事儿要鼓励。只要人给你说方法,能讨论的,都应该鼓励。那些只给你
说个没头没脑的结果的,都应该谨慎。 |
t****y 发帖数: 27 | 33 After you come up with some workable models, trading execution strategy is
another big challenge.
create
【在 t****y 的大作中提到】 : You model is too simple. Many things you need to consider in order to create : something useful, eg. data preprocessing like prevent data snopping/ data : bias etc. cross validation/ forward validation, ...
|
f*******e 发帖数: 5277 | |
s****1 发帖数: 708 | 35 用time series预测股票,看着fancy,用处不大。被简单的传统TA轻松扁死。 |
P*C 发帖数: 6109 | 36
我说的意思是 比如 你用2013年12月31号以及之前的数据 预测2014年的数据然后和14
年的对比
【在 G***G 的大作中提到】 : 历史数据是我的training set,它的预测率几乎是98%. : 很准的。 : 这也是,你看我给出的预测值,虽然不准,有的101,有的5 : 但是总是在那个范围内。看上不还是挺像的一个值。 : 没有把aapl预测成10.1,或者lake预测成20.5
|
w**k 发帖数: 6722 | 37 I can assure you lz is serious, 100% serious.
【在 f*******e 的大作中提到】 : 楼主就是来灌水的大家很认真了……
|
e**********m 发帖数: 1960 | 38 学傻了吧,要是有这个准确率什么citadel deshaw rentech还不得求着你去帮他们做mo
del?
【在 G***G 的大作中提到】 : 股票模型预测,我用的是Hidden Markov Model : 我用股票的前一个月的数据, : 和每天对应的candlestick pattern : 总共60个点 : 来预测明天的结局。 : 数据来源是yahoo,每天更新。 : 预测很快,只需要0.01秒.
|
G***G 发帖数: 16778 | 39 有道理。
我正在做的就是用candlestick pattern预测每下一个5分钟的升降。
这个预测模型,其实是从宏观的角度,预测一下第二天的股市的基点。
我的模型没有加入dow jones指数,sp指数等。
这些指数的加入,对某些股票几乎是如虎添翼。
我期待我的模型能达到并维持60%的准确性.
【在 s****1 的大作中提到】 : 用time series预测股票,看着fancy,用处不大。被简单的传统TA轻松扁死。
|
t*******l 发帖数: 3662 | 40 你开玩笑吧,如果就是简单的把一个HMM甩到哪里,就指望能预测明天的股票?
我都敢和你打赌,我这不会TA的看看盘前的大盘和个股,都能轻轻松松beat你模型预测
的当天的结果,信不信
这就好比指望用Hidden Markov Model能预测今天的天气一样没谱。仅仅通过历史数据
,我敢肯定准确率一定不如我睡前看看月亮,预测明天气来的准。
HMM唯一(有点绝对了)的成功的应用就是语音识别,这是因为人的发音的hidden
states是存在的,大部分的问题不具有这样的underpinning theory, 有可能是问题复
杂HMM根本model不了,有可能是是很多重要的hidden state观察不了,也有可能是
model对数据overfitting你没办法知道。
【在 G***G 的大作中提到】 : 股票模型预测,我用的是Hidden Markov Model : 我用股票的前一个月的数据, : 和每天对应的candlestick pattern : 总共60个点 : 来预测明天的结局。 : 数据来源是yahoo,每天更新。 : 预测很快,只需要0.01秒.
|
|
|
G***G 发帖数: 16778 | 41 目前算法的预测准确性不高。
目前正在研制的改进版将采用大量TA的信息,以代替历史数据。
同时,增加人机交互。图形可视化等。
希望有志者一起切磋。
我只是抛砖引玉。
【在 t*******l 的大作中提到】 : 你开玩笑吧,如果就是简单的把一个HMM甩到哪里,就指望能预测明天的股票? : 我都敢和你打赌,我这不会TA的看看盘前的大盘和个股,都能轻轻松松beat你模型预测 : 的当天的结果,信不信 : 这就好比指望用Hidden Markov Model能预测今天的天气一样没谱。仅仅通过历史数据 : ,我敢肯定准确率一定不如我睡前看看月亮,预测明天气来的准。 : HMM唯一(有点绝对了)的成功的应用就是语音识别,这是因为人的发音的hidden : states是存在的,大部分的问题不具有这样的underpinning theory, 有可能是问题复 : 杂HMM根本model不了,有可能是是很多重要的hidden state观察不了,也有可能是 : model对数据overfitting你没办法知道。
|
h******b 发帖数: 6055 | 42 楼主提前贴一下结果不就知道了。
下面十天楼主猜中八天估计这里就有人拿钱出来给楼主炒了。 |
t*******l 发帖数: 3662 | 43 不太了解这方面的研究。许多年年前听说大家用神经网络和遗传算法搞预测,这个说不
准比
你用HMM更靠谱
【在 G***G 的大作中提到】 : 目前算法的预测准确性不高。 : 目前正在研制的改进版将采用大量TA的信息,以代替历史数据。 : 同时,增加人机交互。图形可视化等。 : 希望有志者一起切磋。 : 我只是抛砖引玉。
|
w**k 发帖数: 6722 | 44 点评相当到位。我只想到了股票也许是没有hidden states的。
【在 t*******l 的大作中提到】 : 你开玩笑吧,如果就是简单的把一个HMM甩到哪里,就指望能预测明天的股票? : 我都敢和你打赌,我这不会TA的看看盘前的大盘和个股,都能轻轻松松beat你模型预测 : 的当天的结果,信不信 : 这就好比指望用Hidden Markov Model能预测今天的天气一样没谱。仅仅通过历史数据 : ,我敢肯定准确率一定不如我睡前看看月亮,预测明天气来的准。 : HMM唯一(有点绝对了)的成功的应用就是语音识别,这是因为人的发音的hidden : states是存在的,大部分的问题不具有这样的underpinning theory, 有可能是问题复 : 杂HMM根本model不了,有可能是是很多重要的hidden state观察不了,也有可能是 : model对数据overfitting你没办法知道。
|
w**k 发帖数: 6722 | 45 肯定不是,楼主应该不是这个专业
【在 s****1 的大作中提到】 : 这是你的论文吗? https://www.cs.sfu.ca/~anoop/students/rzhang/rzhang_msc_ : thesis.pdf
|
w**k 发帖数: 6722 | 46 对,讨论方法至少要比(装作雷锋来)推销软件要好
【在 q********g 的大作中提到】 : 我觉得吧,这个事儿要鼓励。只要人给你说方法,能讨论的,都应该鼓励。那些只给你 : 说个没头没脑的结果的,都应该谨慎。
|
w********2 发帖数: 16371 | |
k**l 发帖数: 2966 | 48 同学,有兴趣用你的模型试试外汇, 如果能有一定准确率的话可跟我联系
我们给你提供backtest data, live 技术支持,如果测试有效可以给你提供capital
你不用公开你的模型,黑箱操作--只提供交易信号,利润按比例提成
【在 G***G 的大作中提到】 : 股票模型预测,我用的是Hidden Markov Model : 我用股票的前一个月的数据, : 和每天对应的candlestick pattern : 总共60个点 : 来预测明天的结局。 : 数据来源是yahoo,每天更新。 : 预测很快,只需要0.01秒.
|
m*****y 发帖数: 29 | 49 用股票的过去来预测未来的走势从理论上就是行不通的,太多影响因子很多并不在包含
在历史中,比如突发事件,财报和大盘或者其他市场走势等等
【在 G***G 的大作中提到】 : 股票模型预测,我用的是Hidden Markov Model : 我用股票的前一个月的数据, : 和每天对应的candlestick pattern : 总共60个点 : 来预测明天的结局。 : 数据来源是yahoo,每天更新。 : 预测很快,只需要0.01秒.
|
s********y 发帖数: 831 | 50 这位同学,看了你的帖子,我意识到你在浪费生命。 我不是指你炒股,我是指你读书
做research.
【在 G***G 的大作中提到】 : 目前算法的预测准确性不高。 : 目前正在研制的改进版将采用大量TA的信息,以代替历史数据。 : 同时,增加人机交互。图形可视化等。 : 希望有志者一起切磋。 : 我只是抛砖引玉。
|
|
|
i********y 发帖数: 346 | 51 曾经有实证研究表明股票历史上的return数据预测未来的return很不靠谱,但是用历史
return的volatility来预测未来的return的volatility是靠谱的。
通俗的讲,就是一个股票曾经暴涨很牛,未来是不是很牛很难说,说不定公司运营出现
问题就开始翻转了。但是一个股票历史上一直很volatile,未来往往也是很volatile的
。这个结论确实有一定道理。
【在 G***G 的大作中提到】 : 股票模型预测,我用的是Hidden Markov Model : 我用股票的前一个月的数据, : 和每天对应的candlestick pattern : 总共60个点 : 来预测明天的结局。 : 数据来源是yahoo,每天更新。 : 预测很快,只需要0.01秒.
|
c*******y 发帖数: 1630 | |
s***v 发帖数: 4924 | 53 我觉得有些网友说的对,楼主backtesting的方法不对。
我建议楼主用1994-2004年的数据建模型,然后用2005-2014年的历史数据来做测试。
这样建议是因为历史数据的时间够长,包括完整的经济周期,比如94-04年包括it泡沫
,05-14包括金融危机,这样才能对比你的模型是否真正有效。 |
o*****h 发帖数: 293 | 54 楼主是搞bioinformatics的
【在 w**k 的大作中提到】 : 肯定不是,楼主应该不是这个专业
|
p*********r 发帖数: 7944 | 55 Even with lipsticks, it's still a prediction method. |
G**********N 发帖数: 63 | 56 理论可行, 但有条件: 成交量大, 用大盘和个股对照。
【在 G***G 的大作中提到】 : 股票模型预测,我用的是Hidden Markov Model : 我用股票的前一个月的数据, : 和每天对应的candlestick pattern : 总共60个点 : 来预测明天的结局。 : 数据来源是yahoo,每天更新。 : 预测很快,只需要0.01秒.
|
e**y 发帖数: 784 | 57 模型太简单了
至少要用Conditional Random Field...
【在 G***G 的大作中提到】 : 股票模型预测,我用的是Hidden Markov Model : 我用股票的前一个月的数据, : 和每天对应的candlestick pattern : 总共60个点 : 来预测明天的结局。 : 数据来源是yahoo,每天更新。 : 预测很快,只需要0.01秒.
|
d******e 发帖数: 2265 | 58 机器学习或者曲线拟合做股票理论上就是不对的。
特别是做预测。
别切了,要切就都切进去了。
【在 G***G 的大作中提到】 : 目前算法的预测准确性不高。 : 目前正在研制的改进版将采用大量TA的信息,以代替历史数据。 : 同时,增加人机交互。图形可视化等。 : 希望有志者一起切磋。 : 我只是抛砖引玉。
|
O*********2 发帖数: 31 | 59 确实
【在 i********y 的大作中提到】 : 曾经有实证研究表明股票历史上的return数据预测未来的return很不靠谱,但是用历史 : return的volatility来预测未来的return的volatility是靠谱的。 : 通俗的讲,就是一个股票曾经暴涨很牛,未来是不是很牛很难说,说不定公司运营出现 : 问题就开始翻转了。但是一个股票历史上一直很volatile,未来往往也是很volatile的 : 。这个结论确实有一定道理。
|
G***G 发帖数: 16778 | 60 是不准。那大家的大脑都是怎么决定在什么时候买多少什么股票的呢?
【在 d******e 的大作中提到】 : 机器学习或者曲线拟合做股票理论上就是不对的。 : 特别是做预测。 : 别切了,要切就都切进去了。
|
|
|
G***G 发帖数: 16778 | 61 我编写这个模型,就是想测试一下,看看到底有多少预测精度。
另外,我还测试了不同股票之间的相关性。
股票A涨,那么股票B也涨,并且股票C要跌。
同时我正在测试的还有,
premarket和after hour的价格对当天开盘价格的影响和结束价格的影响。
【在 O*********2 的大作中提到】 : 确实
|
i********y 发帖数: 346 | 62 其实就模型本身有效性而言,只要用的指标大方向上没错,各指标关系之间能自圆其说
,这个模型就一定能在一定时间跨度内一定条件下有效。比如用94-04年的数据去设计
模型,然后用04-14年的数据去监测模型,理论上讲,总可以通过calibrate参数使该模
型能在这两段时间内都比较有效,而这里难点就是是否在下个10年或者5年依然有效还
是一年以后就需要recalibrate参数了。另一个难点是虽然模型有效时可以估计利润,
但一旦模型失效时候损失多大很难估计,往往是损失不大的时候会以为模型依然有效,
而意识到模型失效需要recalibration的时候损失已经很大甚至不可挽回了。
【在 G***G 的大作中提到】 : 股票模型预测,我用的是Hidden Markov Model : 我用股票的前一个月的数据, : 和每天对应的candlestick pattern : 总共60个点 : 来预测明天的结局。 : 数据来源是yahoo,每天更新。 : 预测很快,只需要0.01秒.
|
l*****u 发帖数: 12114 | 63 不管是学校的课程还是个人的爱好,基本上都是野鸡未入门。真的感兴趣就老老实实去
街上找个相关工作,按规定踏踏实实做几年,一般人就没有然后了。。。
【在 G***G 的大作中提到】 : 我编写这个模型,就是想测试一下,看看到底有多少预测精度。 : 另外,我还测试了不同股票之间的相关性。 : 股票A涨,那么股票B也涨,并且股票C要跌。 : 同时我正在测试的还有, : premarket和after hour的价格对当天开盘价格的影响和结束价格的影响。
|
i********y 发帖数: 346 | 64 我记得曾有实证研究显示用历史数据来预测股票间的相关性是可行的。投资组合的
variance covariance matrix一般都是通过历史数据得到的
【在 G***G 的大作中提到】 : 我编写这个模型,就是想测试一下,看看到底有多少预测精度。 : 另外,我还测试了不同股票之间的相关性。 : 股票A涨,那么股票B也涨,并且股票C要跌。 : 同时我正在测试的还有, : premarket和after hour的价格对当天开盘价格的影响和结束价格的影响。
|
W***n 发帖数: 11530 | 65 TA is just little bit better than fortune-telling, imo |
d*****g 发帖数: 978 | 66 预测是基于了解基本发生原理的基础上的,一般可以预测自然现象,预测生老病死,谁
能预测你要去干什么,想什么,直接看看操盘手怎么干的可能更直接吧? |
o**o 发帖数: 3964 | 67 模型能够fit历史数据是件很神奇的事,以至于人们以为可以用来预测。事实上,
fitting可以把任意数据映射成你要的结果。。。 |
W***n 发帖数: 11530 | 68 Any models may seem to work some time, but fail miserably in other times
why not throw a dice
hahaha |