简单说说我的模型预测方法，供大家改进 - Stock版

本页内容为未名空间相应帖子的节选和存档，一周内的贴子最多显示50字，超过一周显示500字访问原贴

Stock版 - 简单说说我的模型预测方法，供大家改进

相关主题
● 为啥back test 很牛的algorithm/strategy, going forward 就不咋地了?	● 给大家推荐一个简单的获得股票daily数据的方法，适合懒人，基本不用那个写代码
● share a cheat sheet	● 用MT4的复盘下单功能, 来对股票/外汇的历史行情做模拟操作
● 最近想做个炒股辅助决策系统，请大家帮我捋一捋思路	● 【股市2011】一个傻傻的预测程序
● 大家现在从哪import股票价格？	● 炒股不能贪心吗？
● 贴一个业余时间做的练习	● 交易策略back-test
● 公司一直想开发出能预测股市的软件	● 与时间赛跑，寻找合伙人。
● 我的C2系统上线一个多月了，欢迎大家跟踪，交流。	● 老蛇模型今年已经亏5%了
● 研究option首先要做的事情	● stock market 或 stock price 模型？

相关话题的讨论汇总
话题: 预测话题: 模型话题: 股票话题: 数据话题: model

进入Stock版参与讨论

(共1页)

G***G
发帖数: 16778

股票模型预测，我用的是Hidden Markov Model
我用股票的前一个月的数据，
和每天对应的candlestick pattern
总共60个点
来预测明天的结局。
数据来源是yahoo，每天更新。
预测很快，只需要0.01秒.

s****1
发帖数: 708

Markov

G********p
发帖数: 3504

upload来看看能不能改进。。

G***G
发帖数: 16778

对。
markov chain
最大的好处是，这个模型不仅能预测明天的，
它还能预测下一年的每一天的数值。
也就是说你能知道你手上的股票会不会长期贬值或者赢利。
虽然个别天数不准，比如aapl预测为101，但是不影响对中长期的预测。
不影响对趋势的预测。
比如： lake，它就预测的非常准。

【在 s****1 的大作中提到】

: Markov

w*******e
发帖数: 91

what language?
R,weka,matlab,...

【在 G***G 的大作中提到】

: 股票模型预测，我用的是Hidden Markov Model
: 我用股票的前一个月的数据，
: 和每天对应的candlestick pattern
: 总共60个点
: 来预测明天的结局。
: 数据来源是yahoo，每天更新。
: 预测很快，只需要0.01秒.

G***G
发帖数: 16778

R

【在 w*******e 的大作中提到】

: what language?
: R,weka,matlab,...

P*C
发帖数: 6109

公司价值是未来现金流折现的净现值而且经济活动变化影响也很大你就以过去数据
分析是不是太简单了

【在 G***G 的大作中提到】

: 对。
: markov chain
: 最大的好处是，这个模型不仅能预测明天的，
: 它还能预测下一年的每一天的数值。
: 也就是说你能知道你手上的股票会不会长期贬值或者赢利。
: 虽然个别天数不准，比如aapl预测为101，但是不影响对中长期的预测。
: 不影响对趋势的预测。
: 比如： lake，它就预测的非常准。

r*m
发帖数: 16380

这样也行！！！

s****1
发帖数: 708

你先用历史数据展示下你的模型的准确率

【在 G***G 的大作中提到】

: R

P*C
发帖数: 6109

刚想说这句就被你抢了词

【在 s****1 的大作中提到】

: 你先用历史数据展示下你的模型的准确率

相关主题
● 公司一直想开发出能预测股市的软件	● 给大家推荐一个简单的获得股票daily数据的方法，适合懒人，基本不用那个写代码
● 我的C2系统上线一个多月了，欢迎大家跟踪，交流。	● 用MT4的复盘下单功能, 来对股票/外汇的历史行情做模拟操作
● 研究option首先要做的事情	● 【股市2011】一个傻傻的预测程序
进入Stock版参与讨论

m*********h
发帖数: 5449

分析工具虽然重要，但更重要的是输入参数。

G***G
发帖数: 16778

98%

【在 s****1 的大作中提到】

: 你先用历史数据展示下你的模型的准确率

s****1
发帖数: 708

哈哈

【在 G***G 的大作中提到】

: 98%

G***G
发帖数: 16778

历史数据是我的training set，它的预测率几乎是98%.
很准的。
这也是，你看我给出的预测值，虽然不准，有的101，有的5
但是总是在那个范围内。看上不还是挺像的一个值。
没有把aapl预测成10.1，或者lake预测成20.5

【在 P*C 的大作中提到】

:
: 刚想说这句就被你抢了词

s****1
发帖数: 708

这是你的论文吗？ https://www.cs.sfu.ca/~anoop/students/rzhang/rzhang_msc_
thesis.pdf

l*****u
发帖数: 12114

这么简单的模型这么简单的计算这么高的命中率，督公真是牛中龙凤，得左脑即可安天
下。

【在 G***G 的大作中提到】

: 98%

s****1
发帖数: 708

你试试1990-2010的当training set,预测下后面几年，看看你的准确率。

【在 G***G 的大作中提到】

: 历史数据是我的training set，它的预测率几乎是98%.
: 很准的。
: 这也是，你看我给出的预测值，虽然不准，有的101，有的5
: 但是总是在那个范围内。看上不还是挺像的一个值。
: 没有把aapl预测成10.1，或者lake预测成20.5

G***G
发帖数: 16778

这是训练模型。当然预测率高了。
如果训练模型不高的话，怎么去预测未知数据？

【在 l*****u 的大作中提到】

: 这么简单的模型这么简单的计算这么高的命中率，督公真是牛中龙凤，得左脑即可安天
: 下。

m*****s
发帖数: 1471

这，你不会所有你来backtesting的历史数据你都拿来做training set了吧

【在 G***G 的大作中提到】

G***G
发帖数: 16778

这个预测准确性只有57%左右。
我用的2014上半年的数据来预测2014下半年的。

【在 s****1 的大作中提到】

: 你试试1990-2010的当training set,预测下后面几年，看看你的准确率。

相关主题
● 炒股不能贪心吗？	● 老蛇模型今年已经亏5%了
● 交易策略back-test	● stock market 或 stock price 模型？
● 与时间赛跑，寻找合伙人。	● dis小piaji了一下
进入Stock版参与讨论

G***G
发帖数: 16778

365天之内

【在 m*****s 的大作中提到】

: 这，你不会所有你来backtesting的历史数据你都拿来做training set了吧

m*********h
发帖数: 5449

你的数据是指什么呢？

【在 G***G 的大作中提到】

: 这个预测准确性只有57%左右。
: 我用的2014上半年的数据来预测2014下半年的。

t****y
发帖数: 27

obviously, you are overfitting your model in training data set...

s****1
发帖数: 708

你这个显然不对。一般建模，一部分数据用来建模，一部分用来检测performance.你把
建模用的数据再来预测一遍，当然准确率高了。

【在 G***G 的大作中提到】

: 这是训练模型。当然预测率高了。
: 如果训练模型不高的话，怎么去预测未知数据？

G***G
发帖数: 16778

yahoo上下载的每天的股票数据

【在 m*********h 的大作中提到】

: 你的数据是指什么呢？

s****1
发帖数: 708

差不多就是扔硬币。哈哈

【在 G***G 的大作中提到】

: 这个预测准确性只有57%左右。
: 我用的2014上半年的数据来预测2014下半年的。

G***G
发帖数: 16778

是的。说了这么多，我只是和大家分享一下我的思路。抛砖引玉
希望大家一起来编写更强大的预测模型。

【在 s****1 的大作中提到】

: 差不多就是扔硬币。哈哈

t****y
发帖数: 27

No, if he can consistently have this accuracy, the model is really valuable.

【在 s****1 的大作中提到】

: 差不多就是扔硬币。哈哈

m*********h
发帖数: 5449

是OHLC价格么？

【在 G***G 的大作中提到】

: yahoo上下载的每天的股票数据

G***G
发帖数: 16778

对。你还要编程算出candlestick pattern
光OHLC, 预测意义不大。

【在 m*********h 的大作中提到】

: 是OHLC价格么？

相关主题
● 知道了昨天，就会预测明天。请lovefreedom大牛预测下周一的走势。	● share a cheat sheet
● 交易和TA的关系	● 最近想做个炒股辅助决策系统，请大家帮我捋一捋思路
● 为啥back test 很牛的algorithm/strategy, going forward 就不咋地了?	● 大家现在从哪import股票价格？
进入Stock版参与讨论

t****y
发帖数: 27

You model is too simple. Many things you need to consider in order to create
something useful, eg. data preprocessing like prevent data snopping/ data
bias etc. cross validation/ forward validation, ...

【在 G***G 的大作中提到】

: 是的。说了这么多，我只是和大家分享一下我的思路。抛砖引玉
: 希望大家一起来编写更强大的预测模型。

q********g
发帖数: 10694

我觉得吧，这个事儿要鼓励。只要人给你说方法，能讨论的，都应该鼓励。那些只给你
说个没头没脑的结果的，都应该谨慎。

t****y
发帖数: 27

After you come up with some workable models, trading execution strategy is
another big challenge.

create

【在 t****y 的大作中提到】

: You model is too simple. Many things you need to consider in order to create
: something useful, eg. data preprocessing like prevent data snopping/ data
: bias etc. cross validation/ forward validation, ...

f*******e
发帖数: 5277

楼主就是来灌水的大家很认真了……

s****1
发帖数: 708

用time series预测股票，看着fancy,用处不大。被简单的传统TA轻松扁死。

P*C
发帖数: 6109

我说的意思是比如你用2013年12月31号以及之前的数据预测2014年的数据然后和14
年的对比

【在 G***G 的大作中提到】

w**k
发帖数: 6722

I can assure you lz is serious, 100% serious.

【在 f*******e 的大作中提到】

: 楼主就是来灌水的大家很认真了……

e**********m
发帖数: 1960

学傻了吧，要是有这个准确率什么citadel deshaw rentech还不得求着你去帮他们做mo
del？

【在 G***G 的大作中提到】

G***G
发帖数: 16778

有道理。
我正在做的就是用candlestick pattern预测每下一个5分钟的升降。
这个预测模型，其实是从宏观的角度，预测一下第二天的股市的基点。
我的模型没有加入dow jones指数，sp指数等。
这些指数的加入，对某些股票几乎是如虎添翼。
我期待我的模型能达到并维持60%的准确性.

【在 s****1 的大作中提到】

: 用time series预测股票，看着fancy,用处不大。被简单的传统TA轻松扁死。

t*******l
发帖数: 3662

你开玩笑吧，如果就是简单的把一个HMM甩到哪里，就指望能预测明天的股票？
我都敢和你打赌，我这不会TA的看看盘前的大盘和个股，都能轻轻松松beat你模型预测
的当天的结果，信不信
这就好比指望用Hidden Markov Model能预测今天的天气一样没谱。仅仅通过历史数据
，我敢肯定准确率一定不如我睡前看看月亮，预测明天气来的准。
HMM唯一（有点绝对了）的成功的应用就是语音识别，这是因为人的发音的hidden
states是存在的，大部分的问题不具有这样的underpinning theory，有可能是问题复
杂HMM根本model不了，有可能是是很多重要的hidden state观察不了，也有可能是
model对数据overfitting你没办法知道。

【在 G***G 的大作中提到】

相关主题
● 大家现在从哪import股票价格？	● 我的C2系统上线一个多月了，欢迎大家跟踪，交流。
● 贴一个业余时间做的练习	● 研究option首先要做的事情
● 公司一直想开发出能预测股市的软件	● 给大家推荐一个简单的获得股票daily数据的方法，适合懒人，基本不用那个写代码
进入Stock版参与讨论

G***G
发帖数: 16778

目前算法的预测准确性不高。
目前正在研制的改进版将采用大量TA的信息，以代替历史数据。
同时，增加人机交互。图形可视化等。
希望有志者一起切磋。
我只是抛砖引玉。

【在 t*******l 的大作中提到】

: 你开玩笑吧，如果就是简单的把一个HMM甩到哪里，就指望能预测明天的股票？
: 我都敢和你打赌，我这不会TA的看看盘前的大盘和个股，都能轻轻松松beat你模型预测
: 的当天的结果，信不信
: 这就好比指望用Hidden Markov Model能预测今天的天气一样没谱。仅仅通过历史数据
: ，我敢肯定准确率一定不如我睡前看看月亮，预测明天气来的准。
: HMM唯一（有点绝对了）的成功的应用就是语音识别，这是因为人的发音的hidden
: states是存在的，大部分的问题不具有这样的underpinning theory，有可能是问题复
: 杂HMM根本model不了，有可能是是很多重要的hidden state观察不了，也有可能是
: model对数据overfitting你没办法知道。

h******b
发帖数: 6055

楼主提前贴一下结果不就知道了。
下面十天楼主猜中八天估计这里就有人拿钱出来给楼主炒了。

t*******l
发帖数: 3662

不太了解这方面的研究。许多年年前听说大家用神经网络和遗传算法搞预测，这个说不
准比
你用HMM更靠谱

【在 G***G 的大作中提到】

: 目前算法的预测准确性不高。
: 目前正在研制的改进版将采用大量TA的信息，以代替历史数据。
: 同时，增加人机交互。图形可视化等。
: 希望有志者一起切磋。
: 我只是抛砖引玉。

w**k
发帖数: 6722

点评相当到位。我只想到了股票也许是没有hidden states的。

【在 t*******l 的大作中提到】

w**k
发帖数: 6722

肯定不是，楼主应该不是这个专业

【在 s****1 的大作中提到】

: 这是你的论文吗？ https://www.cs.sfu.ca/~anoop/students/rzhang/rzhang_msc_
: thesis.pdf

w**k
发帖数: 6722

对，讨论方法至少要比（装作雷锋来）推销软件要好

【在 q********g 的大作中提到】

: 我觉得吧，这个事儿要鼓励。只要人给你说方法，能讨论的，都应该鼓励。那些只给你
: 说个没头没脑的结果的，都应该谨慎。

w********2
发帖数: 16371

太牛了，老马肯定会爱上你的。

k**l
发帖数: 2966

同学，有兴趣用你的模型试试外汇, 如果能有一定准确率的话可跟我联系
我们给你提供backtest data, live 技术支持，如果测试有效可以给你提供capital
你不用公开你的模型，黑箱操作--只提供交易信号，利润按比例提成

【在 G***G 的大作中提到】

m*****y
发帖数: 29

用股票的过去来预测未来的走势从理论上就是行不通的，太多影响因子很多并不在包含
在历史中，比如突发事件，财报和大盘或者其他市场走势等等

【在 G***G 的大作中提到】

s********y
发帖数: 831

这位同学，看了你的帖子，我意识到你在浪费生命。我不是指你炒股，我是指你读书
做research.

【在 G***G 的大作中提到】

相关主题
● 用MT4的复盘下单功能, 来对股票/外汇的历史行情做模拟操作	● 交易策略back-test
● 【股市2011】一个傻傻的预测程序	● 与时间赛跑，寻找合伙人。
● 炒股不能贪心吗？	● 老蛇模型今年已经亏5%了
进入Stock版参与讨论

i********y
发帖数: 346

曾经有实证研究表明股票历史上的return数据预测未来的return很不靠谱，但是用历史
return的volatility来预测未来的return的volatility是靠谱的。
通俗的讲，就是一个股票曾经暴涨很牛，未来是不是很牛很难说，说不定公司运营出现
问题就开始翻转了。但是一个股票历史上一直很volatile，未来往往也是很volatile的
。这个结论确实有一定道理。

【在 G***G 的大作中提到】

c*******y
发帖数: 1630

HMM能有个55%的准确率，算不错的了。

s***v
发帖数: 4924

我觉得有些网友说的对，楼主backtesting的方法不对。
我建议楼主用1994-2004年的数据建模型，然后用2005-2014年的历史数据来做测试。
这样建议是因为历史数据的时间够长，包括完整的经济周期，比如94-04年包括it泡沫
，05-14包括金融危机，这样才能对比你的模型是否真正有效。

o*****h
发帖数: 293

楼主是搞bioinformatics的

【在 w**k 的大作中提到】

: 肯定不是，楼主应该不是这个专业

p*********r
发帖数: 7944

Even with lipsticks, it's still a prediction method.

G**********N
发帖数: 63

理论可行，但有条件：成交量大，用大盘和个股对照。

【在 G***G 的大作中提到】

e**y
发帖数: 784

模型太简单了
至少要用Conditional Random Field...

【在 G***G 的大作中提到】

d******e
发帖数: 2265

机器学习或者曲线拟合做股票理论上就是不对的。
特别是做预测。
别切了，要切就都切进去了。

【在 G***G 的大作中提到】

O*********2
发帖数: 31

确实

【在 i********y 的大作中提到】

: 曾经有实证研究表明股票历史上的return数据预测未来的return很不靠谱，但是用历史
: return的volatility来预测未来的return的volatility是靠谱的。
: 通俗的讲，就是一个股票曾经暴涨很牛，未来是不是很牛很难说，说不定公司运营出现
: 问题就开始翻转了。但是一个股票历史上一直很volatile，未来往往也是很volatile的
: 。这个结论确实有一定道理。

G***G
发帖数: 16778

是不准。那大家的大脑都是怎么决定在什么时候买多少什么股票的呢？

【在 d******e 的大作中提到】

: 机器学习或者曲线拟合做股票理论上就是不对的。
: 特别是做预测。
: 别切了，要切就都切进去了。

相关主题
● stock market 或 stock price 模型？	● 交易和TA的关系
● dis小piaji了一下	● 为啥back test 很牛的algorithm/strategy, going forward 就不咋地了?
● 知道了昨天，就会预测明天。请lovefreedom大牛预测下周一的走势。	● share a cheat sheet
进入Stock版参与讨论

G***G
发帖数: 16778

我编写这个模型，就是想测试一下，看看到底有多少预测精度。
另外，我还测试了不同股票之间的相关性。
股票A涨，那么股票B也涨，并且股票C要跌。
同时我正在测试的还有，
premarket和after hour的价格对当天开盘价格的影响和结束价格的影响。

【在 O*********2 的大作中提到】

: 确实

i********y
发帖数: 346

其实就模型本身有效性而言，只要用的指标大方向上没错，各指标关系之间能自圆其说
，这个模型就一定能在一定时间跨度内一定条件下有效。比如用94-04年的数据去设计
模型，然后用04-14年的数据去监测模型，理论上讲，总可以通过calibrate参数使该模
型能在这两段时间内都比较有效，而这里难点就是是否在下个10年或者5年依然有效还
是一年以后就需要recalibrate参数了。另一个难点是虽然模型有效时可以估计利润，
但一旦模型失效时候损失多大很难估计，往往是损失不大的时候会以为模型依然有效，
而意识到模型失效需要recalibration的时候损失已经很大甚至不可挽回了。

【在 G***G 的大作中提到】

l*****u
发帖数: 12114

不管是学校的课程还是个人的爱好，基本上都是野鸡未入门。真的感兴趣就老老实实去
街上找个相关工作，按规定踏踏实实做几年，一般人就没有然后了。。。

【在 G***G 的大作中提到】

: 我编写这个模型，就是想测试一下，看看到底有多少预测精度。
: 另外，我还测试了不同股票之间的相关性。
: 股票A涨，那么股票B也涨，并且股票C要跌。
: 同时我正在测试的还有，
: premarket和after hour的价格对当天开盘价格的影响和结束价格的影响。

i********y
发帖数: 346

我记得曾有实证研究显示用历史数据来预测股票间的相关性是可行的。投资组合的
variance covariance matrix一般都是通过历史数据得到的

【在 G***G 的大作中提到】

W***n
发帖数: 11530

TA is just little bit better than fortune-telling, imo

d*****g
发帖数: 978

预测是基于了解基本发生原理的基础上的，一般可以预测自然现象，预测生老病死，谁
能预测你要去干什么，想什么，直接看看操盘手怎么干的可能更直接吧？

o**o
发帖数: 3964

模型能够fit历史数据是件很神奇的事，以至于人们以为可以用来预测。事实上，
fitting可以把任意数据映射成你要的结果。。。

W***n
发帖数: 11530

Any models may seem to work some time, but fail miserably in other times
why not throw a dice
hahaha

(共1页)

进入Stock版参与讨论

相关主题
● stock market 或 stock price 模型？	● 贴一个业余时间做的练习
● dis小piaji了一下	● 公司一直想开发出能预测股市的软件
● 知道了昨天，就会预测明天。请lovefreedom大牛预测下周一的走势。	● 我的C2系统上线一个多月了，欢迎大家跟踪，交流。
● 交易和TA的关系	● 研究option首先要做的事情
● 为啥back test 很牛的algorithm/strategy, going forward 就不咋地了?	● 给大家推荐一个简单的获得股票daily数据的方法，适合懒人，基本不用那个写代码
● share a cheat sheet	● 用MT4的复盘下单功能, 来对股票/外汇的历史行情做模拟操作
● 最近想做个炒股辅助决策系统，请大家帮我捋一捋思路	● 【股市2011】一个傻傻的预测程序
● 大家现在从哪import股票价格？	● 炒股不能贪心吗？

相关话题的讨论汇总
话题: 预测话题: 模型话题: 股票话题: 数据话题: model

#	版面	帖数(主题数)
-	全站	4871 (796)
1	Military	3777 (569)
2	Stock	341 (51)
3	Joke	117 (17)
4	History	116 (3)
5	Automobile	100 (9)
6	USANews	55 (9)
7	Midlife	45 (1)
8	Headline	41 (41)
9	Dreamer	33 (13)
10	FleaMarket	32 (20)
11	Living	30 (7)

boards

未名新帖统计// 7月16日

历史上的今天