由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
DataSciences版 - 我想建立一个自动选股票系统
相关主题
text mining中的relation extraction公司招DATA SCIENTIST
用R做review 的summary请推荐一个NLP的data set (转载)
假如想实现 entity recognition, relation extraction这些功能的话,除了GATE, 还有 哪些其它的open source library。说说最近的一次面试,兼告诫国人
大家都什么背景,这里有点像转行版了求职求内推
聚类问题请教data scientist job openings at Workday
用普通工作站搭一个卷积神经网能达到什么样的规模,够干点什么data scientist position
DS需要会的手艺 真不少求Google 的 Data Science 有关的位置内推 (转载)
机器学习需要自己搞算法吗python用起来没有matlab好使,尤其是数据处理
相关话题的讨论汇总
话题: 股票话题: nlp话题: event话题: 事件话题: 自动
进入DataSciences版参与讨论
1 (共1页)
c*****t
发帖数: 562
1
大家看这事情可能吗?每个股票可能每天都发生很多事情
假设事情的种类是有限的,比如ABC三件事情发生了,导致
股票大跌或大涨,每天都有新的数据去不断train这个model
有没有到一个程度,可以自动利用实时数据来predict哪个
股票会大涨或大跌?我现在挑选了生物股票,就用了有限
的大约20类事件来做预测,从目前情况来看还是不错的。
请问各位有什么好建议吗?
O*O
发帖数: 2284
2
举个例子?

【在 c*****t 的大作中提到】
: 大家看这事情可能吗?每个股票可能每天都发生很多事情
: 假设事情的种类是有限的,比如ABC三件事情发生了,导致
: 股票大跌或大涨,每天都有新的数据去不断train这个model
: 有没有到一个程度,可以自动利用实时数据来predict哪个
: 股票会大涨或大跌?我现在挑选了生物股票,就用了有限
: 的大约20类事件来做预测,从目前情况来看还是不错的。
: 请问各位有什么好建议吗?

x*********s
发帖数: 2604
3
这个东西很多金融机构都做,首先要有个爬虫程序realtime从各种渠道抓新闻,然后进
行语义分析这个事件对某个股票或者行业的影响是正面还是负面,最后制定交易策略。
有的事件影响大,马上就反应在股价里,有的影响小,市场消化可能需要半个小时,你
需要对影响进行量化然后backtest验证模型。
b*******s
发帖数: 5216
4
event driven trading
s*****3
发帖数: 1673
5
这些实时的event 刚一发生,股票的价格就已经反映出来了。你看每次财报的时候股价
的volatility多大。感觉你想通过这些event来判断很难。而且假设你可以通过NLP来分
析 正负,但是有时候你很难判断 MM的意图是什么。有的股每次财报都 under
estimate,每次都疯长,或者是beat了大跌的情况也不少见。
那种搞high frequency trading的应该有这些东西了。主要是你news里面权重占多少呢
。 TA+FA+news 怎么分配? 你说到药股,那你应该知道 VRX吧,你看看近期的走势
,感觉很难预测。。。
而且现在大部分都用机器人交易,想打败机器人必须用机器人我感觉。或者是依靠时间
和耐心,短期上基本很难
l*******s
发帖数: 1258
6
几个问题
1. 20个事件,如何从新闻中抽取?关键字?精确度如何
2. back-testing怎么做的 效果如何

【在 c*****t 的大作中提到】
: 大家看这事情可能吗?每个股票可能每天都发生很多事情
: 假设事情的种类是有限的,比如ABC三件事情发生了,导致
: 股票大跌或大涨,每天都有新的数据去不断train这个model
: 有没有到一个程度,可以自动利用实时数据来predict哪个
: 股票会大涨或大跌?我现在挑选了生物股票,就用了有限
: 的大约20类事件来做预测,从目前情况来看还是不错的。
: 请问各位有什么好建议吗?

j****0
发帖数: 799
7
一直想做这么个系统.
主要是在TA 上下功夫.
主要是对股票了解不多所以不知道怎么下手.
希望这个贴继续讨论下去,也可以跟大牛学习学习
H******6
发帖数: 51
8
我也有兴趣,以前有时间的时候也做过一些尝试。但对于股票知识完全是门外汉,正在
一点点积累。希望可以和大家一起讨论,共同提高。
有没有微信群,或者类似的我们可以每天讨论?
g*******g
发帖数: 59
9
做event走到event对立面怎么办呢。。。
y******e
发帖数: 5906
10
同有兴趣
就是对股票一窍不通正在学习中
有微信的话给个号码呀
申请加入哈
相关主题
用普通工作站搭一个卷积神经网能达到什么样的规模,够干点什么公司招DATA SCIENTIST
DS需要会的手艺 真不少请推荐一个NLP的data set (转载)
机器学习需要自己搞算法吗说说最近的一次面试,兼告诫国人
进入DataSciences版参与讨论
y******e
发帖数: 5906
11
如果知道关键字的话可以做个template
然后通过template match搜索信息
只是不知道什么样的关键字才最重要
feature比较难琢磨呀
有feature就好搜了

【在 l*******s 的大作中提到】
: 几个问题
: 1. 20个事件,如何从新闻中抽取?关键字?精确度如何
: 2. back-testing怎么做的 效果如何

i******g
发帖数: 8
12
难,先看看别人的经验吧。
https://github.com/returnandrisk/r-code/blob/master/FOMC%20Cycle%20Trading%
20Strategy%20in%20Quantstrat.R#L1
油管上搜一搜,讲得更细一点 (不是这个系统)
OE
发帖数: 369
13
有人有这方面的微信群么?
这种timing的模型是不太容易做的.
lz 是否可以用这些信号来做pair trading, 想办法对冲掉大盘.

【在 c*****t 的大作中提到】
: 大家看这事情可能吗?每个股票可能每天都发生很多事情
: 假设事情的种类是有限的,比如ABC三件事情发生了,导致
: 股票大跌或大涨,每天都有新的数据去不断train这个model
: 有没有到一个程度,可以自动利用实时数据来predict哪个
: 股票会大涨或大跌?我现在挑选了生物股票,就用了有限
: 的大约20类事件来做预测,从目前情况来看还是不错的。
: 请问各位有什么好建议吗?

l*******s
发帖数: 1258
14
靠关键字的话,如下问题无法解决:
1。一词多义;多词一以;
2.上下文语义,比如肯定否定;
3。人名地名机构名,这个不能靠穷尽的列表匹配;没有那个资源,且精确度也是问题;
4.OOV问题,即out of vocabulary词就捕捉不到了;
5.事件里面牵扯到的实体之间的关系无法查找;
6.指代消解问题。比如上一句提到Fed,下一句用they指代,但真正的事件只在第二句
里提到;
这玩意得上NLP,但开发需要大量人力物力。

【在 y******e 的大作中提到】
: 如果知道关键字的话可以做个template
: 然后通过template match搜索信息
: 只是不知道什么样的关键字才最重要
: feature比较难琢磨呀
: 有feature就好搜了

y******e
发帖数: 5906
15
确实你考虑的比较周到
你说的问题,如果是漏检没捕捉到的,很难补救了
但如果是不必要的信息,倒是可以进一步筛选,再做一次feature extraction
NLP正在发展中,我没搞那个
我师弟在搞
我问他进展如何
也就那么回事
NLP噱头够,表面上很强大,发展空间很广泛
但是实际效果呢?
还处在开发中呀
要应用还得等啊!
而且我觉得越复杂的越麻烦问题越多
有时候就用简单的算法就能取得不错的效果了
当然我只是个小虾米,人蠢没办法
牛人有更好的算法

题;

【在 l*******s 的大作中提到】
: 靠关键字的话,如下问题无法解决:
: 1。一词多义;多词一以;
: 2.上下文语义,比如肯定否定;
: 3。人名地名机构名,这个不能靠穷尽的列表匹配;没有那个资源,且精确度也是问题;
: 4.OOV问题,即out of vocabulary词就捕捉不到了;
: 5.事件里面牵扯到的实体之间的关系无法查找;
: 6.指代消解问题。比如上一句提到Fed,下一句用they指代,但真正的事件只在第二句
: 里提到;
: 这玩意得上NLP,但开发需要大量人力物力。

l*******s
发帖数: 1258
16
NLP确实在发展中 但是在这个应用上 基本已经有比较成熟的方法了 比如NER, Co-ref
, Relation Event detection, SRL等 实际效果也很好
我说的需要投入大量人力物力 是说需要准备很多training data来建立模型。
按照目前的方法 基本上是可以保证不错的效果的 但是还是那句话 需要拖入精力做很
多数据准备工作

【在 y******e 的大作中提到】
: 确实你考虑的比较周到
: 你说的问题,如果是漏检没捕捉到的,很难补救了
: 但如果是不必要的信息,倒是可以进一步筛选,再做一次feature extraction
: NLP正在发展中,我没搞那个
: 我师弟在搞
: 我问他进展如何
: 也就那么回事
: NLP噱头够,表面上很强大,发展空间很广泛
: 但是实际效果呢?
: 还处在开发中呀

y******e
发帖数: 5906
17
你后面说的这些我没接触过,所以不知道,呃

ref

【在 l*******s 的大作中提到】
: NLP确实在发展中 但是在这个应用上 基本已经有比较成熟的方法了 比如NER, Co-ref
: , Relation Event detection, SRL等 实际效果也很好
: 我说的需要投入大量人力物力 是说需要准备很多training data来建立模型。
: 按照目前的方法 基本上是可以保证不错的效果的 但是还是那句话 需要拖入精力做很
: 多数据准备工作

1 (共1页)
进入DataSciences版参与讨论
相关主题
python用起来没有matlab好使,尤其是数据处理聚类问题请教
机器学习日报 2015年3月楼用普通工作站搭一个卷积神经网能达到什么样的规模,够干点什么
机器学习周报 2015-03-15DS需要会的手艺 真不少
求问一道关于NLP的面试题机器学习需要自己搞算法吗
text mining中的relation extraction公司招DATA SCIENTIST
用R做review 的summary请推荐一个NLP的data set (转载)
假如想实现 entity recognition, relation extraction这些功能的话,除了GATE, 还有 哪些其它的open source library。说说最近的一次面试,兼告诫国人
大家都什么背景,这里有点像转行版了求职求内推
相关话题的讨论汇总
话题: 股票话题: nlp话题: event话题: 事件话题: 自动