c*****t 发帖数: 562 | 1 大家看这事情可能吗?每个股票可能每天都发生很多事情
假设事情的种类是有限的,比如ABC三件事情发生了,导致
股票大跌或大涨,每天都有新的数据去不断train这个model
有没有到一个程度,可以自动利用实时数据来predict哪个
股票会大涨或大跌?我现在挑选了生物股票,就用了有限
的大约20类事件来做预测,从目前情况来看还是不错的。
请问各位有什么好建议吗? |
O*O 发帖数: 2284 | 2 举个例子?
【在 c*****t 的大作中提到】 : 大家看这事情可能吗?每个股票可能每天都发生很多事情 : 假设事情的种类是有限的,比如ABC三件事情发生了,导致 : 股票大跌或大涨,每天都有新的数据去不断train这个model : 有没有到一个程度,可以自动利用实时数据来predict哪个 : 股票会大涨或大跌?我现在挑选了生物股票,就用了有限 : 的大约20类事件来做预测,从目前情况来看还是不错的。 : 请问各位有什么好建议吗?
|
x*********s 发帖数: 2604 | 3 这个东西很多金融机构都做,首先要有个爬虫程序realtime从各种渠道抓新闻,然后进
行语义分析这个事件对某个股票或者行业的影响是正面还是负面,最后制定交易策略。
有的事件影响大,马上就反应在股价里,有的影响小,市场消化可能需要半个小时,你
需要对影响进行量化然后backtest验证模型。 |
b*******s 发帖数: 5216 | |
s*****3 发帖数: 1673 | 5 这些实时的event 刚一发生,股票的价格就已经反映出来了。你看每次财报的时候股价
的volatility多大。感觉你想通过这些event来判断很难。而且假设你可以通过NLP来分
析 正负,但是有时候你很难判断 MM的意图是什么。有的股每次财报都 under
estimate,每次都疯长,或者是beat了大跌的情况也不少见。
那种搞high frequency trading的应该有这些东西了。主要是你news里面权重占多少呢
。 TA+FA+news 怎么分配? 你说到药股,那你应该知道 VRX吧,你看看近期的走势
,感觉很难预测。。。
而且现在大部分都用机器人交易,想打败机器人必须用机器人我感觉。或者是依靠时间
和耐心,短期上基本很难 |
l*******s 发帖数: 1258 | 6 几个问题
1. 20个事件,如何从新闻中抽取?关键字?精确度如何
2. back-testing怎么做的 效果如何
【在 c*****t 的大作中提到】 : 大家看这事情可能吗?每个股票可能每天都发生很多事情 : 假设事情的种类是有限的,比如ABC三件事情发生了,导致 : 股票大跌或大涨,每天都有新的数据去不断train这个model : 有没有到一个程度,可以自动利用实时数据来predict哪个 : 股票会大涨或大跌?我现在挑选了生物股票,就用了有限 : 的大约20类事件来做预测,从目前情况来看还是不错的。 : 请问各位有什么好建议吗?
|
j****0 发帖数: 799 | 7 一直想做这么个系统.
主要是在TA 上下功夫.
主要是对股票了解不多所以不知道怎么下手.
希望这个贴继续讨论下去,也可以跟大牛学习学习 |
H******6 发帖数: 51 | 8 我也有兴趣,以前有时间的时候也做过一些尝试。但对于股票知识完全是门外汉,正在
一点点积累。希望可以和大家一起讨论,共同提高。
有没有微信群,或者类似的我们可以每天讨论? |
g*******g 发帖数: 59 | |
y******e 发帖数: 5906 | 10 同有兴趣
就是对股票一窍不通正在学习中
有微信的话给个号码呀
申请加入哈 |
|
|
y******e 发帖数: 5906 | 11 如果知道关键字的话可以做个template
然后通过template match搜索信息
只是不知道什么样的关键字才最重要
feature比较难琢磨呀
有feature就好搜了
【在 l*******s 的大作中提到】 : 几个问题 : 1. 20个事件,如何从新闻中抽取?关键字?精确度如何 : 2. back-testing怎么做的 效果如何
|
i******g 发帖数: 8 | |
OE 发帖数: 369 | 13 有人有这方面的微信群么?
这种timing的模型是不太容易做的.
lz 是否可以用这些信号来做pair trading, 想办法对冲掉大盘.
【在 c*****t 的大作中提到】 : 大家看这事情可能吗?每个股票可能每天都发生很多事情 : 假设事情的种类是有限的,比如ABC三件事情发生了,导致 : 股票大跌或大涨,每天都有新的数据去不断train这个model : 有没有到一个程度,可以自动利用实时数据来predict哪个 : 股票会大涨或大跌?我现在挑选了生物股票,就用了有限 : 的大约20类事件来做预测,从目前情况来看还是不错的。 : 请问各位有什么好建议吗?
|
l*******s 发帖数: 1258 | 14 靠关键字的话,如下问题无法解决:
1。一词多义;多词一以;
2.上下文语义,比如肯定否定;
3。人名地名机构名,这个不能靠穷尽的列表匹配;没有那个资源,且精确度也是问题;
4.OOV问题,即out of vocabulary词就捕捉不到了;
5.事件里面牵扯到的实体之间的关系无法查找;
6.指代消解问题。比如上一句提到Fed,下一句用they指代,但真正的事件只在第二句
里提到;
这玩意得上NLP,但开发需要大量人力物力。
【在 y******e 的大作中提到】 : 如果知道关键字的话可以做个template : 然后通过template match搜索信息 : 只是不知道什么样的关键字才最重要 : feature比较难琢磨呀 : 有feature就好搜了
|
y******e 发帖数: 5906 | 15 确实你考虑的比较周到
你说的问题,如果是漏检没捕捉到的,很难补救了
但如果是不必要的信息,倒是可以进一步筛选,再做一次feature extraction
NLP正在发展中,我没搞那个
我师弟在搞
我问他进展如何
也就那么回事
NLP噱头够,表面上很强大,发展空间很广泛
但是实际效果呢?
还处在开发中呀
要应用还得等啊!
而且我觉得越复杂的越麻烦问题越多
有时候就用简单的算法就能取得不错的效果了
当然我只是个小虾米,人蠢没办法
牛人有更好的算法
题;
【在 l*******s 的大作中提到】 : 靠关键字的话,如下问题无法解决: : 1。一词多义;多词一以; : 2.上下文语义,比如肯定否定; : 3。人名地名机构名,这个不能靠穷尽的列表匹配;没有那个资源,且精确度也是问题; : 4.OOV问题,即out of vocabulary词就捕捉不到了; : 5.事件里面牵扯到的实体之间的关系无法查找; : 6.指代消解问题。比如上一句提到Fed,下一句用they指代,但真正的事件只在第二句 : 里提到; : 这玩意得上NLP,但开发需要大量人力物力。
|
l*******s 发帖数: 1258 | 16 NLP确实在发展中 但是在这个应用上 基本已经有比较成熟的方法了 比如NER, Co-ref
, Relation Event detection, SRL等 实际效果也很好
我说的需要投入大量人力物力 是说需要准备很多training data来建立模型。
按照目前的方法 基本上是可以保证不错的效果的 但是还是那句话 需要拖入精力做很
多数据准备工作
【在 y******e 的大作中提到】 : 确实你考虑的比较周到 : 你说的问题,如果是漏检没捕捉到的,很难补救了 : 但如果是不必要的信息,倒是可以进一步筛选,再做一次feature extraction : NLP正在发展中,我没搞那个 : 我师弟在搞 : 我问他进展如何 : 也就那么回事 : NLP噱头够,表面上很强大,发展空间很广泛 : 但是实际效果呢? : 还处在开发中呀
|
y******e 发帖数: 5906 | 17 你后面说的这些我没接触过,所以不知道,呃
ref
【在 l*******s 的大作中提到】 : NLP确实在发展中 但是在这个应用上 基本已经有比较成熟的方法了 比如NER, Co-ref : , Relation Event detection, SRL等 实际效果也很好 : 我说的需要投入大量人力物力 是说需要准备很多training data来建立模型。 : 按照目前的方法 基本上是可以保证不错的效果的 但是还是那句话 需要拖入精力做很 : 多数据准备工作
|