由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
DataSciences版 - 搞了个实时twitter文本分析来研究闯王和吸奶的行情分析 (转载)
相关主题
text mining中的relation extractionHive的表里面的timestamp类型数据,怎么显示?
NLP Concept Mining新手求问职业发展
有没有人想报Cloudera的Data Scientist Certificate的data challenge ... 现在公司都咋tmd想的
40道经典DS/ML面试题解答,求指导所谓的大数据
有人考虑过kaggle上这个预测CTR的题目么?Kafka, Spark Streaming, ElasticSearch for Business Intelli
如何用python读取大数据一道面试题,向本版求教一下。
转行数据挖掘和机器学习转: Twitter 各种职位内推!!!大量新职位
有关Stochastic Gradient Descent有人参加过SIAM的会议吗 (转载)
相关话题的讨论汇总
话题: twitter话题: 闯王话题: 每秒钟话题: 分析话题: 吸奶
进入DataSciences版参与讨论
1 (共1页)
k*****u
发帖数: 1688
1
【 以下文字转载自 USANews 讨论区 】
发信人: killniu (I shall be your eyes!), 信区: USANews
标 题: 搞了个实时twitter文本分析来研究闯王和吸奶的行情分析
发信站: BBS 未名空间站 (Thu Nov 3 04:12:02 2016, 美东)
地址是
http://159.203.111.2/
实时twitter数据采集,燃后画了4条线
1. 每秒钟关于闯王的twitter数
2. 每秒钟关于吸奶的twitter数
3. 每秒钟关于闯王的twitter的情感分析
4. 每秒钟关于吸奶的twitter的情感分析
基本的结果就是
1. 关于闯王的tweet数目基本上一直比吸奶要多
2. 情感分析却互有上下
k*****u
发帖数: 1688
2
【 以下文字转载自 USANews 讨论区 】
发信人: killniu (I shall be your eyes!), 信区: USANews
标 题: 搞了个实时twitter文本分析来研究闯王和吸奶的行情分析
发信站: BBS 未名空间站 (Thu Nov 3 04:12:02 2016, 美东)
地址是
http://159.203.111.2/
实时twitter数据采集,燃后画了4条线
1. 每秒钟关于闯王的twitter数
2. 每秒钟关于吸奶的twitter数
3. 每秒钟关于闯王的twitter的情感分析
4. 每秒钟关于吸奶的twitter的情感分析
基本的结果就是
1. 关于闯王的tweet数目基本上一直比吸奶要多
2. 情感分析却互有上下
M********0
发帖数: 1230
3
sentiment是用什么sample做的training?
k*****u
发帖数: 1688
4
NLTK那个library里面有twitter的数据
5000条positive,5000条negative
m*p
发帖数: 1331
5
http://159.203.111.2/data Failed to load resource: the server responded with a status of 500 (INTERNAL SERVER ERROR)
m*p
发帖数: 1331
6
http://159.203.111.2/data Failed to load resource: the server responded with a status of 500 (INTERNAL SERVER ERROR)
m*p
发帖数: 1331
7
Huiming ?! greetings! :-)

【在 k*****u 的大作中提到】
: NLTK那个library里面有twitter的数据
: 5000条positive,5000条negative

M*********g
发帖数: 178
8
need add two moving average
k*****u
发帖数: 1688
9
确实有时候会挂掉
我用的mysql存数据,内存比较小,会有2006错误
想折腾一下挂掉自动重启,但是还没搞好

【在 m*p 的大作中提到】
: http://159.203.111.2/data Failed to load resource: the server responded with a status of 500 (INTERNAL SERVER ERROR)
p******e
发帖数: 528
10
请问你的网页的visualization是用什么工具实现的。能用Python达到相似的效果吗?
谢谢。

【在 k*****u 的大作中提到】
: 确实有时候会挂掉
: 我用的mysql存数据,内存比较小,会有2006错误
: 想折腾一下挂掉自动重启,但是还没搞好

j*********n
发帖数: 74
11
楼主可否分享一下用的什么情感算法 谢谢
k*****u
发帖数: 1688
12
用的highcharts里面的highstock http://www.highcharts.com/stock/demo
python把数据dump到json,highcharts要一点点javascript

【在 p******e 的大作中提到】
: 请问你的网页的visualization是用什么工具实现的。能用Python达到相似的效果吗?
: 谢谢。

k*****u
发帖数: 1688
13
数据是从nltk来的
然后做了个tf-idf transform
最后用NaiveBayesian/linearSVC/SGD过了一下

【在 j*********n 的大作中提到】
: 楼主可否分享一下用的什么情感算法 谢谢
j*********n
发帖数: 74
14
谢谢!

【在 k*****u 的大作中提到】
: 数据是从nltk来的
: 然后做了个tf-idf transform
: 最后用NaiveBayesian/linearSVC/SGD过了一下

1 (共1页)
进入DataSciences版参与讨论
相关主题
有人参加过SIAM的会议吗 (转载)有人考虑过kaggle上这个预测CTR的题目么?
工作机会如何用python读取大数据
急求walmart ecommerce data scientist intern面经转行数据挖掘和机器学习
【Data Science Internship】有关Stochastic Gradient Descent
text mining中的relation extractionHive的表里面的timestamp类型数据,怎么显示?
NLP Concept Mining新手求问职业发展
有没有人想报Cloudera的Data Scientist Certificate的data challenge ... 现在公司都咋tmd想的
40道经典DS/ML面试题解答,求指导所谓的大数据
相关话题的讨论汇总
话题: twitter话题: 闯王话题: 每秒钟话题: 分析话题: 吸奶