由买买提看人间百态

topics

全部话题 - 话题: mine
首页 上页 1 2 3 4 5 6 7 8 9 10 下页 末页 (共10页)
y**i
发帖数: 1050
1
请问NATURAL LANGUAGE PROCESSING,或者说TEXT MINING里面哪个方向找工作最方便
最近在选课,打算选一个INDEPENDENT STUDY的课,想了解一下TEXT MINING里面哪个方
向对找工作方便,容易找工作呢
Sentiment Analysis? Named Entity Recognition? Information Extraction? etc
一般NATURAL LANGUAGE PROCESSING 方面好找工作吗?
谢谢告诉一下
y**i
发帖数: 1050
2
请问NATURAL LANGUAGE PROCESSING,或者说TEXT MINING里面哪个方向找工作最方便
最近在选课,打算选一个INDEPENDENT STUDY的课,想了解一下TEXT MINING里面哪个方
向对找工作方便,容易找工作呢
Sentiment Analysis? Named Entity Recognition? Information Extraction? etc
一般NATURAL LANGUAGE PROCESSING 方面好找工作吗?
谢谢告诉一下
t****n
发帖数: 20
3
【 以下文字转载自 Immigration 讨论区 】
发信人: tashen (图什么), 信区: Immigration
标 题: 求审稿机会(data mining, information security, network, semantic web)
发信站: BBS 未名空间站 (Sat Jan 25 19:15:59 2014, 美东)
求审稿机会(data mining, information security, network, smart spaces,
semantic web)
k**y
发帖数: 320
4
来自主题: Database版 - 什么是database mining?
not mining ya, it is data mining. different de.
papaya 3k.
q*j
发帖数: 156
5
来自主题: Database版 - 什么是database mining?
//faint
it's "data mining" not "database mining".
s**********o
发帖数: 14359
6
SAS+SQL赚钱挺多的,为什么要搞得四不像呢,SAS本身就可以编程的,而且自带很多的
MODEL,就是用来MINING的,还要学什么?JAVA和C++不过是门语言,离做DATA MINING
差得
十万八千里,什么都会点等于什么都不会,你SAS等级考试全过了?
F******7
发帖数: 755
7
来自主题: Database版 - Data Mining vs. Data Management
请问这里有经验的XDJM,data mining 和 data management,哪一个不用24小on call
啊。是不是data management更demanding一点儿,更趋向data administration?? 而
data mining 更靠近 data analysis?? 多谢先!!
D*J
发帖数: 141
8
来自主题: Database版 - Data Mining vs. Data Management
不懂data management的data mining都是瞎mining. GIGO.
c**i
发帖数: 6973
9
来自主题: Hardware版 - Wireless Communication With Mine
Kris Maher, New Tool May Reach Trapped Miners;
Lockheed Martin Is Testing Wireless Communication System to Help Locate
Workers After Accidents
Wall Street Journal, July 20, 2010.
http://online.wsj.com/article/SB10001424052748704720004575377232010729558.html
("to send a fully wireless signal through the layers of earth and rock above
mines. * * * Using the magnetic waves, the system has successfully
transmitted signals through mines to depths in excess of 1,550 feet in tests
. Radio waves, by con
l******t
发帖数: 660
10
【 以下文字转载自 Database 讨论区 】
发信人: lakewest (lake), 信区: Database
标 题: nsa的big data项目, 学data mining的人有工作了
发信站: BBS 未名空间站 (Fri Jun 7 12:22:34 2013, 美东)
NSA, FBI mining data from 9 US Internet companies
http://thehill.com/blogs/defcon-hill/policy-and-strategy/304071
这tmd得有多大的数据啊.
p******n
发帖数: 874
11
啥算data mining呢,这个范围非常广泛,其实几乎所有的computational biology/
bioinformatics就干一件事:data mining.
y****g
发帖数: 37
12
【 以下文字转载自 Statistics 讨论区 】
发信人: yunong (yunong), 信区: Statistics
标 题: 这里有做DATA MINING之类工作的吗~~~
发信站: BBS 未名空间站 (Sun Oct 12 17:34:00 2008), 转信
我现在做的是marketing intelligence的东西,就是在marketing部门分析数据,做一
些data mining,BI,OLAP,AD HOC等的分析来支持management和marketer做决策。这个是
目前的工作,但是长期来说,我当然想有更大的提升平台,只是不太晓得做这类工作有
啥其他好的提升点吗。一条路就是在本领域慢慢升,但是有无其他选择呢,比如直接做
marketing?那是不是需要读个商科的学位啥的?
k****n
发帖数: 3803
13
☆─────────────────────────────────────☆
taki (taki) 于 (Tue Mar 25 21:17:17 2008) 提到:
拿到一个CSM的PhD offer,是Geotechnical Engineering。请教大家这个学校的这个专
业在领域内声誉如何,这个专业在北美找工作形势如何呢?
谢谢
☆─────────────────────────────────────☆
taki (taki) 于 (Tue Mar 25 21:19:56 2008) 提到:
知道他家的地球物理和石油工程很强,但Geotechnical engineering不了解。
☆─────────────────────────────────────☆
flac (fish) 于 (Wed Mar 26 11:44:44 2008) 提到:
geotech in school of mines is so-so but it is very easy to get a job in
Denver for geotechnical ... 阅读全帖
F******n
发帖数: 160
14
来自主题: Computation版 - 有做 data mining 的不?

Search Engine 属于Data Mining 吧?光说文本搜索,基本的算法就包括文件语义分
解等等;很多实际用的只是关键字的统计算法加上各种improvement。对于图像搜索,
关于图像的分解,表示和各类统计算法,应该更多。不过我的猜测是,现在所有的
技术还是处于state of art,还有很多潜力;而且实用的推动力也很大 - 这些玩艺
有用。对于语音,动态图形的mining,现在看到正经好用还不多。
c*******e
发帖数: 150
15
来自主题: Quant版 - 推荐data mining 的书
J. Han, Data Mining
the bible for large-scale data mining
If you have more time and patience, I would recommend that you refer to T.
Mitchell, Machine Learning. Much more mathematical and rigorous
V**0
发帖数: 889
16
来自主题: Quant版 - quant用到data mining 多吗?
exactly. Data mining doesn't have strong application in finance.
In many situations, simpler is actually better, espeically for industrial
applications. Lots of academic research work in data mining, statistical
learning and econometrics are just for the sake of producing "papers". In
most cases, linear regression can do a good enough job and tell a good
enough story within days, instead of working a fancy model for many months
and the improvement is built on assumptions or a specific dataset.
... 阅读全帖
s*****n
发帖数: 2174
17
Data mining里面, 很多东西都要自己写, 所以你需要一种灵活度很高的软件.
R绝对是这个领域的主流. 传统的data mining, 无非是两个领域在做, 一个是
统计, 一个是计算机. 两个领域的人做研究, 风格和理念都不太一样, 但是现
在越来越融合了. 统计界, 传统就用R. 计算机界, 传统上用C++或者Matlab.
不过现在的趋势, 是计算机的系的老师也逐渐开始用R了, 这足以说明R在这个领域
的优势.
那本<>, 基本上成了Bible级的著作了.
无论是统计背景还是计算机背景的人, 只要做这个方向的, 基本人手一册吧.
里面的sample code, 都是R的. 这本书, 很大程度上促进了这个领域的大融合.
你提到的另外这两个, 我不了解, 如果你会用, 你就选你用的顺手的.
如果从头学起, 现在不知道选什么, 那就选R.
s*****n
发帖数: 2174
18
对, 那种情况下, 肯定是遵循行业的传统了.
不过看楼主的意思, 不像是问这个.
严格来说, 用现成的DM软件做, 都不能算叫"做data mining". 只能叫应用DM.
这个时候谈论哪个软件好没什么意义. 这就好像说用什么软件做线性回归
最好, 用什么软件做时间序列最好. 如果只是狭义的应用, 那么什么软件
都无所谓, 只要选一个行业内用的最普遍的就行了.
如果是要自己manipulate data, 然后逐步做探索性的data mining. 甚至
自己要写package来做. 那肯定是R最方便.
o****o
发帖数: 8077
19
来自主题: Statistics版 - Data Mining 的方向前途
我正想回,发现你先一步
data mining是一种态度,跟是否用了复杂算法没有直接关系。我们自己每天脑袋里也
在做data mining。

seminar
d*******o
发帖数: 493
20
楼主原来做数据库的,可以看看oracle data mining 或者SQL server里面的analysis
services,里面的data mining跟Enterprise Miner是一样的原理。
S******y
发帖数: 1123
21
来自主题: Statistics版 - Text-mining 紅樓夢 - update(1)
承蒙大家關注我的紅樓夢Text-mining Blog。
一直想盡快update Text-mining Blog, 無奈諸事繁忙, 只能抽出業餘時間來做一點
研究。
作為第一步,抽取了一些常用的虛詞 - 之, 呼, 也 ,呢, 然, 罷, 且 。。 等
等, 來觀察它們在前八十回 vs 後四十回 的frequency。
對每個字的使用trend 做圖, 同時做 t-test (前八十回 vs 後四十回)。

方法:
1) 用Python crawler抓取/下載 红楼梦 全書
2) 用Python讀入120回的文本成為term-document matrix
3) R讀入data,用來畫圖,以及做t-test (R scripts generated by Python)
具體情況,歡迎大家訪問我的 BLOG -
請Google Keywords => 紅樓夢 timothy blog
Google自然搜索第一條便是 :-)
(恕不便直接給出 URL, 以蔽違反發帖政策之嫌)
歡迎批評指正, ... 阅读全帖
L********d
发帖数: 3820
22
来自主题: Statistics版 - Data Mining Conference
还有SDM, KDD,ICDM, 这几个更偏重于data mining

Mining
neuroscience
y**i
发帖数: 1050
23
请问NATURAL LANGUAGE PROCESSING,或者说TEXT MINING里面哪个方向找工作最方便
最近在选课,打算选一个INDEPENDENT STUDY的课,想了解一下TEXT MINING里面哪个方
向对找工作方便,容易找工作呢
Sentiment Analysis? Named Entity Recognition? Information Extraction? etc
一般NATURAL LANGUAGE PROCESSING 方面好找工作吗?
谢谢告诉一下
b*********n
发帖数: 1938
24
现在做text mining的有两类,一是学校里,opensource的东西很多。公司里绝大多数
都包给vendor做。大部分的商用independent text mining tool都不是很好用, 一般
都是saas
Y****a
发帖数: 243
25
来自主题: Statistics版 - 【请教】关于Text mining
笨办法要不要?
通常text mining的步骤,
1. 把一句话或者一个record中的单词或词组拆分开
2. 清理stop words, such as 'a','an','of','to' etc.
3. stemming, 统一时态,比如,‘bagan’,beginning变成‘begin’
统一单复数。这一步一般的text mining软件里有function可以完成。
这一步也是correct缩写,简写,typo的步骤,不过这些需要你自己keep一个list。
4. whatever analysis you want to do,cluster,association,frequency,。。。
。。
5. summarize finding
D*********Y
发帖数: 3382
26
data mining都有些啥内容呢?下周有个interview还有关data mining的,可是我什么
都不知道。
m*********g
发帖数: 70
27
感谢各位的留言。还是有些启发。
我的感觉是传统统计比是有数理基础,我见过理论统计学家连计算机都没碰过的。从这
一点上靠近经济学模型多一些。
data science似乎更多的基于cs和engineering的一些过程,用optimization的多一些。
虽说两种都需要business sense,但是传统统计模型需要一些比较明确的假设,也就是
data model需要的东西,一般情况结果会支持或者反对最初的假设,通常需要建立
causal relationship. 但是data science 的模型可以没有这些东西,结果是主要的。
以我做的predictive model来说,我的模型中变量选入需要有临床依据,结果出来需要
和临床知识做个对比。但是data scientist做的东西只需要解释input和output,不用解
释how and why,有点black box的感觉。
我的理解是有些问题上明显是传统统计的应用靠铺一些,比如诸类社会科学研究和商业
界基于知识背景的研究。但是某些模型,金融中的一部分问题,自然科学类,比如预测
大气某种成分含量等等,data scienc... 阅读全帖
p********1
发帖数: 1011
28
来自主题: Statistics版 - 求推荐论坛data mining, Bayesian
在这个版问Bayesian, Data Mining的问题,总是没有答复。
请问,哪个网站的Bayesian, Data Mining比较好?
j*******g
发帖数: 331
29
来自主题: Statistics版 - mining time series data (转载)
【 以下文字转载自 DataSciences 讨论区 】
发信人: jasonmeng (dueduedue), 信区: DataSciences
标 题: mining time series data
发信站: BBS 未名空间站 (Fri Aug 15 12:34:58 2014, 美东)
最近需要处理一些time series的数据,想请问有没有有经验的高手比较熟悉 indexing
and mining time series data的,有什么切入点可以让我开始学习?
谢谢
c***n
发帖数: 223
30
【 以下文字转载自 Programming 讨论区 】
发信人: codon (codon), 信区: Programming
标 题: 求推荐machine learning和data mining的书
发信站: BBS 未名空间站 (Mon Apr 7 11:12:40 2014, 美东)
数学底子足够,有不少编程经验,也零散地干过machine learning和data mining的活
。想在有限的时间里系统地学一下。谢谢。
Y****a
发帖数: 796
31
想请教一下版上的各位牛人
本人是生物背景 本科 PhD 都学生物 现在做postdoc 不准备继续奋斗做PI 所以希望学
点东西给自己充电 扩宽将来就业的方向
对stanford的几个graduate certificate很感兴趣
data mining and applications
clinic research bioinformatics
biomedical research bioinformatics
都要学大概3个课程 所以花的学费和精力都差不多
感觉如果学data mining 将来的应用很广阔 既可以继续在研究所或制药公司里做data
scientist 也可以去别的领域
如果学另外两个 感觉programming的份量比较重 将来主要还是在生物或医学领域
比如学clinic research bioinformatics 可以去制药公司clinic development部门做
clinic trial有关的工作 觉得也会是自己喜欢的工作
不知道各位牛人有没有拿过这些certificate的 知不知道这些program好不好 有没有用
h*d
发帖数: 19309
32
来自主题: _Metal版 - GNR - Sweet Child O Mine
http://www.youtube.com/watch?v=P-AYAv0IoWI
She's got a smile that it seems to me
Reminds me of childhood memories
Where everything was as fresh as the bright blue sky
Now and then when I see her face
She takes me away to that special place
And if I stared too long
I'd probably break down and cry
Oh, sweet child o' mine
Oh, sweet love of mine
She's got eyes of the bluest skies
As if they thought of rain
I hate to look into those eyes
And see an ounce of pain
Her hair reminds me of a warm safe pla
d*********e
发帖数: 8525
33
冒着周末的高温, 有6名童鞋参加了周六早晨在Billy goat的hiking, 这条路大家走的太多了, gold mine trail可能很少有人走, 在此汇报一下。
本来是想向tencups、zhiwei等老大学习起早拍日出的,咳咳还是起晚了,到哪6点,已经天亮了, 而且云还挺多,彻底放弃。这个点到达最大的好处是停车位好找(必须得说俺不是第一个车,还有更早的鸟)。走bear island trail 我估计是第一个,路上碰到不少蜘蛛网, 另一个不大不小的问题是可能是早上有露水, 石头上多少有点滑。平时很少这么早起运动,天还挺闷, 一会就一身汗。
在瀑布哪正好看到四个练kayaking的, 一个个轮流到浪最大的地方玩平衡,身手都不错,换咱去估计立马就得翻
返回停车场8点多一点, 几名童鞋正好赶到,随再来一圈。这个时间停车场基本就满了。经过第一圈热身后,第二圈反而轻松很多, 一路到达visiting center, 发现旁边还有一条gold mine trail可以回去,以前可能很少有人走。相比大路,这条trail略长一点,好处是路面很平整,没有那么多沙... 阅读全帖
t*****s
发帖数: 3478
34
不错不错,我那天也起来想拍日出,还好我在离家里很近的地方,没有见到也不算太冤
。这边附近其实没有找到理想的拍日出的地方。这个地方早上跑步,骑车,钓鱼,划船
,拍照都是挺好的。

大家走的太多了, gold mine trail可能很少有人走, 在此汇报一下。
点,已经天亮了, 而且云还挺多,彻底放弃。这个点到达最大的好处是停车位好找(
必须得说俺不是第一个车,还有更早的鸟)。走bear island trail 我估计是第一个,
路上碰到不少蜘蛛网, 另一个不大不小的问题是可能是早上有露水, 石头上多少有点
滑。平时很少这么早起运动,天还挺闷, 一会就一身汗。
手都不错,换咱去估计立马就得翻
就满了。经过第一圈热身后,第二圈反而轻松很多, 一路到达visiting center, 发
现旁边还有一条gold mine trail可以回去,以前可能很少有人走。相比大路,这条
trail略长一点,好处是路面很平整,没有那么多沙石,走起来很舒服; 特别是这条
trail完全是林荫路,一点晒不着,可以直接到达停车场。下一次有兴趣的童鞋可以试
一下,入口就在visiting center的背后。
w*********m
发帖数: 4740
35
that's two areas
database guys know little about data mining
D***r
发帖数: 7511
36
data mining要学很多统计的知识,database主要是算法的东西
G***G
发帖数: 16778
37
来自主题: Military版 - the first rescuer got to the mine
he descends into the mine.
p****y
发帖数: 23737
38
煤矿公司要继续整合和加强管理,现在的意外还是太多了。

mine
they
located
was
w*l
发帖数: 2550
39
你要改成这个题目:
看方舟子让我学到data mining
肯定大卖。
b*******s
发帖数: 3614
40
这个和data mining很不一样,倒是和刑侦有点像,差别是FZZ不能强迫HH一方拿他想要
的证据。
a**e
发帖数: 8800
41
【 以下文字转载自 USANews 讨论区 】
发信人: aple (凸-_-凸), 信区: USANews
标 题: 大家的医疗保险涨价了么? Mine ^~80%
发信站: BBS 未名空间站 (Fri Nov 16 11:29:34 2012, 美东)
我家的明年的医疗保险比今年上涨~80%,从今年的4xx/month->7xx/month
CTMD, OBMA
l********u
发帖数: 910
42
A total of 171,300 tonnes of gold have been mined in human history,
according to GFMS as of 2011.[2]
如果300吨为真,确实是可以撼动市场的
b******3
发帖数: 4385
43
这个是定向监控,和大量语音数据的data mining 不一样
R***r
发帖数: 1190
44
这年头,搞恐怖主义无论如何都会在互联网或者通信网络上留下蛛丝蚂迹,还是米帝
nsa牛鼻,全世界网络一网打尽。
按照造不如买,买不如租的概念,习总可以把data mining这一巨大工程外包给nsa,肯
定可以立马解决不少问题。
O**l
发帖数: 12923
c**i
发帖数: 6973
46
来自主题: Automobile版 - Autonomous Trucks, Trains and Mining
Robb M Stewart, Rio Trucks Make Efficient Haul; Iron-Ore Miner to Deploy
Massive Automated Vehicles at Australian Site in 2012. Wall Street Journal,
June 9, 2011
http://online.wsj.com/article/SB1000142405
2702304259304576372892652648426.html
("autonomous trucks, trains and drill rigs")
My comment:
(a) Rio Tinto Group
http://en.wikipedia.org/wiki/Rio_Tinto_Group
(a British-Australian company based at both Westminster (a London borough)
and Melbourne; founded in 1873, when a multinational consort... 阅读全帖
h******e
发帖数: 1385
47
广告标题:
换一个wii+fitplus to NE, Mine from MA, PA
我现有的物品:
wii+fit plus
我想要的物品:
wii+fit plus
建议交换比率 (required):
邮寄方式要求:
买卖双方谁承担邮寄损失(required if not code only):
其它补充说明:
广告的有效期:
我的联系方式:
单张面值:
物品来源 (required for ALL cards!):
t**********9
发帖数: 1085
48
我想要的物品:
Exhange Wii Console + fit plus with good package box in one box
mine will be shipped from west
单张面值:
可接受的价格(必须明码标价!):
物品新旧要求:
Brand New
邮寄方式要求:
买卖双方谁承担邮寄损失(Required if not code only):
付款方式说明:
其他补充说明:
广告的有效期:
物品来源:
我的联系方式:
mit pm
h******e
发帖数: 1385
49
广告标题:
wii+ wii fit plus to 中部, Mine from MA
我现有的物品:
wii+wiifitplus from MA
我想要的物品:
wii+wiifitplus to TX, AR, OH, OK
建议交换比率 (required):
邮寄方式要求:
买卖双方谁承担邮寄损失(required if not code only):
其它补充说明:
广告的有效期:
我的联系方式:
单张面值:
物品来源 (required for ALL cards!):
t*****t
发帖数: 1519
50
广告标题:
wii+wii fit plus to IA;mine at CA;1:1;own label; pm.
求购$355+ml
我现有的物品:
我想要的物品:
建议交换比率 (required):
邮寄方式要求:
买卖双方谁承担邮寄损失(required if not code only):
其它补充说明:
广告的有效期:
我的联系方式:
单张面值:
物品来源 (required for ALL cards!):
首页 上页 1 2 3 4 5 6 7 8 9 10 下页 末页 (共10页)