由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Programming版 - data science如何进阶?
相关主题
从心底讨厌scalapython: 怎么避免memory leak?
data.table谁用过? 有那么神吗?有matplotlib或numpy/scipy的同学帮我试试
Python至少还能管3年如何自学python
求python大牛指路python3还是python?
free back test tool in python - for quant algos (转载)咋用python做一个3D surface plot? 请教
这两本书看那本比较好?技术在进步
转行CS求建议请问Python初学者怎么学
把python当成通用script来学,哪些module需要熟练?Data Engineer Summer Intern at NEC Labs America, Princeton
相关话题的讨论汇总
话题: data话题: science话题: prediction话题: 进阶话题: cs
进入Programming版参与讨论
1 (共1页)
f*****n
发帖数: 499
1
小弟我从生物信息phd想转到data science
自己做过的有NGS-genomics之类的研究
也做过基于clinical feature 用ML进行phenotype prediction的研究
熟悉linux/hpcc,R,尤其是python(Numpy, Scripy, Matplotlib, Pandas, Scikit-
learn)这一套
学习了bishop的PRML,当然也补课了multi calculus,和线性代数
也刷过一些kaggle
刷kaggle和自己的phenotype prediction的套路都是:
feature engineering, data cleaning, machine learning data training, test
prediction, data visulization
请问掌握这些我算是入门了吗?
如果入门了的话,如何进阶呢?
是继续加深我的machine learning/数学的基础知识,以及加强python coding能力 (
我的自学当然不能跟科班比)
还是继续学习新的东西,比如mapreduce,Hadoop,NLP,deep learning之类的?
我有想过data science和CS两条出路,我觉得CS工作更多,而且基本上刷题就可以,目
标明确
但我对data sci更有兴趣,而且跟我的bioinformatics背景更加match
另外我觉得是不是data sci就那么些套路,比较简单?(或许我想错了?)
谢谢大家
1 (共1页)
进入Programming版参与讨论
相关主题
Data Engineer Summer Intern at NEC Labs America, Princetonfree back test tool in python - for quant algos (转载)
Re: 有谁觉得做bioinformatics 的数据分析 python比R好的? (转载)这两本书看那本比较好?
超级新手, 求助 python pandas 和pandas_DataReader转行CS求建议
廖方舟 李哲 金奖! (转载)把python当成通用script来学,哪些module需要熟练?
从心底讨厌scalapython: 怎么避免memory leak?
data.table谁用过? 有那么神吗?有matplotlib或numpy/scipy的同学帮我试试
Python至少还能管3年如何自学python
求python大牛指路python3还是python?
相关话题的讨论汇总
话题: data话题: science话题: prediction话题: 进阶话题: cs