关于做bioinformatics - Biology版

本页内容为未名空间相应帖子的节选和存档，一周内的贴子最多显示50字，超过一周显示500字访问原贴

Biology版 - 关于做bioinformatics

相关主题
● bioinformatics吐下槽	● 一个人的价值体现在哪里？
● 谁来谈谈现在bioinformatics的情况啊	● 大家好
● 读Ph.D 的同时，有人会考虑花钱再读个master degree吗？	● 基础研究和应用研究在中国
● 求教转专业	● 最近非常郁闷
● 今天又发了一篇JCP, 但是心里一点都开心不起来（一个化学博后内 (转载)	● 两车碾烂女童 20人路过不屑一顾(ZZ)
● 生物 PHD 报个转码工的 offer (转载)	● 新PI们说说，是当新PI累还是当postdoc累？
● 硕士菜鸟生物wsn想转行度本科，求指教	● 路在脚下（生化专业找州立学校AP经验之谈）
● STEM绿卡提案的影响	● neverthink是个好同学。。。

相关话题的讨论汇总
话题: bioinfo话题: cs话题: data话题: cloud

进入Biology版参与讨论

(共1页)

u*********1
发帖数: 2518

刚来美国的biomedical science的phd program。还比较年轻吧，本科刚毕业。
现在在做rotation，现在有点想选择一个bioinformatics的实验室。
问题是个人一点计算机编程经历都没有，小白状态。但是对基因组学很有兴趣（只是过
去是做genomics的bench work的）另外比较年轻，是不是现在从头学起也不要紧？
另外一点，是在医学院，并没有完整的bioinformatics的系。。。
不晓得各位前辈是否有建议。谢谢。

b**2
发帖数: 1140

Transfer to another scholl?

【在 u*********1 的大作中提到】

: 刚来美国的biomedical science的phd program。还比较年轻吧，本科刚毕业。
: 现在在做rotation，现在有点想选择一个bioinformatics的实验室。
: 问题是个人一点计算机编程经历都没有，小白状态。但是对基因组学很有兴趣（只是过
: 去是做genomics的bench work的）另外比较年轻，是不是现在从头学起也不要紧？
: 另外一点，是在医学院，并没有完整的bioinformatics的系。。。
: 不晓得各位前辈是否有建议。谢谢。

k*****o
发帖数: 1486

选bioinfo的课就行了，你的数学和统计功底好的话肯定没问题。
还有，中国人数学底子本来就很好，就算是学也比美国人快很多（要不然为什么呢么多
F2去读统计呢）。
编成的话说不准，个人觉得逻辑思维还可以的话，学C++和VB都是突击一下就能用。
网上教学视频非常多，以你能考GT过来的1/4努力就能学到bioinfo要用的level（当然
不能用CS的那种高标准要求）。
总之，bioinfo选课很重要，就是说基础知识重要。不学进不来门，进来了比作
molecular/cellular的轻松多了。

w******a
发帖数: 1527

谢谢分享~~~

v**********h
发帖数: 230

找一个做计算方面的实验室，自学一点点编程，熟悉编程环境，直接做PROJECT，边做
边学。BIOINFO的课不重要。我认识的做BIOINFO的人，也有啥经验都没有的，进了实验
室，学一个星期的编程，就直接上马做PROJECT了。老板不会给你很多时间让你系统的
学习，一般就是一边做一边学，编程会个皮毛，然后就不停地TEST，GOOGLE CODE，就
这样子。

u*********1
发帖数: 2518

多谢。
但关键是这个医学院在这方面很弱，目前就一个很强的这个实验室。貌似连bioinfor的
course都没有。
不能进入了实验室慢慢跟着其他人学么？（然后自己好好自学，看书）
多谢多谢

【在 k*****o 的大作中提到】

: 选bioinfo的课就行了，你的数学和统计功底好的话肯定没问题。
: 还有，中国人数学底子本来就很好，就算是学也比美国人快很多（要不然为什么呢么多
: F2去读统计呢）。
: 编成的话说不准，个人觉得逻辑思维还可以的话，学C++和VB都是突击一下就能用。
: 网上教学视频非常多，以你能考GT过来的1/4努力就能学到bioinfo要用的level（当然
: 不能用CS的那种高标准要求）。
: 总之，bioinfo选课很重要，就是说基础知识重要。不学进不来门，进来了比作
: molecular/cellular的轻松多了。

d*******e
发帖数: 1649

这个还是要在实践中学习。有个project，使用google立马就能上手。
光看书自学我觉得比较困难，这个方向东西很多，很繁杂，需要的知识面很宽，但是并
不需要十分深入。要是有人在开始的时候带你一下，会非常有帮助。
能去听一听类似的课最好，但是如前所说，这个方面并没有一个比较系统的东西，所以
就算没有条件上课损失也不大。我觉得最好能找到几个做类似东西的人，能够随时讨论
，否则单干很花时间，而且效果不好。

【在 u*********1 的大作中提到】

: 多谢。
: 但关键是这个医学院在这方面很弱，目前就一个很强的这个实验室。貌似连bioinfor的
: course都没有。
: 不能进入了实验室慢慢跟着其他人学么？（然后自己好好自学，看书）
: 多谢多谢

k*****o
发帖数: 1486

bioinfo非常宽，如果你去指定的某个实验室，就要做他们的东西。
bioinfo有些方向都需要一些“特殊”的知识，这些东西不是看看书就能一下子掌握的
，当然时间多的话也可以这么做。
如果想速成，那就问那个实验室的老板，问他要课题，或者问他们实验室的人都做了什么课题，并且问做这些课题要上什么课。
当然实践是必须的，关键是要转就早转。

【在 u*********1 的大作中提到】

n******7
发帖数: 12463

最重要的是做project
我先自己学了一年左右还是不得要领
跟别人做project 很快就明白怎么回事了然后就可以自己设计project了

【在 d*******e 的大作中提到】

: 这个还是要在实践中学习。有个project，使用google立马就能上手。
: 光看书自学我觉得比较困难，这个方向东西很多，很繁杂，需要的知识面很宽，但是并
: 不需要十分深入。要是有人在开始的时候带你一下，会非常有帮助。
: 能去听一听类似的课最好，但是如前所说，这个方面并没有一个比较系统的东西，所以
: 就算没有条件上课损失也不大。我觉得最好能找到几个做类似东西的人，能够随时讨论
: ，否则单干很花时间，而且效果不好。

v******s
发帖数: 51

说真的，除非你做实验混不下去了，否则别跳bioinformatics。
干这行就是靠傍着做benchwork的lab吃饭，整天低头哈腰求人要数据
或者做个follow up实验，工作发了CNS也轮不到你当第一作者。
另外放弃自己的专长，跑去和搞统计和计算机的人比modelling和编程，
你也没有任何优势啊。
如果你真是铁了心的要搞bioinfo，最好去个实验和计算都做的lab，
这样也许你能找到适合自己的方向。

【在 u*********1 的大作中提到】

相关主题
● 生物 PHD 报个转码工的 offer (转载)	● 一个人的价值体现在哪里？
● 硕士菜鸟生物wsn想转行度本科，求指教	● 大家好
● STEM绿卡提案的影响	● 基础研究和应用研究在中国
进入Biology版参与讨论

s*********x
发帖数: 1923

我们实验室是做实验的低头哈腰求人做分析，cns基本都是并列一作吧。现在动不动就
是genome wide的chip-seq, rna-seq，bioinfo前景很好－－当然要看你的实验室和
老板。

【在 v******s 的大作中提到】

: 说真的，除非你做实验混不下去了，否则别跳bioinformatics。
: 干这行就是靠傍着做benchwork的lab吃饭，整天低头哈腰求人要数据
: 或者做个follow up实验，工作发了CNS也轮不到你当第一作者。
: 另外放弃自己的专长，跑去和搞统计和计算机的人比modelling和编程，
: 你也没有任何优势啊。
: 如果你真是铁了心的要搞bioinfo，最好去个实验和计算都做的lab，
: 这样也许你能找到适合自己的方向。

l******o
发帖数: 2649

但是感觉bioinformatics还是最终会成为commodity

【在 s*********x 的大作中提到】

: 我们实验室是做实验的低头哈腰求人做分析，cns基本都是并列一作吧。现在动不动就
: 是genome wide的chip-seq, rna-seq，bioinfo前景很好－－当然要看你的实验室和
: 老板。

e*****t
发帖数: 642

做bioinfo的好处就是可以有借口多上cs和统计的课，将来就是bioinformatics不好找
工作，编程好，统计行，还能勉强糊口，比千老强一点。

l******o
发帖数: 2649

really? but u r still not CS

【在 e*****t 的大作中提到】

: 做bioinfo的好处就是可以有借口多上cs和统计的课，将来就是bioinformatics不好找
: 工作，编程好，统计行，还能勉强糊口，比千老强一点。

d*****u
发帖数: 17243

有些CS系就是在做bioinformatics啊

【在 l******o 的大作中提到】

: really? but u r still not CS

s*********x
发帖数: 1923

cs 的 bioinfo 和外系的bioinfo的训练还是非常不一样的，比如cs的核心课bioinfo的
基本都没上过，Algorithm, theory of computation, computer architecture,
compiler ...

【在 d*****u 的大作中提到】

: 有些CS系就是在做bioinformatics啊

e*****t
发帖数: 642

这些东西除了algorithm bioinfo可能用到，别的都没什么用。其实大部分bioinfo的工
作就是data analysis。编程+统计足矣。

【在 s*********x 的大作中提到】

: cs 的 bioinfo 和外系的bioinfo的训练还是非常不一样的，比如cs的核心课bioinfo的
: 基本都没上过，Algorithm, theory of computation, computer architecture,
: compiler ...

e*****t
发帖数: 642

此话怎讲？

【在 l******o 的大作中提到】

: 但是感觉bioinformatics还是最终会成为commodity

K****n
发帖数: 5970

其实bioinfo和cs是不太相关的俩行业，交集也就是data analysis这一小块儿。我建议
少学cs，这样以后找工作的时候可以去做analyst啊，project manager啊之类的，避开
软工这个职业。当然，万一不幸成为软工，也不用慌张。无论啥职业，最终都是靠和别
人混来混去混出头的，技术上的事儿永远是简单的，到底学不学cs课程完全不重要，重
要的是能不能迅速搞清楚别人心里都在想啥

s*******2
发帖数: 499

bioinformatics整体来看，比纯生物做试验要好，相对好找工作，不接触有毒物品。
据我了解,bioinformatics主要就是编程和算法，数学和统计知识用的很少。
我一个本科同学，上过C和C++的课，在本科学校选了个生物信息学的实验室读博士。他
导师水平一般，就靠自己折腾，发了好几篇好文章。假期还去微软做实习，毕业后去了
证交所工作，待遇十分丰厚，堪称我们这届转行的典范。
如果你想转cs或者quant,可以找个bioinformatics的实验室，平常的活没做试验花时间
，然后疯狂选课。我一个师弟就这么干过。

【在 u*********1 的大作中提到】

相关主题
● 最近非常郁闷	● 路在脚下（生化专业找州立学校AP经验之谈）
● 两车碾烂女童 20人路过不屑一顾(ZZ)	● neverthink是个好同学。。。
● 新PI们说说，是当新PI累还是当postdoc累？	● 由饶毅email再谈nature事件反应过度
进入Biology版参与讨论

l******m
发帖数: 43

你说的这些，除了algorithm以为，CS科班的人也不一定都学过。Bioinfo的人应该多去
CS选一些
database，NLP， machine learning方面的课，而不是你说的这些。。

【在 s*********x 的大作中提到】

: cs 的 bioinfo 和外系的bioinfo的训练还是非常不一样的，比如cs的核心课bioinfo的
: 基本都没上过，Algorithm, theory of computation, computer architecture,
: compiler ...

l******m
发帖数: 43

Kind of agree, 编程和统计的skill sets可以用到很多其他的领域,转方向很容易。

【在 e*****t 的大作中提到】

: 做bioinfo的好处就是可以有借口多上cs和统计的课，将来就是bioinformatics不好找
: 工作，编程好，统计行，还能勉强糊口，比千老强一点。

S**********l
发帖数: 3835

我觉得生物出身的做bioinfo最好。这样你就知道要解决什么问题。至于具体的解决方
法，machine learning也好，编程也好，都是容易的。关键还是要能提出有价值的研究
问题。

【在 u*********1 的大作中提到】

e*****t
发帖数: 642

I don't think algorithm, machine learning is easy.
Most breakthrough in bioinfo was done by cs or stat guys. Bio guys just use
those tools.

【在 S**********l 的大作中提到】

: 我觉得生物出身的做bioinfo最好。这样你就知道要解决什么问题。至于具体的解决方
: 法，machine learning也好，编程也好，都是容易的。关键还是要能提出有价值的研究
: 问题。

s*********x
发帖数: 1923

from my personal experience, algorithm is relatively easy. Machine learning
is pretty hard.

use

【在 e*****t 的大作中提到】

: I don't think algorithm, machine learning is easy.
: Most breakthrough in bioinfo was done by cs or stat guys. Bio guys just use
: those tools.

K****n
发帖数: 5970

ML for industry is chapter 1,2, and 3 in your textbook. So you can relax

learning

【在 s*********x 的大作中提到】

: from my personal experience, algorithm is relatively easy. Machine learning
: is pretty hard.
:
: use

s*******2
发帖数: 499

计算机系研究生学的算法还是比较难的，需要一定的智商。
machine learning需要一定的数学和统计基础。

learning

【在 s*********x 的大作中提到】

: from my personal experience, algorithm is relatively easy. Machine learning
: is pretty hard.
:
: use

v******s
发帖数: 51

啧啧，你老板为啥不招几个搞bioinfo的postdoc？
现在经济不好，连名校学stat的phd也都不好找工作，做bioinfo的
千老们遍地都是。和实验开销相比，他们的工资花不了几个钱；
当然如果和别人合作有其他的好处就另说了。

【在 s*********x 的大作中提到】

w******y
发帖数: 8040

这种混得最差
生物背景出身的要么搭个有干有湿的实验室还有点搞头
整纯干的就是以己之短
当然已经混成大牛的手里有极多资源的生物出身的那完全是另外一回事

【在 S**********l 的大作中提到】

o********r
发帖数: 775

靠，你以为sequencing一类的数据是一个千老甚至一个faculty就能对付的？一个lane
的数据可能就是100个G，你一个人咋分析？光那硬件就不是一个lab自己能解决的，这
类数据还真只能送专门的lab/facility分析。这里面工资真不是主要的开销。
当然，bioinfo成为一个core facility倒是好办法。

【在 v******s 的大作中提到】

: 啧啧，你老板为啥不招几个搞bioinfo的postdoc？
: 现在经济不好，连名校学stat的phd也都不好找工作，做bioinfo的
: 千老们遍地都是。和实验开销相比，他们的工资花不了几个钱；
: 当然如果和别人合作有其他的好处就另说了。

相关主题
● 生物paper到底有多少可信。	● 谁来谈谈现在bioinformatics的情况啊
● 纯吐槽：绝望的边缘	● 读Ph.D 的同时，有人会考虑花钱再读个master degree吗？
● bioinformatics吐下槽	● 求教转专业
进入Biology版参与讨论

w******y
发帖数: 8040

cloud computing
只要不到100美元/hr

lane

【在 o********r 的大作中提到】

: 靠，你以为sequencing一类的数据是一个千老甚至一个faculty就能对付的？一个lane
: 的数据可能就是100个G，你一个人咋分析？光那硬件就不是一个lab自己能解决的，这
: 类数据还真只能送专门的lab/facility分析。这里面工资真不是主要的开销。
: 当然，bioinfo成为一个core facility倒是好办法。

o********r
发帖数: 775

Bioinfo最主要的问题不在于方法，而是怎样找出有生物重要性的结果，这方面还是有
生物背景的容易处理。当然，如果目的是做发考题，纯粹整方法就是另外一回事了。可
是这类方法基本也就是AJHG之类的杂志，想上CNS很难。

【在 w******y 的大作中提到】

: 这种混得最差
: 生物背景出身的要么搭个有干有湿的实验室还有点搞头
: 整纯干的就是以己之短
: 当然已经混成大牛的手里有极多资源的生物出身的那完全是另外一回事

o********r
发帖数: 775

这么说吧，现在NFS系统对付这种数据都很容易崩溃，cloud用在这上面，还言之过早

【在 w******y 的大作中提到】

: cloud computing
: 只要不到100美元/hr
:
: lane

w******y
发帖数: 8040

你没看过Salzberg的GB paper?
人家就是给小实验室整的PC机水平的算法

【在 o********r 的大作中提到】

: 这么说吧，现在NFS系统对付这种数据都很容易崩溃，cloud用在这上面，还言之过早

w******y
发帖数: 8040

说的就是作发考题
如果是个data analyst,当然生物背景的好
CS出身的一是背景知识不够，二是好点的CS出身的谁会乐意去做bioinfo分析员

【在 o********r 的大作中提到】

: Bioinfo最主要的问题不在于方法，而是怎样找出有生物重要性的结果，这方面还是有
: 生物背景的容易处理。当然，如果目的是做发考题，纯粹整方法就是另外一回事了。可
: 是这类方法基本也就是AJHG之类的杂志，想上CNS很难。

o********r
发帖数: 775

忽悠，用处很局限

【在 w******y 的大作中提到】

: 你没看过Salzberg的GB paper?
: 人家就是给小实验室整的PC机水平的算法

o********r
发帖数: 775

方法其实也是bio的人容易出，现在的bioinfo在CS而言纯属初级阶段，没啥高深理论可
以用，倒是如何和实际问题结合更重要。
Biostat很多方法，看似用了很高深的stat方法，其实也是无病呻吟，前一阵子很火爆
的，范大牛很推崇的LASSO俺就觉得是无聊混funding的产品。

【在 w******y 的大作中提到】

: 说的就是作发考题
: 如果是个data analyst,当然生物背景的好
: CS出身的一是背景知识不够，二是好点的CS出身的谁会乐意去做bioinfo分析员

d******y
发帖数: 11545

真高深，我这纯做生物的还真看不懂。
关键是有几个实验室能用上这么复杂的东西，好像nsf对生物信息的支持力度并不太大
，而且由于不需要做benchwork，老美喜欢搞，想往faculty发展需要与他们直接竞争。
自我感觉做这行前途堪忧。

【在 o********r 的大作中提到】

: 方法其实也是bio的人容易出，现在的bioinfo在CS而言纯属初级阶段，没啥高深理论可
: 以用，倒是如何和实际问题结合更重要。
: Biostat很多方法，看似用了很高深的stat方法，其实也是无病呻吟，前一阵子很火爆
: 的，范大牛很推崇的LASSO俺就觉得是无聊混funding的产品。

e*****t
发帖数: 642

凡是做genomics的，哪个不做array和seq，很多老板都是半路出家。编程都不会。也不
知道那些实验室数据怎么分析的。我看还有比较古老的，居然用excel看array的数据。
他老人家要是想挑出一些基因，不得半个月的时间啦。
我们这前几年来的几个作bioinfo的faculty,很多人跟他合作，没办法，自己弄不会。
现在的趋势，生物的数据会越来越大，bioinfo 应该还是有饭吃的。

【在 d******y 的大作中提到】

:
: 真高深，我这纯做生物的还真看不懂。
: 关键是有几个实验室能用上这么复杂的东西，好像nsf对生物信息的支持力度并不太大
: ，而且由于不需要做benchwork，老美喜欢搞，想往faculty发展需要与他们直接竞争。
: 自我感觉做这行前途堪忧。

K****n
发帖数: 5970

wow.. for a bio institute, is it cheaper to own a data center or to rent
cloud services ah? I expect intense competition in cloud computing services,
its price should drop and drop (?)

【在 w******y 的大作中提到】

: 你没看过Salzberg的GB paper?
: 人家就是给小实验室整的PC机水平的算法

相关主题
● 求教转专业	● 硕士菜鸟生物wsn想转行度本科，求指教
● 今天又发了一篇JCP, 但是心里一点都开心不起来（一个化学博后内 (转载)	● STEM绿卡提案的影响
● 生物 PHD 报个转码工的 offer (转载)	● 一个人的价值体现在哪里？
进入Biology版参与讨论

K****n
发帖数: 5970

excel is actually a very sophisticated tool for data mining and machine
learning... maybe you misjudged the professor ;)

【在 e*****t 的大作中提到】

: 凡是做genomics的，哪个不做array和seq，很多老板都是半路出家。编程都不会。也不
: 知道那些实验室数据怎么分析的。我看还有比较古老的，居然用excel看array的数据。
: 他老人家要是想挑出一些基因，不得半个月的时间啦。
: 我们这前几年来的几个作bioinfo的faculty,很多人跟他合作，没办法，自己弄不会。
: 现在的趋势，生物的数据会越来越大，bioinfo 应该还是有饭吃的。

o********r
发帖数: 775

便宜可能还真是cloud便宜，现在花在硬件上的钱过个5年估计也都折旧了。不过时间也
是成本，要把海量的数据传送给cloud还指不定出啥大漏子呢。现在做哪个课题都在和
别人抢，晚了可能CNS就变成plos one，甚至压手里，所以多数人不会把希望放在cloud
上面。

services,

【在 K****n 的大作中提到】

: wow.. for a bio institute, is it cheaper to own a data center or to rent
: cloud services ah? I expect intense competition in cloud computing services,
: its price should drop and drop (?)

K****n
发帖数: 5970

Just read a report saying the fastest way for a bioinfo lab to deliver its
data to Amazon's cloud (never heard of it before) is to physcially mail a
hard drive, haha.
Could data security be a bigger concern than bandwidth?

cloud

【在 o********r 的大作中提到】

: 便宜可能还真是cloud便宜，现在花在硬件上的钱过个5年估计也都折旧了。不过时间也
: 是成本，要把海量的数据传送给cloud还指不定出啥大漏子呢。现在做哪个课题都在和
: 别人抢，晚了可能CNS就变成plos one，甚至压手里，所以多数人不会把希望放在cloud
: 上面。
:
: services,

o********r
发帖数: 775

别笑，估计寄硬盘还真是最快的，我们这里做sequencing的人一干活，整个NFS都得瘫
痪，平时5分钟读完的文件5小时都不一定能读下来，所以每次看到这些人都恨得牙痒痒。
至于安全性，我倒觉得没啥大问题，传送到cloud server的部分估计重重加密，信用卡
号能传，这些数据的密级相信不会更高，至于server送出去的估计就是一个个fragment
，就算别人看了也没啥用。没做过这方面研究，纯属瞎猜。

【在 K****n 的大作中提到】

: Just read a report saying the fastest way for a bioinfo lab to deliver its
: data to Amazon's cloud (never heard of it before) is to physcially mail a
: hard drive, haha.
: Could data security be a bigger concern than bandwidth?
:
: cloud

v******s
发帖数: 51

还好吧，我们lab现在就有一个学生物的人做rna-sequencing的数据分析，
用pc加上我们lab的一个小cluster，一直做得也挺好。

lane

【在 o********r 的大作中提到】

e*****t
发帖数: 642

人家要这种数据有什么用？又不是信用卡号。
你们没cluster吗，在local电脑run这种东西，别人就洗洗睡吧。

痒。
fragment

【在 o********r 的大作中提到】

: 别笑，估计寄硬盘还真是最快的，我们这里做sequencing的人一干活，整个NFS都得瘫
: 痪，平时5分钟读完的文件5小时都不一定能读下来，所以每次看到这些人都恨得牙痒痒。
: 至于安全性，我倒觉得没啥大问题，传送到cloud server的部分估计重重加密，信用卡
: 号能传，这些数据的密级相信不会更高，至于server送出去的估计就是一个个fragment
: ，就算别人看了也没啥用。没做过这方面研究，纯属瞎猜。

v******s
发帖数: 51

你说的大牛是Jianqing Fan？人家玩自己搞出来的SCAD

【在 o********r 的大作中提到】

o********r
发帖数: 775

靠，丫们就是把整个cluster给瘫痪了，而且是瘫痪IO，让你可以干simulation，就干
不了正活，只要一IO，立马比蜗牛还慢。

【在 e*****t 的大作中提到】

: 人家要这种数据有什么用？又不是信用卡号。
: 你们没cluster吗，在local电脑run这种东西，别人就洗洗睡吧。
:
: 痒。
: fragment

w******y
发帖数: 8040

Yes, I read that study too
it's funny, but it's real

【在 K****n 的大作中提到】

o********r
发帖数: 775

换汤不换药罢了，不就是换个penalty term，说白了以前biostat玩的东西都是经典的
统计问题，现在可好，数据都是超高纬的，啥经典理论都歇菜，然后大家一起捣腾东捣
腾西的，都说自己的好，咋好？在simulation中好，但是真实数据几个是符合他们的
assumption的？话说回来，这些用来申请grant特好。
要我说biostat自从array以后最大的贡献还是FDR，至少给bio的人一个理论基础去看更
多的positive hits。

【在 v******s 的大作中提到】

: 你说的大牛是Jianqing Fan？人家玩自己搞出来的SCAD

相关主题
● 大家好	● 两车碾烂女童 20人路过不屑一顾(ZZ)
● 基础研究和应用研究在中国	● 新PI们说说，是当新PI累还是当postdoc累？
● 最近非常郁闷	● 路在脚下（生化专业找州立学校AP经验之谈）
进入Biology版参与讨论

v******s
发帖数: 51

现在这些高通量数据分析的软件太多了，基本上R里面都有；
老板们真要想在自己lab搞，招个懂R的学生，看懂manual就可以
照葫芦画瓢了；关键是这样做不一定比同别人合作更有优势。
我老板就是专门和做实验的lab合作的，现在的情况就是别人吃肉
我们喝口汤，呵呵。

【在 e*****t 的大作中提到】

o********r
发帖数: 775

R其实挺折腾人，64bit的安装麻烦，特别是和bioconductor的兼容问题，但是大一点的
数据32bit立马歇菜，所以还是让专门的人合作比较快。

【在 v******s 的大作中提到】

: 现在这些高通量数据分析的软件太多了，基本上R里面都有；
: 老板们真要想在自己lab搞，招个懂R的学生，看懂manual就可以
: 照葫芦画瓢了；关键是这样做不一定比同别人合作更有优势。
: 我老板就是专门和做实验的lab合作的，现在的情况就是别人吃肉
: 我们喝口汤，呵呵。

K****n
发帖数: 5970

Is R open-sourced? maybe you can re-build it for 64-bit machines?

【在 o********r 的大作中提到】

: R其实挺折腾人，64bit的安装麻烦，特别是和bioconductor的兼容问题，但是大一点的
: 数据32bit立马歇菜，所以还是让专门的人合作比较快。

b****r
发帖数: 17995

bioinformatic 我觉得将来市场一定很好的，我们系里最近就一直要招人，但是就是招
不到合适的。几年之内很多分子生物学的东西都将会是海量的data，特别是RNA seq
DNAseq，而做分子生物的没有几个懂这个
我也是做实验的，不过我觉得这种东西是不是将来适合国际合作，在中国招一群计算机
本科生来现学现做这个应该成本低多了。纯粹瞎想，各位砖家拍砖吧。

o********r
发帖数: 775

是open source，读别人的code本身就是件苦差事，另外这个dependency也折腾人，你
要一层一层的去理解，等你一个人都compile完了黄花菜都凉了。做这个纯CS的人在行
，所以还是分工合作最迅速。现在这种海量数据下一个lab想从实验到分析都包圆越来
越困难，不是不可能，就是效率太低。

【在 K****n 的大作中提到】

: Is R open-sourced? maybe you can re-build it for 64-bit machines?

K****n
发帖数: 5970

ah... i think i understand what you mean.
'Build' does not require reading code though. For example visual studio
allows you to build against x86 (default) or 64-bit machines. I think only
x86 has the memory consumption limit of 2-3 GB

【在 o********r 的大作中提到】

: 是open source，读别人的code本身就是件苦差事，另外这个dependency也折腾人，你
: 要一层一层的去理解，等你一个人都compile完了黄花菜都凉了。做这个纯CS的人在行
: ，所以还是分工合作最迅速。现在这种海量数据下一个lab想从实验到分析都包圆越来
: 越困难，不是不可能，就是效率太低。

v******s
发帖数: 51

嗯，biostat方面最近几年也有越来越多的人做比如small n large p的问题，
但是现在紧跟生物技术发展潮流的是bioinformatics。
原因一方面我觉得是你说的，stat的经典理论不适用于现在的high
dimensional data；另外一个方面是stat的研究偏重理论上的研究，
而bioinfo偏重应用。比如搞bioinfo的人写个算法就可以拿来用
然后发文章，只要它好使；但是搞stat的人不经过证明肯定不敢
这么做，呵呵。

【在 o********r 的大作中提到】

: 换汤不换药罢了，不就是换个penalty term，说白了以前biostat玩的东西都是经典的
: 统计问题，现在可好，数据都是超高纬的，啥经典理论都歇菜，然后大家一起捣腾东捣
: 腾西的，都说自己的好，咋好？在simulation中好，但是真实数据几个是符合他们的
: assumption的？话说回来，这些用来申请grant特好。
: 要我说biostat自从array以后最大的贡献还是FDR，至少给bio的人一个理论基础去看更
: 多的positive hits。

y***i
发帖数: 11639

另一方面，bioinfo里瞎搞的人都是计算机，统计出身的。很多东西虚张声势，背后
漏洞很多，一边忽悠做生物的一边骗钱。哥伦比亚那个做network的就是典型。

典的
东捣
看更

【在 v******s 的大作中提到】

: 嗯，biostat方面最近几年也有越来越多的人做比如small n large p的问题，
: 但是现在紧跟生物技术发展潮流的是bioinformatics。
: 原因一方面我觉得是你说的，stat的经典理论不适用于现在的high
: dimensional data；另外一个方面是stat的研究偏重理论上的研究，
: 而bioinfo偏重应用。比如搞bioinfo的人写个算法就可以拿来用
: 然后发文章，只要它好使；但是搞stat的人不经过证明肯定不敢
: 这么做，呵呵。

d****h
发帖数: 4291

应该这么说，灌水发文章，打工找个差事的话，bioinfo相对容易一些，比千老也许好点
但是申请课题，要想做老板的话，bioinfo基本上很难，即使你灌了很多水
回国忽悠更是难上加难
benchwork虽说多数都可能作成千老
撇开发考题不说，要是堆点paper攒点人脉，回国忽悠，还是很有搞头

v******s
发帖数: 51

个人观点是从生物学发展的现状来看，还不能够支撑从系统角度对
生命现象的研究。当然这个是从发展普遍性的方法和技术角度来讲，
打个比方来说，现在的工业科技水平能够支撑载人航天的发展，但是
在中国古代就不可能，虽然那个时候就有人用炮竹和板凳上了天。
现在systems biology在国内外都非常热，国内有的学校已经开设了
系统生物学系，所以这个说法肯定有人不同意，呵呵。从上个世纪末期
开始的bioinformatics到现在的systems biology，对当代生物学的真正
贡献只能靠后人去评价了。

【在 y***i 的大作中提到】

: 另一方面，bioinfo里瞎搞的人都是计算机，统计出身的。很多东西虚张声势，背后
: 漏洞很多，一边忽悠做生物的一边骗钱。哥伦比亚那个做network的就是典型。
:
: 典的
: 东捣
: 看更

相关主题
● neverthink是个好同学。。。	● 纯吐槽：绝望的边缘
● 由饶毅email再谈nature事件反应过度	● bioinformatics吐下槽
● 生物paper到底有多少可信。	● 谁来谈谈现在bioinformatics的情况啊
进入Biology版参与讨论

k*****o
发帖数: 1486

re...
真的是这样。。还有那些apple上那些巨老的软件。。从来没有升级过，data的容量都
有限，自己从来不干体力活，数据分析都靠手下。
最可气的是你想用某方法分析序列，不知道用什么软件/插件，他也肯定不会知道；唯
一的希望就是上网自己找，或者问其他薄厚。
否则就要手动分析，有的时候屏幕盯久了眼泪哗哗往下流。。。：-（
但是人家就是idea牛逼，问题问得好，然后发牛逼paper，换了普通学生或者postdoc就
是想不到。

【在 e*****t 的大作中提到】

v******s
发帖数: 51

totally agree.

好点

【在 d****h 的大作中提到】

: 应该这么说，灌水发文章，打工找个差事的话，bioinfo相对容易一些，比千老也许好点
: 但是申请课题，要想做老板的话，bioinfo基本上很难，即使你灌了很多水
: 回国忽悠更是难上加难
: benchwork虽说多数都可能作成千老
: 撇开发考题不说，要是堆点paper攒点人脉，回国忽悠，还是很有搞头

B*W
发帖数: 46

兄台，能借你图标一用否？

【在 b****r 的大作中提到】

: bioinformatic 我觉得将来市场一定很好的，我们系里最近就一直要招人，但是就是招
: 不到合适的。几年之内很多分子生物学的东西都将会是海量的data，特别是RNA seq
: DNAseq，而做分子生物的没有几个懂这个
: 我也是做实验的，不过我觉得这种东西是不是将来适合国际合作，在中国招一群计算机
: 本科生来现学现做这个应该成本低多了。纯粹瞎想，各位砖家拍砖吧。

c*******n
发帖数: 300

bioinfo回国忽悠的也不少。认识有去好学校做教授的，基金不少。也有开公司的自己
做CEO的。

好点

【在 d****h 的大作中提到】

b****r
发帖数: 17995

你ID都比我牛逼的大了，连图标也不能比我差啊

【在 B*W 的大作中提到】

:
: 兄台，能借你图标一用否？

o********r
发帖数: 775

现在network很热，以前那个rosetta被Merck兼并后现在又分出来Sage，就是做
bionetwork。

【在 y***i 的大作中提到】

v***n
发帖数: 123

Bioinformatics deals with the analysis of genetic data, mostly in research
domain. If you study Medicalinformatics,you can look for job in hospitals.

p******n
发帖数: 874

不是吧，你不用.net给我用excel做个SVM,弄个graphical model看看？

【在 K****n 的大作中提到】

: excel is actually a very sophisticated tool for data mining and machine
: learning... maybe you misjudged the professor ;)

K****n
发帖数: 5970

很ft...瞧你举这俩例子。简单的如pca，略微麻烦的如GP，可能更合适一些
不过我确实不明白为什么.net很重要，C# open source code多么？
另外做data mining，用excel确实比c++和c#基础和常见

【在 p******n 的大作中提到】

: 不是吧，你不用.net给我用excel做个SVM,弄个graphical model看看？

K****n
发帖数: 5970

而且仔细想了想，NN 和 graphical model应该是最无所谓用什么写的了吧

【在 p******n 的大作中提到】

: 不是吧，你不用.net给我用excel做个SVM,弄个graphical model看看？

相关主题
● 谁来谈谈现在bioinformatics的情况啊	● 今天又发了一篇JCP, 但是心里一点都开心不起来（一个化学博后内 (转载)
● 读Ph.D 的同时，有人会考虑花钱再读个master degree吗？	● 生物 PHD 报个转码工的 offer (转载)
● 求教转专业	● 硕士菜鸟生物wsn想转行度本科，求指教
进入Biology版参与讨论

p******n
发帖数: 874

你没明白我，.net（以前叫VBA)是Excel开发的语言，你可以自己写一个SVM,
graphical model库的。不过显然不是用来干这事情的。反正我真没见过多少用excel做
data mining的。估计是学术界的人都排斥MS,大家都用其他了。

o********r
发帖数: 775

做microarry分析很著名的SAM软件就是Excel界面的。

【在 p******n 的大作中提到】

: 你没明白我，.net（以前叫VBA)是Excel开发的语言，你可以自己写一个SVM,
: graphical model库的。不过显然不是用来干这事情的。反正我真没见过多少用excel做
: data mining的。估计是学术界的人都排斥MS,大家都用其他了。

K****n
发帖数: 5970

哥，其实，.NET是比尔盖茨参与开发的，微软搞的库...我记得今年夏天MS已经
released到4.0了
吧。当然也可能学术界的人只知道微软有windows和office，所以没有排斥.net
8g地说，Basic和.net一般被用来证明比盖的计算机软件设计能力出神入化，呵呵

【在 p******n 的大作中提到】

K****n
发帖数: 5970

哦，也可以算Excel开发的吧。
洗洗睡了

【在 K****n 的大作中提到】

: 哥，其实，.NET是比尔盖茨参与开发的，微软搞的库...我记得今年夏天MS已经
: released到4.0了
: 吧。当然也可能学术界的人只知道微软有windows和office，所以没有排斥.net
: 8g地说，Basic和.net一般被用来证明比盖的计算机软件设计能力出神入化，呵呵

r****t
发帖数: 10904

R was not opensourced? I thought it's under GPL since the beginning.

【在 K****n 的大作中提到】

: Is R open-sourced? maybe you can re-build it for 64-bit machines?

r****t
发帖数: 10904

C# 小 project 不少 opensource, 加上 mono 的

【在 K****n 的大作中提到】

: 很ft...瞧你举这俩例子。简单的如pca，略微麻烦的如GP，可能更合适一些
: 不过我确实不明白为什么.net很重要，C# open source code多么？
: 另外做data mining，用excel确实比c++和c#基础和常见

(共1页)

进入Biology版参与讨论

相关主题
● neverthink是个好同学。。。	● 今天又发了一篇JCP, 但是心里一点都开心不起来（一个化学博后内 (转载)
● 由饶毅email再谈nature事件反应过度	● 生物 PHD 报个转码工的 offer (转载)
● 生物paper到底有多少可信。	● 硕士菜鸟生物wsn想转行度本科，求指教
● 纯吐槽：绝望的边缘	● STEM绿卡提案的影响
● bioinformatics吐下槽	● 一个人的价值体现在哪里？
● 谁来谈谈现在bioinformatics的情况啊	● 大家好
● 读Ph.D 的同时，有人会考虑花钱再读个master degree吗？	● 基础研究和应用研究在中国
● 求教转专业	● 最近非常郁闷

相关话题的讨论汇总
话题: bioinfo话题: cs话题: data话题: cloud

#	版面	帖数(主题数)
-	全站	4871 (796)
1	Military	3777 (569)
2	Stock	341 (51)
3	Joke	117 (17)
4	History	116 (3)
5	Automobile	100 (9)
6	USANews	55 (9)
7	Midlife	45 (1)
8	Headline	41 (41)
9	Dreamer	33 (13)
10	FleaMarket	32 (20)
11	Living	30 (7)

boards

未名新帖统计// 7月16日

历史上的今天