由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Biology版 - 问个whole exome capture之后出来的data要怎么分析
相关主题
请教Bioinformatics职业规划~~~新手请教CNV caller
版上有谁用过或知道Knome这个公司吗?Bioinformatics招人 提供refer
bioinformatics吐下槽制药公司招生物信息Senior Information Scientist
bioinformatics postdoc poition($35,000 - $40,000)$399 75x on-target CLIA certified Whole Exome Sequencing
该转到computational bio领域吗下一代技术测序分析结果需要会什么软件技术?
小白弱问几个术语请问现在bioinfo薄厚一般是什么价钱阿?
贡献一个SNP/Indel calling pipelineNextSeq 500 Desktop Sequencer
有谁谈谈从零开始学NGS数据分析都需要具备什么知识?NGS数据分析,合作研究
相关话题的讨论汇总
话题: 分析话题: exome话题: data话题: 然后
进入Biology版参与讨论
1 (共1页)
w*****i
发帖数: 54
1
我到另外一个实验室去问了,可是没听懂
大概是图像识别,把图像转换成序列,basecalling(这个用中文怎么说?),然后过滤
掉街头,文件转换格式,然后align,然后发现variation...等等
一个印度人跟我讲的,实在没听懂,问问这里有没有人详细的给我说说?
d*******e
发帖数: 1649
2
you need someone help you go through all of these.

【在 w*****i 的大作中提到】
: 我到另外一个实验室去问了,可是没听懂
: 大概是图像识别,把图像转换成序列,basecalling(这个用中文怎么说?),然后过滤
: 掉街头,文件转换格式,然后align,然后发现variation...等等
: 一个印度人跟我讲的,实在没听懂,问问这里有没有人详细的给我说说?

A*****n
发帖数: 243
3
你要是作exome sequencing的话,一般来说你不用关心图像识别,basecalling这些阶
段的,
如果是facility作的测序,他们会提供fastq序列文件,从这里开始分析就可以了。
如果是outsource到华大什么测序的话,他们一般会在fastq序列的基础上提供一些初步
的分析结果。

【在 w*****i 的大作中提到】
: 我到另外一个实验室去问了,可是没听懂
: 大概是图像识别,把图像转换成序列,basecalling(这个用中文怎么说?),然后过滤
: 掉街头,文件转换格式,然后align,然后发现variation...等等
: 一个印度人跟我讲的,实在没听懂,问问这里有没有人详细的给我说说?

n******7
发帖数: 12463
4
假设你是solexa,拿到fastq,有时候可能要预处理,trim一下,然后用bowtie/BWA
align到reference genome,然后找个工具call SNP/indel什么的,据说现在最好的
caller是dindel
e*******e
发帖数: 1837
5
You can take a look at the article "Best Practice Variant Detection with the GATK" from the Broad Institute http://www.broadinstitute.org/gsa/wiki/index.php/Best_Practice_Variant_Detection_with_the_GATK_v2#Initial_read_mapping. This should give you some idea about how to proceed.
Honestly, if you have no experience with NGS data analysis and there is nobody to guide you, it could take months before you get anywhere.
Good luck.

【在 w*****i 的大作中提到】
: 我到另外一个实验室去问了,可是没听懂
: 大概是图像识别,把图像转换成序列,basecalling(这个用中文怎么说?),然后过滤
: 掉街头,文件转换格式,然后align,然后发现variation...等等
: 一个印度人跟我讲的,实在没听懂,问问这里有没有人详细的给我说说?

w******y
发帖数: 8040
6
最简单的办法:花钱请人分析
硬件和系统维护, pipeline里参数的理解和选择,pipeline的优缺点
对不是专门做这个的都不是件容易的事

【在 w*****i 的大作中提到】
: 我到另外一个实验室去问了,可是没听懂
: 大概是图像识别,把图像转换成序列,basecalling(这个用中文怎么说?),然后过滤
: 掉街头,文件转换格式,然后align,然后发现variation...等等
: 一个印度人跟我讲的,实在没听懂,问问这里有没有人详细的给我说说?

p*******s
发帖数: 516
7
"图像识别,把图像转换成序列" =》 sequencing
align => mapping
basecalling => SNV & Indel detection

【在 w*****i 的大作中提到】
: 我到另外一个实验室去问了,可是没听懂
: 大概是图像识别,把图像转换成序列,basecalling(这个用中文怎么说?),然后过滤
: 掉街头,文件转换格式,然后align,然后发现variation...等等
: 一个印度人跟我讲的,实在没听懂,问问这里有没有人详细的给我说说?

e****e
发帖数: 3450
8
有人推荐么?
我最近也在处理大量NGS数据,我们的bioinformatician不得力阿

【在 w******y 的大作中提到】
: 最简单的办法:花钱请人分析
: 硬件和系统维护, pipeline里参数的理解和选择,pipeline的优缺点
: 对不是专门做这个的都不是件容易的事

d*******j
发帖数: 64
9
哪个公司的分析服务比较好?BGI分析的结果似乎不大好,很多都无法验证

【在 w******y 的大作中提到】
: 最简单的办法:花钱请人分析
: 硬件和系统维护, pipeline里参数的理解和选择,pipeline的优缺点
: 对不是专门做这个的都不是件容易的事

o****e
发帖数: 37
10
www.data2bio.com

【在 d*******j 的大作中提到】
: 哪个公司的分析服务比较好?BGI分析的结果似乎不大好,很多都无法验证
相关主题
小白弱问几个术语新手请教CNV caller
贡献一个SNP/Indel calling pipelineBioinformatics招人 提供refer
有谁谈谈从零开始学NGS数据分析都需要具备什么知识?制药公司招生物信息Senior Information Scientist
进入Biology版参与讨论
e****e
发帖数: 3450
11
ft, $200/lane, I can do it in several hrs, and still do my experiment on the
bench

【在 o****e 的大作中提到】
: www.data2bio.com
A*****n
发帖数: 243
12
如果自己不会编程的话
至少可以先试试galaxy或者broad的gene pattern中的NGS模块

【在 e****e 的大作中提到】
: 有人推荐么?
: 我最近也在处理大量NGS数据,我们的bioinformatician不得力阿

g**********t
发帖数: 475
13
让你老板把bioinformatician给炒了,雇一个给力的。关键是要有经验,没经验白瞎。

【在 e****e 的大作中提到】
: 有人推荐么?
: 我最近也在处理大量NGS数据,我们的bioinformatician不得力阿

w*****i
发帖数: 54
14
这几天忙,上来看到这么多回复真感动。。。
谢谢大家提供的信息
我拿到手的是.bcl的文件,我现在已经知道用BCLConveter 转成.qseq files. 然后再
creating sequence files from the .qseq files。接下来怎么做就不知道了。。。估
计如大家所说的,我要自学成才没有几个月不行的
同鄙视华大 据说,我也是听说他们给的结果验证不出来。这个是测序问题呢还是结果
分析的问题呢
w*****i
发帖数: 54
15
不好意思,bowtie/BWA 是啥意思? call是啥意思啊?

【在 n******7 的大作中提到】
: 假设你是solexa,拿到fastq,有时候可能要预处理,trim一下,然后用bowtie/BWA
: align到reference genome,然后找个工具call SNP/indel什么的,据说现在最好的
: caller是dindel

d*******e
发帖数: 1649
16
这些东西,三言两语说不清楚。如果真的要学,自己去看这些软件的主页吧。
要完全自己动手的话,最好具备以下的条件:
1 有能够提供并行运算的服务器,单机运行不现实
2 基于1,要会基本的linux命令和习惯command-line interface
3 会写简单的script,去处理数据和提交任务
如果不行,最好找人带着做,否则很花时间。

【在 w*****i 的大作中提到】
: 不好意思,bowtie/BWA 是啥意思? call是啥意思啊?
m***T
发帖数: 11058
17
bowite/BWA是alignment工具。如果你连这两个软件和call的意思都不明白,那你离真
正能自己分析data还有相当的距离。建议你找个这方面的人带带你,即可入门,也可
少走些弯路。

【在 w*****i 的大作中提到】
: 不好意思,bowtie/BWA 是啥意思? call是啥意思啊?
A*****n
发帖数: 243
18
你们不会是自己实验室有hiseq机器吧?连bcl这一步都得自己做?
这样的话有钱买仪器,更应该有钱买软件或者培训人啦。
华大的数据质量不清楚,不过几个大公司sequencing倒都是外包到华大,然后自己做后
续分析的。

【在 w*****i 的大作中提到】
: 这几天忙,上来看到这么多回复真感动。。。
: 谢谢大家提供的信息
: 我拿到手的是.bcl的文件,我现在已经知道用BCLConveter 转成.qseq files. 然后再
: creating sequence files from the .qseq files。接下来怎么做就不知道了。。。估
: 计如大家所说的,我要自学成才没有几个月不行的
: 同鄙视华大 据说,我也是听说他们给的结果验证不出来。这个是测序问题呢还是结果
: 分析的问题呢

w*****i
发帖数: 54
19
谢谢大家。。。我们实验室是新买了hiseq,目前还在调试,主要是样本处理这一阶段。
结果分析说是要找人合作的,估计老板正在找吧,还没人做。我就一步一步学着该怎么
做。这个我是一点基础都没有,做bench work倒是不在话下。看大家给我介绍的这些,
我。。。我还是放弃了吧。。。
M*****n
发帖数: 16729
20
靠,大家一窝蜂都上hiseq了
1 (共1页)
进入Biology版参与讨论
相关主题
NGS数据分析,合作研究该转到computational bio领域吗
一半实验一半生物信息求选择建议小白弱问几个术语
现在测序facility的主流计算还是CPU吗贡献一个SNP/Indel calling pipeline
BGI的paper怎么老是挂这么多人啊有谁谈谈从零开始学NGS数据分析都需要具备什么知识?
请教Bioinformatics职业规划~~~新手请教CNV caller
版上有谁用过或知道Knome这个公司吗?Bioinformatics招人 提供refer
bioinformatics吐下槽制药公司招生物信息Senior Information Scientist
bioinformatics postdoc poition($35,000 - $40,000)$399 75x on-target CLIA certified Whole Exome Sequencing
相关话题的讨论汇总
话题: 分析话题: exome话题: data话题: 然后