由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Biology版 - 问个人基因组测序的问题
相关主题
谁能讲讲de novo assembly?简单介绍 Bioinformatics Tools for NGS 分析
现在测序哪家强?能不能找蓝翔啊Crowd Sourcing
请推荐微生物基因组测序gap closure服务的公司问一个如何确定“Indel"的问题,能用deep sequencing吗?
深度测序的精确度会随被测的目的基因改变吗?重复韩春雨的工作,测序也不是标准
mouse的ChIPseq结果却map到human基因组,咋回事?呼吁仇子龙公开测序数据
含有indel的reads怎么比对?有个直接测序crispr-cas9的indel的方法
学术问题:另一个我?Mitbbs水平挺高的,纯从科学家角度质疑韩春雨
【包子求助】call SNPs 有哪些工具??版上有谁用过或知道Knome这个公司吗?
相关话题的讨论汇总
话题: assembly话题: novo话题: 基因组话题: variation话题: 测序
进入Biology版参与讨论
1 (共1页)
R*********e
发帖数: 53
1
如果病人样品做全基因组测序,是不是都得从头拼接?
为什么?
谢谢
c*********r
发帖数: 1312
2
这个问题我也很感兴趣,期待版上高人回答。
我的理解,人跟人之间的基因组的差异还是有一些,尤其是病人的话,大家肯定想找出
差异。如果简单的把序列map到reference genome上边,有些差异比如SNP,小的indel
还是可以找得到,但是很多复杂的差异,大片段的indel、invertion什么的,也许就不
太容易找到了。
这里有篇很好的2015年的nature review:Genetic variation and the de novo
assembly of human genomes
“Short-read massively parallel sequencing has revolutionized our ability to
discover genetic variation but is insufficient to generate high-quality
genome assemblies or resolve most structural variation. Full resolution of
variation is only guaranteed by complete de novo assembly of a genome. ”
所以我觉得de novo assembly和长片段的测序会更有优势。
g*****n
发帖数: 250
3
哪是“头”?
r**********e
发帖数: 587
4
de novo assembly,我觉得对于全基因组,很难,计算机运算的耗费太大
过去尝试过一下,好像最基础的都需要very big RAM, 比如一个node需要256GB的RAM
, 这个对于一般学校很难有这样的大型运算cluster
另外,如果reads很短,纵然你做assembly也会很难,因为overlap的区域很短。
所以high-quality long reads还是我们要等待的革命性技术。
推荐一个很好的assembler-based SV calling: http://cortexassembler.sourceforge.net/
现在比较实际的是,用其他办法找到的SV或SNP candidate,然后做local assembly来
精确breakpioint,计算量大大大大大降低
以后long reads出现或者普及,我们就少了很多BWA的那种multiple alignment的麻烦
,不管mapping还是assembly都可行
当然了,对于novel insertion,这种ref里没有的sequence,当然assembly是王道。目
前short reads对于novel big insertion基本是一点办法都没有。
Anyway未来high-quality high-throughput long reads出现,基因组学会有新革命,
会迅速产生大量疾病遗传上的新发现
当然我也很久很久没接触过assembly,难免信息落后偏颇,希望高人指正

indel
to

【在 c*********r 的大作中提到】
: 这个问题我也很感兴趣,期待版上高人回答。
: 我的理解,人跟人之间的基因组的差异还是有一些,尤其是病人的话,大家肯定想找出
: 差异。如果简单的把序列map到reference genome上边,有些差异比如SNP,小的indel
: 还是可以找得到,但是很多复杂的差异,大片段的indel、invertion什么的,也许就不
: 太容易找到了。
: 这里有篇很好的2015年的nature review:Genetic variation and the de novo
: assembly of human genomes
: “Short-read massively parallel sequencing has revolutionized our ability to
: discover genetic variation but is insufficient to generate high-quality
: genome assemblies or resolve most structural variation. Full resolution of

c*********r
发帖数: 1312
5
是的,de novo assembly对计算要求太高,数据要全部load到内存里,所以特别吃内存
,瓶颈不在CPU。
要是搞生物信息的和CS的能开发出更快速、准确、对硬件要求低的算法就好了。

RAM

【在 r**********e 的大作中提到】
: de novo assembly,我觉得对于全基因组,很难,计算机运算的耗费太大
: 过去尝试过一下,好像最基础的都需要very big RAM, 比如一个node需要256GB的RAM
: , 这个对于一般学校很难有这样的大型运算cluster
: 另外,如果reads很短,纵然你做assembly也会很难,因为overlap的区域很短。
: 所以high-quality long reads还是我们要等待的革命性技术。
: 推荐一个很好的assembler-based SV calling: http://cortexassembler.sourceforge.net/
: 现在比较实际的是,用其他办法找到的SV或SNP candidate,然后做local assembly来
: 精确breakpioint,计算量大大大大大降低
: 以后long reads出现或者普及,我们就少了很多BWA的那种multiple alignment的麻烦
: ,不管mapping还是assembly都可行

1 (共1页)
进入Biology版参与讨论
相关主题
版上有谁用过或知道Knome这个公司吗?mouse的ChIPseq结果却map到human基因组,咋回事?
bioinformatics吐下槽含有indel的reads怎么比对?
贡献一个SNP/Indel calling pipeline学术问题:另一个我?
有谁谈谈从零开始学NGS数据分析都需要具备什么知识?【包子求助】call SNPs 有哪些工具??
谁能讲讲de novo assembly?简单介绍 Bioinformatics Tools for NGS 分析
现在测序哪家强?能不能找蓝翔啊Crowd Sourcing
请推荐微生物基因组测序gap closure服务的公司问一个如何确定“Indel"的问题,能用deep sequencing吗?
深度测序的精确度会随被测的目的基因改变吗?重复韩春雨的工作,测序也不是标准
相关话题的讨论汇总
话题: assembly话题: novo话题: 基因组话题: variation话题: 测序