A*******e 发帖数: 284 | 1 简单一点说吧,处理和对照,每个40000万reads.如果处理组的rpkm为1.0, 对照组为0
或者远低于1.0。这个数据有效吗? 该如何理解? 我的一种理解是这个表达量都太低
了,直接认为该基因在该tissue里面没有表达,从而不在该tissue里发挥功能。但是问
题又来了,往往一些很重要的基因表达量还挺低的。
rpkm为多少可以认为有效表达?现在journal有无比较公认的数值?请推荐paper或讨论
。多谢! |
s******s 发帖数: 13035 | 2 你能不能折算成transcripts/cell,这样就容易看了。
为0
【在 A*******e 的大作中提到】 : 简单一点说吧,处理和对照,每个40000万reads.如果处理组的rpkm为1.0, 对照组为0 : 或者远低于1.0。这个数据有效吗? 该如何理解? 我的一种理解是这个表达量都太低 : 了,直接认为该基因在该tissue里面没有表达,从而不在该tissue里发挥功能。但是问 : 题又来了,往往一些很重要的基因表达量还挺低的。 : rpkm为多少可以认为有效表达?现在journal有无比较公认的数值?请推荐paper或讨论 : 。多谢!
|
P*********y 发帖数: 41 | 3 First, you need biological replicates to get statistical significance. This
is required by most journals (especially high-profile). Second, 400M reads
per sample are overkill. For expression analysis, 5-10M mappable reads are
enough.
I don't think there is a standard cutoff RPKM value. It's arbitrary.
为0
【在 A*******e 的大作中提到】 : 简单一点说吧,处理和对照,每个40000万reads.如果处理组的rpkm为1.0, 对照组为0 : 或者远低于1.0。这个数据有效吗? 该如何理解? 我的一种理解是这个表达量都太低 : 了,直接认为该基因在该tissue里面没有表达,从而不在该tissue里发挥功能。但是问 : 题又来了,往往一些很重要的基因表达量还挺低的。 : rpkm为多少可以认为有效表达?现在journal有无比较公认的数值?请推荐paper或讨论 : 。多谢!
|
t*d 发帖数: 1290 | 4 如果这个基因你很感兴趣,用qpcr 做一次。如果不是很感兴趣,就不要费这个事了。
为0
【在 A*******e 的大作中提到】 : 简单一点说吧,处理和对照,每个40000万reads.如果处理组的rpkm为1.0, 对照组为0 : 或者远低于1.0。这个数据有效吗? 该如何理解? 我的一种理解是这个表达量都太低 : 了,直接认为该基因在该tissue里面没有表达,从而不在该tissue里发挥功能。但是问 : 题又来了,往往一些很重要的基因表达量还挺低的。 : rpkm为多少可以认为有效表达?现在journal有无比较公认的数值?请推荐paper或讨论 : 。多谢!
|
h**********t 发帖数: 545 | |
j*p 发帖数: 411 | 6 1. RPKM = 1 约等于 1 copy/cell. 同样是rpkm=1,如果这个是从100M reads出来的,
可信度比从10M来的高。同时,RPKM=1可以通过单细胞FISH验证。
2. qPCR 灵敏度比100M RNAseq高,能够validate RPKM=0.1左右,就是cycle要多些。
3. 即使没有replicate,也可以做统计,cufflinks, DESeq 都有这样的选项(简单的
fisher-exact test),但得出的pvalue显然没有那些有replicate的来得靠谱。
4. 做表达量的时候,通常会用 log2(RPKM+1),然后做fold change的时候,会用log2
的差,+1既是为了去0,避免fold change = 无穷大,也是为了减少对那些表达量很小
的RNA的fold change的over estimation。 |
n*********4 发帖数: 99 | 7 '5-10M mappable reads are enough' for bacteria. It is too low for eukaryotic
organisms like human.
This
【在 P*********y 的大作中提到】 : First, you need biological replicates to get statistical significance. This : is required by most journals (especially high-profile). Second, 400M reads : per sample are overkill. For expression analysis, 5-10M mappable reads are : enough. : I don't think there is a standard cutoff RPKM value. It's arbitrary. : : 为0
|
n*********4 发帖数: 99 | 8 cufflinks is not reliable tool. Go for DESeq.
One replicate is way too unreliable to draw any statisics conclusion.
log2
【在 j*p 的大作中提到】 : 1. RPKM = 1 约等于 1 copy/cell. 同样是rpkm=1,如果这个是从100M reads出来的, : 可信度比从10M来的高。同时,RPKM=1可以通过单细胞FISH验证。 : 2. qPCR 灵敏度比100M RNAseq高,能够validate RPKM=0.1左右,就是cycle要多些。 : 3. 即使没有replicate,也可以做统计,cufflinks, DESeq 都有这样的选项(简单的 : fisher-exact test),但得出的pvalue显然没有那些有replicate的来得靠谱。 : 4. 做表达量的时候,通常会用 log2(RPKM+1),然后做fold change的时候,会用log2 : 的差,+1既是为了去0,避免fold change = 无穷大,也是为了减少对那些表达量很小 : 的RNA的fold change的over estimation。
|
t*d 发帖数: 1290 | 9 Excellent. Thank you!
log2
【在 j*p 的大作中提到】 : 1. RPKM = 1 约等于 1 copy/cell. 同样是rpkm=1,如果这个是从100M reads出来的, : 可信度比从10M来的高。同时,RPKM=1可以通过单细胞FISH验证。 : 2. qPCR 灵敏度比100M RNAseq高,能够validate RPKM=0.1左右,就是cycle要多些。 : 3. 即使没有replicate,也可以做统计,cufflinks, DESeq 都有这样的选项(简单的 : fisher-exact test),但得出的pvalue显然没有那些有replicate的来得靠谱。 : 4. 做表达量的时候,通常会用 log2(RPKM+1),然后做fold change的时候,会用log2 : 的差,+1既是为了去0,避免fold change = 无穷大,也是为了减少对那些表达量很小 : 的RNA的fold change的over estimation。
|
d********i 发帖数: 113 | 10 1 rpkm = 1 read per million reads per 1kb gene, 这个不等于1 copy/cell
log2
【在 j*p 的大作中提到】 : 1. RPKM = 1 约等于 1 copy/cell. 同样是rpkm=1,如果这个是从100M reads出来的, : 可信度比从10M来的高。同时,RPKM=1可以通过单细胞FISH验证。 : 2. qPCR 灵敏度比100M RNAseq高,能够validate RPKM=0.1左右,就是cycle要多些。 : 3. 即使没有replicate,也可以做统计,cufflinks, DESeq 都有这样的选项(简单的 : fisher-exact test),但得出的pvalue显然没有那些有replicate的来得靠谱。 : 4. 做表达量的时候,通常会用 log2(RPKM+1),然后做fold change的时候,会用log2 : 的差,+1既是为了去0,避免fold change = 无穷大,也是为了减少对那些表达量很小 : 的RNA的fold change的over estimation。
|
l**********1 发帖数: 5204 | 11 Mark!
archatea and eubacterial might =2 copy/cell or even more
【在 d********i 的大作中提到】 : 1 rpkm = 1 read per million reads per 1kb gene, 这个不等于1 copy/cell : : log2
|
s******s 发帖数: 13035 | 12 差不多一个数量级吧。不同的细胞可能差个几倍
【在 d********i 的大作中提到】 : 1 rpkm = 1 read per million reads per 1kb gene, 这个不等于1 copy/cell : : log2
|
A*******e 发帖数: 284 | 13 多谢多谢,受教了!
请问
RPKM = 1 约等于 1 copy/cell, 这个是怎么估算出来的?
4. 做表达量的时候,通常会用 log2(RPKM+1), 这里有什么reference可用吗?
log2
【在 j*p 的大作中提到】 : 1. RPKM = 1 约等于 1 copy/cell. 同样是rpkm=1,如果这个是从100M reads出来的, : 可信度比从10M来的高。同时,RPKM=1可以通过单细胞FISH验证。 : 2. qPCR 灵敏度比100M RNAseq高,能够validate RPKM=0.1左右,就是cycle要多些。 : 3. 即使没有replicate,也可以做统计,cufflinks, DESeq 都有这样的选项(简单的 : fisher-exact test),但得出的pvalue显然没有那些有replicate的来得靠谱。 : 4. 做表达量的时候,通常会用 log2(RPKM+1),然后做fold change的时候,会用log2 : 的差,+1既是为了去0,避免fold change = 无穷大,也是为了减少对那些表达量很小 : 的RNA的fold change的over estimation。
|
a*****g 发帖数: 543 | 14 100m reads的时候 10fpkm以下算low expression
10-30之间正常表达
如果单个基因很低 没啥意义
focus on the one you can measure and change |