w*****1 发帖数: 473 | 1 【 以下文字转载自 DataSciences 讨论区 】
发信人: wz99331 (dotti), 信区: DataSciences
标 题: 如何把1个文件分成22个以chromosone为单位的文件
发信站: BBS 未名空间站 (Mon Mar 31 18:19:51 2014, 美东)
我想用merlin做gwas,结果说内存不够,问了作者,建议把我的ped 文件分成22个文
件,每个chromosome一个文件。请问plink里面有命令可以把包括22个chromosome的
ped file和map file分成以每个chromosome为单位的22个子文件吗?
另外分成22个后,如何产生merlin 需要的.dat file呢?谢谢! |
S******y 发帖数: 1123 | 2 can you share some sample data here?
Python may be up to the task...
【在 w*****1 的大作中提到】 : 【 以下文字转载自 DataSciences 讨论区 】 : 发信人: wz99331 (dotti), 信区: DataSciences : 标 题: 如何把1个文件分成22个以chromosone为单位的文件 : 发信站: BBS 未名空间站 (Mon Mar 31 18:19:51 2014, 美东) : 我想用merlin做gwas,结果说内存不够,问了作者,建议把我的ped 文件分成22个文 : 件,每个chromosome一个文件。请问plink里面有命令可以把包括22个chromosome的 : ped file和map file分成以每个chromosome为单位的22个子文件吗? : 另外分成22个后,如何产生merlin 需要的.dat file呢?谢谢!
|
a*******7 发帖数: 772 | 3 试试这个:
http://watson.hgen.pitt.edu/docs/mega2_html/mega2.html
【在 w*****1 的大作中提到】 : 【 以下文字转载自 DataSciences 讨论区 】 : 发信人: wz99331 (dotti), 信区: DataSciences : 标 题: 如何把1个文件分成22个以chromosone为单位的文件 : 发信站: BBS 未名空间站 (Mon Mar 31 18:19:51 2014, 美东) : 我想用merlin做gwas,结果说内存不够,问了作者,建议把我的ped 文件分成22个文 : 件,每个chromosome一个文件。请问plink里面有命令可以把包括22个chromosome的 : ped file和map file分成以每个chromosome为单位的22个子文件吗? : 另外分成22个后,如何产生merlin 需要的.dat file呢?谢谢!
|
w*****1 发帖数: 473 | 4 这是.ped file: 一共3000多行,几十万列,包括22个chromosome的snps
没有head:
101001 10100100 10100101 10100102 1 0.83880973 0 0 C C C T...
101001 10100101 0 0 1 0 C C C G C C...
101001 10100102 0 0 2 0 C T G G C C ..
101001 10100103 10100101 10100102 1 -0.307705011 C C C G C T ..
101001 10100104 10100101 10100102 2 -0.530048238 T T G G C C ..
101001 10100105 10100101 10100102 1 -1.086252879 C T C G C T ..
.
.
.
还有.map file:
1 rs9629043 0 554636
1 rs11510103 0 557616
1 rs12565286 0 711153
1 rs12082473 0 730720
1 rs3094315 0 742429
1 rs2286139 0 751595
1 rs2980319 0 766985
1 rs2980300 0 775852
1 rs11240777 0 788822
1 rs3748597 0 878522
.
.
. |
w********m 发帖数: 1137 | |
H**n 发帖数: 43 | 6 UNIX?
it should be very easy
for i in {1..22}; do plink --file yourfile --chr ${i} --recode --out
yourfile_chr${i}; done |
z******n 发帖数: 397 | 7 use option --chr
【在 w*****1 的大作中提到】 : 这是.ped file: 一共3000多行,几十万列,包括22个chromosome的snps : 没有head: : 101001 10100100 10100101 10100102 1 0.83880973 0 0 C C C T... : 101001 10100101 0 0 1 0 C C C G C C... : 101001 10100102 0 0 2 0 C T G G C C .. : 101001 10100103 10100101 10100102 1 -0.307705011 C C C G C T .. : 101001 10100104 10100101 10100102 2 -0.530048238 T T G G C C .. : 101001 10100105 10100101 10100102 1 -1.086252879 C T C G C T .. : . : .
|