f*********8 发帖数: 165 | 1 我有两组数据:
data1有两个variable:location, Pvalue (900 obs)
data2有两个variable: start, end (10 observations)
我想比较location是否在start和end之间,如果是的话data就merge到一起,如果多个
location在同一个start-end区间,这些location的Pvalue就用来算Mean Pvalue.其他
不在任何start-end区间的location就删除。
请问这个应该怎末coding?多谢了。 |
g*******y 发帖数: 380 | 2 每个location只有唯一对应的区间吗?你的十个区间互不重叠?还有你想要的是什么?
10个区间各自的mean P-value? |
q**j 发帖数: 10612 | 3 proc sql.
【在 f*********8 的大作中提到】 : 我有两组数据: : data1有两个variable:location, Pvalue (900 obs) : data2有两个variable: start, end (10 observations) : 我想比较location是否在start和end之间,如果是的话data就merge到一起,如果多个 : location在同一个start-end区间,这些location的Pvalue就用来算Mean Pvalue.其他 : 不在任何start-end区间的location就删除。 : 请问这个应该怎末coding?多谢了。
|
l*******l 发帖数: 204 | 4 proc sql;
create table xxx as
select * from data1 as a
join data2 as b
on a.start<=b.location<=a.end;
quit; |