Loading... # SMR summary data-based Mendelian randomization (SMR),[参考文献](https://www.nature.com/articles/ng.3538) ## 回顾MR的原理 如果一个基因变异Z 是某个暴露因素X的因果变量,并且对结果Y没有直接因果关系,那么这个基因变异Z与结果Y的关联,只能通过X对Y的因果关系而被观察到(X->Y)。 ### 两阶段最小二乘法 通常我们可以用两阶段最小二乘法(2SLS,2 stage least squared method)来估计X对Y的效应: 考虑一种最简单的单样本的情况,有一个基因变异Z,与Z相关的因素X,以及与Z不相关的结果Y, 我们想探究X与Y之间的因果关系。 第一阶段,X对工具变量进行回归,$X=\mu_1+\gamma IV+\epsilon_1$; 第二阶段,Y对第一阶段X的预测值进行回归,$Y=\mu_2+\beta_{2SLS}\hat{X}+\epsilon_2$ 合并后可以化为Y直接对工具变量进行回归,$X=\mu_3+\rho IV+\epsilon_3$ 我们所关心的系数β2SLS实际上也等同于两段协方差的比值$\dfrac{Cov_{y,z}}{Cov_{x,z}}$ ### 两样本MR 另一种常见的情况则是两样本MR,如果我们有一个与X相关联的工具变量,我们只有在X对Y有因果关系的情况下,才能观测到这个工具变量与Y的关联。 这意味着βiv,y = βiv,x 乘以 βx,y。也就是说,我们可以不用通过X与Y的回归来估计β, 而是可以简单地通过 βx,y = βiv,y / βiv,x 来计算 X对Y的效应量。 这就意味着与两阶段最小二乘法相对,我们可以利用两个独立的GWAS 的概括性统计量来计算这个比值。这种方法通常叫做两样本MR. ## SMR的原理 设$y$是性状,即outcome,$x$为基因表达,即exposure,$z$为遗传变异,如SNP,即工具变量IV,则$b_{xy}$为$x$对$y$的效应量(为$y$的斜率在$x$的遗传效应上回归),$b_{zx}$是$z$对$x$的影响,并且$b_{zy}$是$z$对$y$的影响,在MR中,$B_{xy}$(定义为$b_{xy} = \frac{b_{zy}}{b_{zx}}$)即为$x$对$y$的影响,不包含非遗传混杂因素。在因果关系的假设下,遗传变异$z$对性状$y$的影响是由基因表达$x$介导的;或在多效性的假设下,遗传变异$z$对性状$y$和基因表达$x$两者均具有直接影响。这两种情况下,SMR等同于MR分析 最后修改:2024 年 02 月 02 日 © 允许规范转载 赞 如果觉得我的文章对你有用,请随意赞赏