基于eQTL数据库研究基因和疾病因果关系流程
链接简析基因 - EzyGene 生物信息分析平台第一步注册一个github网站通过GitHub · Change is constant. GitHub keeps you ahead. · GitHub进入官网找到右上角的sign up,点击后如下按照要求依次填上相关信息点击下面绿色框Create account完成注册第二步从OpenGWAS获取token信息通过链接进入网站点击API下面的API account docs进入如下界面点击Sign in with Github,输入刚才注册的github账号后进入如下界面找到Token界面点击Reset后在value一行显示出你的token将其复制下来得到你的token第三步打开简析基因官网输入你得到的token通过简析基因 - EzyGene 生物信息分析平台进入简析基因官网在上方的云平台找到转录组点击进入后找到孟德尔随机化后点击第一个基于eQTL数据库研究基因和疾病因果关系进入后的界面如下在输入token上将原本的token删除输入你自己刚才复制得到token第四步输入结局变量打开 OpenGWAS 进入Gwas网站在Datasets下点击Explore datasets进入如下界面以乳腺癌为例我们想要搜索的结局变量是乳腺癌那我们就在Trait这一列输入breast cancer 进行搜索如图所示得到的都是乳腺癌的数据挑选我们所需要的那组乳腺癌数据在前面找到它的编号如ieu-a-1168,填写在结局变量一行中第五步在上传关注的基因集一栏中上传你所挑选出的基因上传的基因文档如下图所示文件使用TXT格式将文档上传后在后续的选项中我们通常将筛选与暴露因素强相关的snp的p阈值设置为5*10^-8(0.00000005),点击提交得到结果第六步结果解读按照上述操作后我们得到的结果可以在历史任务中看到结果点击下载得到压缩包打开压缩包得到结果如图所示孟德尔随机化分析的森林图1.横轴X轴标注为“MR effect size for DBH on Breast cancer”即“DBH对乳腺癌的孟德尔随机化效应量”。这个效应量通常是指基因预测的DBH水平每增加一个单位时乳腺癌发生风险的对数比值比log(OR)或β系数。横轴上的数值图中显示范围为-0.2到0.2表示效应量的大小——正值提示DBH水平升高可能增加乳腺癌风险负值提示可能降低风险0表示无因果效应。2.中心参考线在效应量为0的位置通常会有一条垂直的虚线图中虽未明确画出但标准森林图均有此线它是无效线。如果某个研究估计值的置信区间跨过这条线说明该估计在统计学上不显著P0.05。3.点估计中央方块图中应有一个方块或圆点其位置对应横轴上的某个数值代表本次MR分析得到的效应量点估计值即最可能的真实效应大小。方块的大小通常反映该估计值的精度标准误越小方块越大但本图简化版可能未体现。4.误差线横线穿过方块的横向线段代表95%置信区间CI。它的长度表示效应量估计的不确定性——线段越长说明结果越不精确若整条线段完全位于0的同一侧全为正或全为负则通常认为效应在统计学上显著P0.05。5.图中的具体数值本例中图下方只显示了“0.2 0.0 0.2”的刻度表明横轴范围从-0.2到0.2。您需要找到方块的中心位置比如假设在0.05附近及其置信区间例如从-0.03到0.13。如果该区间包含0则不能认为DBH对乳腺癌有显著的因果效应如果全部在0的右侧则提示DBH升高可能增加乳腺癌风险。6.标题信息“Breast cancer (GWAS) || id:ieu-a-1168”指明了乳腺癌的遗传关联数据来源——这是来自公开GWAS数据库如IEU OpenGWAS的特定数据集ID为ieu-a-1168确保结果的溯源性和可重复性。孟德尔随机化散点图这是一张孟德尔随机化Mendelian Randomization, MR散点图用于评估原发性胆汁性胆管炎PBC与胃癌Gastric cancer之间是否存在遗传层面的因果关联。为了让您轻松看懂我为您分步解读1. 这张图想回答什么问题它想探究如果一个人携带了“易患胆汁性胆管炎”的基因变异是否也会增加或降低他患胃癌的风险即 PBC 对胃癌是否具有因果推动作用。2. 坐标轴怎么看每个点代表什么X 轴横轴表示每个工具变量SNP对“原发性胆汁性胆管炎”的遗传效应大小即该基因让人更易得 PBC 的程度。Y 轴纵轴表示同一个SNP 对“胃癌”的遗传效应大小。图中的每一个小圆点代表一个独立的 SNP基因位点。如果一个点在图中明显偏离中心说明该基因同时影响两种疾病。3. 图中的五条线五种方法怎么看图例中的五种颜色/线条IVW、MR Egger、Weighted median 等是五种不同的统计学回归模型。核心看“斜率倾斜度”如果线条呈明显向上的趋势正斜率说明“易患 PBC”的基因效应越大患胃癌的风险也越高提示 PBC增加胃癌风险如果向下倾斜负斜率则提示 PBC降低胃癌风险如果线条基本水平斜率接近 0则提示两者没有明确的因果关系。主要参考 IVW逆方差加权图中通常将 IVW 作为主要结果若标注为首位它相当于综合所有 SNP 后给出的“最终平均因果效应”。4. 如何快速判断结果是否可靠看所有点是否大致沿着某条线分布。如果五种方法的线方向高度一致例如都是正斜率说明结论稳健。如果各条线方向互相冲突例如 IVW 向上MR Egger 向下则说明可能存在基因多效性即这些基因通过其他未知通路影响胃癌导致结果不可靠。