多个组的融合
PLS vs SNF vs MOFA多变量方法本质区别1. 一句话总览PLS 监督学习X → YSNF 网络融合样本相似性MOFA 无监督潜变量模型机制因子2. 核心区别总表方法PLSSNFMOFA学习类型监督学习无监督学习无监督学习核心目标最大化 X-Y 相关性构建样本相似性网络提取潜在因子结构输入X Y多数据矩阵多组学矩阵输出components loadingssimilarity network clusterslatent factors单位变量层样本层因子层是否预测是否否是否聚类否是可是否机制解释部分否较强3. PLSPartial Least Squares本质寻找 X 与 Y 之间最大协方差的低维表示形式X → latent components (T)Y → latent components (U)输出latent componentsloadings变量权重sample scores作用建立“暴露组合 → 结局组合”关系特点有监督强共线性友好适合暴露组学4. SNFSimilarity Network Fusion本质融合多数据构建“样本相似性网络”输入多组学 / 多模态数据输出sample-sample similarity networkpatient clusters作用找人群亚型subtypes特点无监督不建 X→Y强调“人群结构”5. MOFAMulti-Omics Factor Analysis本质概率型潜变量模型factor model输入多组学矩阵X1, X2, X3…输出latent factors潜在因子factor loadings跨组学权重因子类型shared factors跨数据specific factors单数据作用发现隐藏生物机制轴特点无监督机制解释能力强不做预测6. 三者核心差异理解PLS问题X如何影响Y结果暴露模式 ↔ 结局模式SNF问题谁和谁相似结果人群网络 亚型MOFA问题数据背后的潜在机制是什么结果潜在因子结构7. 在暴露组学中的对应应用PLS多暴露 → 多结局找暴露模式SNF暴露 临床数据找疾病亚型MOFA暴露 炎症 组学找机制因子轴8. 一句话总结PLS 预测结构SNF 人群结构MOFA 机制结构