抗体或结合蛋白通常被设计成“结合得越紧越好”。但在一些应用中理想分子并不是始终保持高亲和力而是需要根据所处环境改变结合状态在血液和细胞表面的 pH 7.4 条件下结合靶标进入 pH 5.06.0 的内体后释放靶标随回收受体重新返回细胞表面开始下一轮捕获。这种“中性结合、酸性释放”的特性是 recycling antibody、sweeper antibody、LYTAC 和催化型胞外蛋白降解剂实现多轮作用的重要基础。David Baker 团队在《Computational design of pH-sensitive binders》中尝试回答一个关键问题能否不再依赖大规模随机 His 扫描而是直接从结构和物理机制出发把 pH 敏感性计算设计进蛋白质作者最终建立了两条互补路线界面去稳定化在结合界面引入酸性条件下产生静电排斥的 His单体去稳定化在结合蛋白内部植入由 His 参与的埋藏电荷网络。研究在 EphA2、TNFR2、TNFα、IL-6、PCSK9 和 Neo2 等多个靶标上获得了酸性条件下加速解离的结合蛋白并进一步将其用于构建可循环利用的催化型 LYTAC。需要注意的是上传的论文版本是2025年9月29日发布的 bioRxiv 预印本尚未经过同行评议。一、为什么 His 是 pH 敏感设计的核心残基组氨酸侧链咪唑基的 pKa 通常接近 66.5正好位于生理 pH 与内体酸性 pH 之间。在 pH 7.4 附近His 多数处于中性状态当 pH 下降到 56 时His 更容易质子化并获得 1 电荷。质子化会带来两类变化。1. 氢键角色发生改变中性 His 可以同时作为氢键供体氢键受体。质子化后His 仍可以提供氢键但通常不再能够作为氢键受体。因此一个在 pH 7 下依赖 His 接受氢键的相互作用在低 pH 条件下可能被破坏。2. 静电相互作用发生改变质子化 His 带正电。如果其附近存在 Arg、Lys 或另一个质子化 His就可能出现正—正静电排斥。这篇文章最重要的认识之一是pH 敏感性并不由 His 的数量决定而由 His 所处的几何位置、氢键角色、埋藏程度及其周围电荷环境共同决定。作者最初只是提高 ProteinMPNN 生成序列中的 His 比例虽然成功获得了 His 含量更高的结合蛋白却几乎没有获得明显的 pH 敏感性。这个失败促使团队转向机制驱动的设计。二、论文的总体方法流程整套设计流程可以概括为确定靶标和目标表位 ↓ RFdiffusion生成结合蛋白骨架 ↓ ProteinMPNN设计序列 ↓ AlphaFold2复合物结构过滤 ↓ 两轮partial diffusion优化骨架 ↓ 选择pH敏感机制 ┌───────────────┴───────────────┐ 界面His-阳离子排斥 内部埋藏His电荷网络 ↓ ↓ Rosetta低pH评估 PyRosetta搜索可植入网络 ↓ ↓ ProteinMPNN/Rosetta局部重设计 ↓ AF2、Rosetta和能量过滤 ↓ 酵母展示或SPR实验筛选 ↓ SPR/BLI双pH动力学验证 ↓ LYTAC细胞功能验证这不是单纯用一个 AI 模型生成序列而是将RFdiffusion 的骨架生成能力ProteinMPNN 的序列设计能力AlphaFold2 的结构一致性评估Rosetta 的物理能量计算酵母展示、SPR 和 BLI 实验组合成一条“深度学习生成—物理机制过滤—实验验证”的完整路线。三、第一阶段先获得高质量的亲本结合蛋白研究首先利用 RFdiffusion 为 EphA2、IL-6、PCSK9 和 Neo2 等靶标设计亲本结合蛋白。1. RFdiffusion骨架生成针对每个设计任务作者初始生成500010000个骨架利用目标蛋白上的 hotspot residues 指定结合区域将结合蛋白引导到目标表面的特定位置。RFdiffusion在这里解决的是“结合蛋白应该采用什么三维骨架接近靶标”的问题。2. ProteinMPNN序列设计针对每个骨架使用 ProteinMPNN 设计氨基酸序列使序列能够稳定折叠到目标骨架并形成预期的蛋白—蛋白界面。3. AlphaFold2初筛作者采用带有 initial guess 和 target templating 的 AlphaFold2不使用 MSA靶标结构保持固定主要预测新设计 binder 是否能够维持预期构象及结合模式。第一轮过滤条件为pae_interaction 20通过这一条件的设计进入 partial diffusion。4. 两轮partial diffusion优化作者对初筛通过的模型进行两轮partial diffusion → ProteinMPNN序列重设计 → AlphaFold2结构预测最终保留条件为pae_interaction 8pLDDT 88随后使用 Rosetta FastRelax 优化结构并进一步根据Rosetta binding ddGSAP score即表面疏水斑块相关指标进行过滤。论文正文没有给出 ddG 和 SAP score 的统一数值阈值因此这两个参数更像是针对不同靶标进行综合排序而不是采用一个公开的固定 cutoff。四、路线一在结合界面引入酸性条件下的静电排斥1. 从“增加His数量”转向“设计His环境”作者首先对 EphA2 和 PCSK9 结合蛋白进行全局 His 偏置设计但结果表明His 数量增加pH 敏感性并没有同步增强。因此作者开始重点寻找两类界面 His在 pH 7 下充当氢键受体在低 pH 下质子化并与靶标侧的 Arg、Lys 或 His 产生排斥。2. ProteinMPNN的His偏置参数对经过 partial diffusion 的 EphA2 和 TNFR2 结合蛋白ProteinMPNN 设置了三种 His bias0.51.01.5。生成序列后仍按照以下标准筛选pae_interaction 8pLDDT 88不同 His bias 用来控制生成序列中 His 的倾向但并不直接规定最终必须包含多少个 His。3. Rosetta如何构建“低pH结构”作者使用 Rosetta 的 pH module将所有 His 强制设置为双质子化状态。主要参数是pH:pH_mode True pH:pH_value 0 e_pH weight 100需要特别解释的是pH_value0并不意味着作者认为实际内体 pH 为0也不是在 pH 0 条件下做实验。这是一个计算上的极端设置其目的是强制所有 His 进入双质子化、带 1 电荷的状态从而清楚地区分“中性 His”和“质子化 His”带来的静电及氢键差异。实验验证仍然是在 pH 5.4、5.5、6.0 或6.4条件下进行。这种建模方式相当于一个二态模型pH 7状态His以中性状态为主低pH状态His全部视为质子化。它便于高通量筛选但并没有显式计算每一个 His 的真实微环境 pKa。4. pH score如何构建作者最初设计了一个经验性的 pH score统计跨链 His 氢键并根据以下因素赋予不同权重因素权重逻辑蛋白表面氢键基础权重1蛋白核心氢键表面权重的3倍与主链形成氢键再乘2His同时形成两条氢键再乘3低pH双质子化His形成双供体作用赋予更高权重完整评分中最高权重为18对应位于蛋白核心与另一条链主链形成作用同时形成两个氢键的 His。这一评分的基本假设是埋藏氢键比表面氢键对结合稳定性影响更大与主链形成的氢键通常更加稳定His质子化前后氢键角色变化越大越可能产生 pH 响应。不过后续大规模数据表明单纯统计氢键变化还不够静电排斥才是更关键的预测变量。5. dddG_elec低pH静电变化指标作者原本尝试比较ddG(pH 5) - ddG(pH 7)但发现总 ddG 中包含较大的范德华能和结构重排噪声。因此他们只保留 Rosetta 的fa_elec项建立dddG_elec ddG_elec(pH 5) - ddG_elec(pH 7)其含义是dddG_elec 0低 pH 下界面静电作用变得更不利数值越大His 质子化引起的排斥越明显。在改进后的 TNFR2 设计流程中候选分子的主要条件包括dddG_elec ≥ 0至少存在一个 His在高 pH 结构中接受来自阳离子残基的氢键低 pH 时该 His 质子化并产生氢键破坏或正电排斥。研究还枚举了 His、Arg、Lys 的侧链 rotamer并记录 His—阳离子残基之间的最短非氢原子距离。不过正文没有给出统一的距离 cutoff。五、界面设计的实验筛选流程1. EphA2酵母展示筛选作者将设计序列导入 EBY-100 酵母。首先进行表达筛选anti-Myc-FITC检测蛋白是否成功展示SAPE检测抗原结合Sony SH800流式分选。主要筛选流程为表达分选SAPE1:100anti-Myc-FITC1:100室温孵育30分钟分选FITC阳性细胞。初始结合分选EphA2浓度1 μM分选PE/FITC双阳性细胞。去除亲和素多价效应先用 EphA2 孵育清洗后再加入 SAPE以减少 avidity 对结果的影响。双pH滴定筛选EphA2浓度分别为100 nM10 nM1 nM。对比条件为pH 7.4pH 5.5。不同亚群随后通过下一代测序确定序列。结果部分的SPR验证使用pH 5.4因此论文中“酵母筛选pH 5.5”和“动力学验证pH 5.4”属于两个相近但略有不同的实验条件。2. SPR参数SPR使用 Biacore 8K主要参数包括靶标采用生物素化蛋白使用 Biotin CAPture Kit 捕获靶标捕获流速10 μL/min捕获水平250400 RU分析物进样流速30 μL/min缓冲液McIlvaine buffer 0.05% Tween-20比较pH5.4和7.4动力学模型1:1 Langmuir采用全局拟合获得kon、koff和KD。高通量初筛中亲和力优于200 nM的设计会被放大表达并进行进一步表征。3. BLI酸性释放实验BLI用于模拟真实内吞过程先在pH 7.4下结合 → 再切换到pH 5.4下观察解离主要参数为链霉亲和素传感器生物素化靶蛋白50 nM装载响应阈值0.6 nm缓冲液McIlvaine 0.05% Tween-20 1% BSA。不同靶标的binder浓度为靶标Binder浓度EphA2100 nMTNFα100 nMIL-6100 nMPCSK9250 nMNeo232 nMkoff使用 Octet Analysis 软件进行 partial local fit。这个实验比单独测量两个 pH 下的 KD 更接近实际应用因为药物是在细胞外中性环境结合靶标随后才进入酸性内体。六、路线二在蛋白内部植入埋藏的His电荷网络界面设计存在两个限制靶标界面必须有合适的 Arg、Lys 或 His修改界面可能损失原有亲和力、特异性或跨物种反应性。因此作者提出第二种方法不重点修改结合界面而是在 binder 内部植入一个酸性条件下不稳定的“结构开关”。1. PyRosetta搜索可植入位点作者编写 PyRosetta 脚本为所有可能位置生成His rotamerArg rotamerLys rotamer。利用与 MonteCarlo HBNet 类似的思路构建氢键图并搜索His–HisHis–ArgHis–Lys之间可能形成的氢键组合。对每一对位置保留 Rosetta 氢键能最优的 rotamer输出独立PDB记录氢键能记录残基位于 core、boundary、surface 还是 interface使用 AtomicDepth 计算氢键原子距离分子表面的深度。氢键埋藏深度定义为两个参与氢键的原子到分子表面深度的平均值。作者还开发了第二个脚本在已有 His 对附近继续搜索第三个可形成氢键的残基从而构建三残基网络。2. ProteinMPNN约束下的Rosetta FastDesign植入His网络后需要重新设计周围残基以解决空腔、碰撞和局部折叠不稳定问题。作者先利用 ProteinMPNN 计算条件概率使用--conditional_probs_only若某氨基酸的 log conditional probability 低于-2.5则不允许 Rosetta 选择该氨基酸。随后使用两类局部重设计策略。策略一邻域重设计允许设计的空间范围分别为5 Å5.5 Å6 Å。为了避免序列变化过大对亲本氨基酸给予能量奖励−1 kcal/mol−2 kcal/mol−3 kcal/mol。因此共有3种空间范围 × 3种亲本序列奖励构成多个独立设计轨迹。策略二逐位点强制枚举对距离 His 网络小于6 Å的每一个位置将每一种 ProteinMPNN 允许的氨基酸依次强制放入再重新设计其余6 Å邻域。这种方法计算量更大但有利于找到能与 His 网络形成更紧密堆积的局部序列。3.最终结构过滤ProteinMPNN/Rosetta重设计后再利用AF2预测结构并要求PAE interaction 与亲本相当或更优interface RMSD 与亲本相当或更优主要 His–His、His–Arg 或 His–Lys 氢键能小于−0.5 kcal/molHis网络在预测结构中仍能保持预期几何构象。此外作者将网络残基替换为 Gly作为能量基线用于判断 His 网络自身是否真正提供有利相互作用。七、主要结果两条路线分别取得了什么效果1. 界面静电排斥路线靶标测试规模主要结果EphA2酵母展示筛选12000个设计获得4个pH敏感设计最强者在pH 5.4下结合减弱约1000倍TNFR2测试43个设计42个可表达6个在pH 5.4下结合减弱超过2倍最强者减弱122倍EphA2的早期流程虽然找到了非常强的pH响应分子但代价是筛选规模很大12000个设计中只有4个明显命中。结构分析发现4个EphA2命中分子的共同特征不是单纯存在His—氢键而是Binder侧His靠近靶标侧ArgHis质子化后出现正电排斥。在 EphA2_pH_1 中His15、His19 和 His22 与靶标 Arg 的相关距离分别约为3.7 Å7.6 Å4.9 Å。突变回溯实验显示His15和His19对pH敏感性的贡献最大。整合 EphA2 和 TNFR2 数据后作者发现所有 pH 敏感设计都至少包含两个 His—阳离子接触EphA2设计最多达到11个TNFR2设计最多达到8个。这支持了论文的核心结论对于酸性释放型结合蛋白His质子化产生的静电排斥可能比单纯的His氢键断裂更重要。2. 内部埋藏电荷网络路线靶标测试结果最强pH效应TNFα72个设计中48个保留结合7个KD优于25 nM其中3个pH敏感pH 5.4下减弱79倍IL-6测试36个设计8个具有pH敏感性减弱约6倍PCSK9测试40个32个保留优于25 nM的亲和力7个pH敏感减弱约3.5倍Neo2测试48个2个表现出明确pH敏感性pH 6.0下减弱超过2倍TNFα最优设计包含一个埋藏的 His–His 网络在 pH 5.4 下亲和力下降79倍同时解离速率明显加快。IL-6设计中一个His–Lys网络位于binder内部但靠近结合界面。将其中His或Lys破坏后pH依赖性消失说明设计的网络确实是pH响应来源而不是偶然的远端突变效应。多数设计的SEC曲线仍以单体峰为主仅有少数出现轻微二聚体峰说明植入埋藏电荷网络并没有普遍破坏蛋白的整体可溶性和单体状态。八、功能验证将pH敏感binder变成催化型LYTAC获得pH敏感性并不是论文的终点。作者进一步验证这些binder能否真正提高胞外蛋白降解效率。1.设计逻辑LYTAC同时连接靶蛋白binder溶酶体转运受体binder。作者使用IGF2R作为溶酶体转运受体并设计了pH不敏感的IGF2R binder——IRigd1。理想工作过程是细胞表面pH 7.4 LYTAC同时结合IGF2R和靶蛋白 ↓ 内吞进入内体 ↓ pH下降到约5.5 ↓ 靶蛋白从pH敏感binder上脱落 ↓ 靶蛋白进入溶酶体降解 ↓ LYTAC仍与IGF2R结合并被回收 ↓ 重新开始下一轮捕获如果靶蛋白不能在内体中释放LYTAC自身也会随靶标一起被降解只能实现近似化学计量作用引入pH敏感释放后理论上可以实现一分子LYTAC处理多分子靶蛋白。2. Protein G–LYTAC作者首先将pH敏感Protein G与IRigd1融合用于内吞IgG。实验条件包括IgG100 nMHEK293T细胞处理24小时。pH敏感Protein G–LYTAC在低于IgG浓度的条件下仍表现出较强内吞说明其具有亚化学计量作用倾向。3. EphA2–LYTACpH敏感EphA2 minibinder与IRigd1融合后在HCT116MDA-MB-231两种肿瘤细胞中均获得了比普通LYTAC更强的EphA2降解。主要实验参数为蛋白处理浓度250 nM处理时间24小时流式检测细胞表面EphA2Western blot检测总EphA2和p-EphA2 Ser897。从论文图4可以看到pH-LYTAC处理后HCT116总EphA2约降至对照的14%MDA-MB-231总EphA2约降至对照的23%HCT116中p-EphA2 Ser897约降至对照的37%。在washout实验中细胞处理24小时后洗去外源LYTAC再培养6小时。普通LYTAC的降解效果明显恢复而pH-LYTAC仍能维持较强的EphA2降低支持其能够被回收并实现多轮作用。加入50 nM Bafilomycin A1抑制内体/溶酶体酸化后EphA2降解显著减弱说明这种增强作用依赖酸化的内吞—溶酶体通路。4. IL-6–LYTAC作者还使用pH敏感IL-6 binder构建IL-6 LYTAC。实验条件为IL-650 nMLYTAC100、10或1 nMK562细胞处理24小时。即使在10 nM或1 nM LYTAC、明显低于50 nM IL-6的亚化学计量条件下pH-IL-6-LYTAC仍表现出比普通IL-6-LYTAC更强的内吞信号。这说明pH响应不仅适用于膜蛋白降解也可能用于循环中高丰度分泌蛋白的催化清除。细胞实验通常进行了3次独立重复以均值±标准误表示并采用非配对双尾t检验。九、这篇文章最重要的贡献是什么1.证明“增加His数量”并不是有效设计原则过去的pH抗体工程往往从His扫描开始将界面残基逐个突变成His → 在两个pH下测试 → 从大量克隆中寻找命中本文则证明His是否有效取决于是否靠近带正电残基是氢键供体还是受体是否处于埋藏环境质子化后是否产生排斥周围结构是否允许其保持目标构象。因此真正需要设计的不是“His残基”而是一个完整的His微环境。2.把深度学习生成和物理机制结合起来RFdiffusion和ProteinMPNN擅长生成可折叠、高亲和力的蛋白但默认目标并不包含pH响应性。Rosetta则可以显式处理质子化状态静电能氢键rotamer残基埋藏程度。论文展示了一种具有代表性的组合方式深度学习负责搜索大规模结构与序列空间物理模型负责把候选分子推向目标功能。3.提出了两条适用场景不同的路线界面静电排斥路线更适合靶标表面存在Arg、Lys或His可以接受对结合界面进行调整希望获得幅度较大的酸性释放效应。埋藏电荷网络路线更适合原有结合界面已经优化成熟不希望破坏亲和力和特异性靶标表面缺少合适的阳离子残基Binder具有足够大的稳定核心。十、需要注意的局限性1.这项研究主要是minibinder而不是完整IgG抗体论文证明的是pH敏感的de novo结合蛋白和Protein G而不是完整抗体Fab或IgG。这些原则理论上可以迁移到抗体但仍需要评估CDR构象VH–VL稳定性Fab热稳定性聚集倾向多价效应Fc相关药代动力学免疫原性。因此不能简单地把minibinder上的His网络直接复制到抗体CDR中。2.低pH计算模型较为理想化Rosetta中将His全部设为双质子化是一种适合高通量筛选的二态近似但真实蛋白中不同His的pKa不同埋藏程度会显著改变pKa邻近Asp、Glu、Arg和Lys也会改变质子化概率pH变化可能伴随更复杂的构象重排。后续设计可以进一步引入pKa预测constant-pH MDPoisson–Boltzmann计算多质子化微状态采样。3.多数强效结果针对pH 5.4而不是肿瘤pH 6.5EphA2、TNFR2和TNFα的强效pH窗口主要位于pH 7.4pH 5.4。这更适合“细胞表面结合—内体释放”。肿瘤微环境通常约为pH 6.56.8。如果目标是设计肿瘤选择性激活抗体就需要进一步移动His的有效pKa使开关发生在更接近6.5的位置。作者也指出未来需要通过调整His周围残基对pKa和pH切换阈值进行更精细控制。结语David Baker团队的这项研究并不是简单提供了一个新的His扫描工具而是重新定义了pH敏感蛋白的设计对象pH敏感性不是某个氨基酸的属性而是一个由质子化、氢键、静电作用、埋藏程度和结构稳定性共同形成的局部能量网络。研究给出了两条清晰的工程路线在界面布置酸性条件下产生排斥的His—阳离子相互作用在蛋白内部植入酸性条件下失稳的His电荷网络。更重要的是作者证明这些设计不仅能在SPR或BLI中表现出pH依赖性还能真正改善LYTAC的循环利用和亚化学计量降解。从抗体工程角度看这项工作的价值在于它把pH敏感设计从“随机突变后筛选”推进到了“先定义物理机制再定向生成和验证”的阶段。未来无论是设计抗原清除抗体、回收型抗体、条件激活双抗还是催化型胞外降解剂这套方法都提供了一条值得借鉴的计算设计框架。