AG真人(中国)官网AppStore 用匹兹堡大学的"温度路子"指示法, 让AI透顶读懂分子的"跳舞言语"

发布日期：2026-06-10 21:44 来源：未知作者：admin 浏览次数：

AG真人(中国)官网AppStore 用匹兹堡大学的"温度路子"指示法，让AI透顶读懂分子的"跳舞言语"

这项由匹兹堡大学狡计与系统生物学系及CMU-Pitt狡计生物学博士花样蚁合完成的有谋划，以预印本步地于2026年6月发布在arXiv平台，编号为arXiv:2605.31498v2，感兴味的读者可通过该编号查阅原文。

**一段对于分子"舞步"的困惑**

每一种分子，不管是药物分子照旧卵白质，都在延续地通顺——它们扭转、迂回、振动，就像舞台上永延续歇的舞者。这些舞步的法规，决定了分子能不行和某个卵白质联接，能不行施展药效，致使决定了它在东说念主体内的走时。科学家把扫数可能的舞步过头出现概率，称为"玻尔兹曼散布"——这是一张形容分子在特定温度下怎么分派自身姿态的概率舆图。

问题在于，这张舆图极难绘画。传统办法是让狡计机模拟分子的每一步通顺，就像用超慢动作照相机记载舞者每一毫秒的动作，再拼出齐备的跳舞画面。这种顺序需要以飞秒（千万亿分之一秒）为步长激动，耗时极长，狡计量宏大，何况分子很容易堕入某个固定姿势"卡死"，奈何也跳不出来。更穷苦的是，只须分子结构稍有转变，就得再行从新模拟，毫无复用可能。

正因如斯，有谋划者们一直在寻找更理智的替代决策。深度学习生成模子的兴起带来了新但愿——若是能指示一个神经网罗，让它径直"生成"适当玻尔兹曼散布的分子构型，就能绕开漫长的模拟过程。但是，这里存在一个令东说念主头疼的轮回悖论：指示这种模子，需要大批也曾处于均衡情景的分子构型数据；而获取这些数据，正好便是咱们领先想要惩处的难题。

匹兹堡大学的有谋划团队淡薄了一种名为SITA（可扩展推断时退火，Scalable Inference-Time Annealing）的新顺序，试图摧毁这个死轮回。这套决策的中枢想路，便是用一种"温度路子"战略，让模子像退火工艺一样，从高温迟缓冷却到室温，一步步学会在低温下精确形容分子的舞步散布。

**一、为什么"从高温运行"是个理智的源流**

退火，是冶金工东说念主的老本事：把金属加热到高温，再安稳冷却，让里面结构逐步摆设整王人。分子模拟界限早就借用了这个见识。在高温下，分子领有更多能量，大致跨越各类能量障蔽，开脱探索扫数可能的姿态；而在低温（比如室温300K）下，分子更倾向于瑟缩在能量最低的几个姿态里，简直无法跳出去。

传统分子能源学模拟在低温下极易"卡死"，便是因为分子莫得实足能量跨越那些能量山丘，去探索其他构型。高温模拟则宽松得多，分子可以畅游通盘构型空间，遮蔽扫数可能的"舞步"。

SITA恰是诓骗这一特色，先在1200K的高温模拟数据上指示一个生成模子，让模子先学会高温下分子的"豪放舞风"，再通过一系列全心瞎想的设施，迟缓把模子指点向300K（室温）下更"保守"、更专注于寂静量姿态的精确散布。这个过程，就像先教一个舞者学习开脱随意舞，再一步步管理他学习古典芭蕾的严格范例。

**二、"温度路子"究竟奈何走**

SITA的指示过程分为四个日中必移的设施，通盘过程像是爬下一段楼梯，每走一步，模子对低温散布的谐和就更深一层。

第一步，有谋划团队诓骗刻下的生成模子（称为"流模子"，可以谐和为一个专诚生身分子构型的神经网罗），在稍低一些的温度下批量产出分子样本。这里有一个精妙的妙技：流模子自己不需要修改，只需转变输入的"噪声"来源的方差，就能让输出的样本更倾向于寂静量情景。具体来说，若是刻下温度是1200K，目的是755K，那么只需将输入噪声的方差按照两个温度的比值收缩，模子就会当然地生成更适当低温散布的样本。这种只需颐养输入、无需重指示模子的温度切换样式，是SITA的一大亮点。

第二步，用这批更生成的样本，指示一个"能量模子"（EBM，Energy-Based Model）。能量模子的作用，是学习这批样本的概率密度——闲居地说，便是学会判断每个分子构型"有多大可能真是存在"。径直狡计流模子生成样本的精确概率，在高维度下需要狡计一个极其复杂的"雅可比行列式"（可以谐和为形容空间怎么被变换的数学量），狡计量随分子开脱度的加多急剧推广，完全不可行。能量模子则通过一种叫作念BoltzNCE的指示顺序，绕开了这个狡计瓶颈，用一个雷同但高效的样式测度出样本的概率。

BoltzNCE的指示分两个部分：第一部分叫"分数匹配"，通过学习样本能量函数的梯度来管理能量的步地；第二部分叫"噪声对比测度"，通过让模子分别不同时代点的样本来锚定能量的完全值。两者协力，使能量模子大致给每个样本打出一个"概率分数"，而无需资格激昂的狡计。

第三步，九游会j9官方网站APP下载诓骗能量模子估算出的概率，狡计每个样本的进军性权重。进军性权重的含义是：这个样本在目的低温散布下，比拟在刻下高温散布下，更应该被怜爱若干倍。狡计公式是用玻尔兹曼散布给出的真是低温概率，除以能量模子估算的高温概率。权重越高，讲明这个样本越适当低温散布的特征。通过按这些权重对样本再行采样，就得到了一批"更像室温散布"的指示数据。为了珍惜极少数权重极高的样本主导通盘重采样放荡（这会严重缩短样本各类性），有谋划团队还对权重作念了99百分位截断处理。

第四步，用这批再行采样的数据，对流模子进行微调，让它更好地靠近刻下目的温度下的散布。微调完成后，通盘轮回再行运行，目的温度再降一个台阶。有谋划顶用到的温度路子是：从1200K启航，挨次经过755.95K、555.52K、408.24K，最终到达300K。每一步都让模子对室温散布的谐和更进一步。

**三、与敌手的正面交锋：SITA凭什么说我方更好**

在这个界限，最径直的竞争敌手是一个叫PITA（Progressive Inference-Time Annealing）的顺序。PITA的想路与SITA有几分相似，雷同是沿温度路子迟缓退火，但它领受的是基于扩散模子的架构，并依赖一种叫"费曼-卡茨公式"的数学器用来估算样本的进军性权重。这个估算过程，需要沿通盘生成轨迹积分狡计速率场的散度（可以谐和为狡计每一步生成过程中空间怎么被"压缩"或"推广"），狡计量随分子开脱度的加多呈祸害性增长。对于唯有几十个开脱度的丙氨酸二肽，这也曾很劳苦；对于更大的分子系统，基本上是不可行的。

SITA用能量模子替代了这个激昂的散度积分，从根柢上绕开了这个瓶颈。代价是引入了一丝雷同邪恶——能量模子毕竟不是精确的概率密度，而是一个雷同测度。这个雷同会导致重采样后的散布不是精确的目的低温散布，而是一个"歪斜版块"，其偏差取决于能量模子与真是密度的差距。有谋划团队坦率地承认了这一丝，并从表面上推导出了歪斜散布的步地。

但是，令东说念主不测的是，这种带有雷同偏差的顺序，在实验基准上居然全面特出了表面上更精确的PITA。

**四、用丙氨酸熟习功力**

有谋划团队在两个程序分子基准上测试了SITA：丙氨酸二肽（Alanine Dipeptide，ADP）和丙氨酸三肽（Alanine Tripeptide，ATP）。丙氨酸二肽是狡计化学界限最经典的测试案例，就像机器学习界限的MNIST手写数字识别，既实足随意，又能显现顺序的症结纰谬。

评价方针主要有四个。"Rama-KL"估量的是生成样本的构型散布与真是室温MD模拟之间的KL散度（一种估量两个概率散布相反的数学量），数值越小讲明遮蔽越全面、越精确，这个方针尤其对"模式崩溃"（即模子只生成少数几种构型）颠倒明锐。"Energy-W1"和"Energy-W2"估量的是生成样本与参考样本在能量散布上的相反，分别对应一阶和二阶Wasserstein距离。"T-W2"则估量样本在扭转角空间（即拉马钱德兰坐标，AG真人 - AG真人(中国)官网AppStore形容卵白质骨架迂回样式的两个角度）上的二阶Wasserstein距离。

在丙氨酸二肽上，SITA在Rama-KL（0.517±0.013）和Energy-W2（0.939±0.079）两项最进军的方针上拿到了扫数顺序中的最好收成，显耀优于PITA（Rama-KL为4.773±0.460，Energy-W2为1.615±0.053）。有一个敬爱的细节：另一个叫MD-NF的基准顺序，径直用300K的MD数据指示，在Energy-W1这一方针上阐发最好，但它的Rama-KL极高（13.533±0.024），讲明它其实严重模式崩溃了——只生成了能量较低的几种构型，是以能量均值看起来可以，但遮蔽的构型空间极为有限。SITA生成的样本则遮蔽了丙氨酸二肽扫数主要的构型盆地，与MD参考散布在拉马钱德兰开脱能图上高度吻合。

在丙氨酸三肽上，SITA的上风更为杰出。PITA在莫得进行非凡MD厉害（即用短时候的MD模拟修正生成样本）的情况下，Rama-KL高达8.535，能量邪恶更是飙升到86.270。SITA在完全不作念任何后处理的情况下，Rama-KL唯有0.361，Energy-W1为1.933。这意味着SITA生成的样骨子量，径直特出了PITA加上MD厉害后处理的水平，尔后者需要非凡蹧跶3倍的能量狡计预算。

两个系统的有用样本比例（ESS，估量重采样后果的方针，越高讲明权重散布越均匀）都处于较低水平——丙氨酸二肽在0.13到0.27之间，丙氨酸三肽在0.04到0.07之间。这讲明重采样过程中存在一定的样本耗费，但即便如斯，最终放荡仍然优于其他顺序，讲明SITA对样骨子量的把抓颠倒准确，即使极少高权重样本也能有用指引模子向正确目的优化。

**五、还能更精确：孤独梅特罗波利斯-黑斯廷斯精湛**

对于追求极致精度的场景，有谋划团队还瞎想了一个可选的后处理设施：孤独梅特罗波利斯-黑斯廷斯（IMH）算法。

这个算法的旨趣，可以类比为一个抉剔的艺术评审。每次从流模子生成一个新的分子构型候选，然后评审团（由真是玻尔兹曼权重和能量模子共同构成）比较这个新候选与刻下样本的"质地得分比"，若是新候选彰着更好，就秉承它；若是差未几或更差，就以相应概率秉承或圮绝。这个机制保证了最终保留住来的样本聚集会逐步向真是散布靠拢。

表面上，若是评审团使用的是精确概率，这个算法会拘谨到精确的目的散布。由于SITA使用的是能量模子雷同概率，拘谨目的履行上是前边提到的阿谁"歪斜版块"的散布——有谋划团队在论文中给出了严格的数学讲明注解，讲明歪斜进程完全由能量模子与真是密度的偏差决定。

实验放荡炫夸，在丙氨酸三肽上运行50步IMH后，Rama-KL从0.361进一步降至0.313，T-W2从0.798降至0.704，多项方针均有改善。比拟之下，另一种随意的进军性重采样后处理（SITA-IS）诚然在能量邪恶上更低，但Rama-KL出现了恶化，讲明样本各类性受损。IMH则在改善能量精度的同期，较好地保持了构型空间的遮蔽，代价曲直凡需要5×10?次能量狡计（而通盘预指示阶段需要5×10?次，这个支出相对可以秉承）。

**六、对于评估样式的一场"较真"**

SITA论文中还专诚辟出一节，指出了竞争顺序PITA在评估方针上的两处顺序论问题，这在学术界算是相配径直的品评。

第一个问题是TICA（时候滞后孤独重量分析）评估中的滞后时候遴荐。TICA是一种分析分子能源学轨迹慢模式的技术，其投影放荡对滞后时候参数极为明锐。PITA对丙氨酸三肽使用了滞后时候10，对丙氨酸二肽使用了滞后时候100。过小的滞后时候会让TICA捕捉到高频振动和热噪声，而非简直有物理意旨的慢构型滚动，从而使基于TICA的评估方针失去分别模式遮蔽才气的机灵度。

第二个问题是MD参考轨迹的降采样样式。PITA取轨迹的前10000帧看成参考散布，但MD轨迹帧之间存在强时候联系性，前10000帧常常鸠合于轨迹肇端的少数构型，无法代表齐备的均衡散布。使用这种有偏参考来评估模子，会让那些雷同模式崩溃的顺序因为与有偏参考"匹配得好"而取得失误的高分。SITA团队因此改用均匀间隔采样的样式录取参考帧，放荡发现扫数顺序在这种更公正的评估下阐发均有变化，而SITA的上风在这种更严格的评估下愈加显耀。

这一较真细节，体现了有谋划者在顺序论层面的严谨作风——评估样式的细节，雷同能决定"谁更好"的论断。

**七、模子架构背后的技术遴荐**

SITA的流模子使用了一种叫GVP-GNN（几何向量感知图神经网罗）的架构，这是一种专诚为分子瞎想的神经网罗，大致保持物理系统的基本对称性：不管分子在空间中奈何旋转、平移，模子给出的物理量展望值应当保持不变或协变。这种对称性管理大大减少了模子需要学习的冗余信息，提高了学习后果。

能量模子则领受了Graphormer架构，这是一种为图结构数据瞎想的Transformer变体。Transformer本来是处理应然言语的神经网罗，Graphormer通过在注眼光机制中加入分子内原子间距离矩阵看成结构偏置，使其大致有用处理三维分子构型。在SITA中，这个距离信息被径直注入注眼光狡计，让模子自然具备对分子三维几何的感知才气。

两个模子的指示都使用了三角函数插值（αt=cos(πt/2)，βt=sin(πt/2)）看成立时插值框架的调节函数，这种遴荐能让插值旅途在时候上更均匀，幸免指示信号在某些时候段过于鸠合。优化器使用Adam，协作Reduce-on-Plateau学习率调节，在死亡住辖下跌时自动缩短学习率。扫数实验在单张NVIDIA L40 GPU上完成，每张显卡配备46GB显存。

**八、这套顺序的局限与往日**

有谋划团队颠倒坦率地讲明了SITA引入雷同的代价。由于能量模子仅仅流模子散布的雷同，重采样后的散布并非精确的目的低温散布，而是受能量模子精度影响的歪斜散布。刻下实验中有用样本比例较低（丙氨酸三肽最低唯有0.045），讲明重采样后果还有较大栽植空间。

2026世界杯中国滚球app官网

此外，SITA当今只在袖珍分子系统上测试，对于更大的卵白质或药物分子，能量模子的雷同精度是否实足、流模子的抒发才气是否实足，仍然是怒放的问题。有谋划团队将架构优化、跨分子系统的迁徙才气，以及应用到更大分子系统的可行性，列为往日主要有谋划目的。

归根结底，SITA代表的是一种"以雷同换范围"的工程玄学：在精确性上作念出可秉承的贪污，换来在更大系统上的可行性。在分子模拟这个高维度的界限，这常常是通往实用的惟一王人径。

当分子生物学家和药物研发者濒临一个全新的卵白质靶点时，若是能用SITA这么的器用在数小时内生成可靠的室温构型散布，而不是恭候数周的MD模拟，这种后果上的质变，可能径直影响到下一代药物从实验室走向临床的速率。而这，才是这场对于分子"舞步"的有谋划，与普通东说念主最真是的关联。

---

Q&A

Q1：SITA顺序与传统分子能源学模拟比拟，在狡计后果上有多大上风？

A：SITA的主要后果来源于两点。第一，它用神经网罗径直生身分子构型，幸免了传统MD模拟以飞秒步长迟缓激动的激昂支出；第二，它用能量模子替代了精确散度积分，幸免了随分子开脱度增长而急剧推广的狡计量。在实验中，通盘预指示加退火经过蹧跶约5.08×10?次能量狡计，比敌手PITA在丙氨酸三肽上需要的8×10?次少约37%，且无需非凡MD厉害后处理。

Q2：SITA中的能量模子雷同会不会让生成的分子构型不准确？

A：会引入一定偏差。能量模子估算的是流模子散布的雷同密度，而非精确密度，导致重采样后的散布是目的散布的"歪斜版块"，偏差大小取决于能量模子与真是密度的差距。有谋划团队在表面上推导了这个偏差的步地，并指出唯有当能量模子与流模子散布完全一致时，才能精确规复目的散布。尽管存在这种雷同偏差，实验放荡炫夸SITA在多个方针上仍优于其他顺序。

Q3：SITA的温度路子中温度点是奈何选的，能不行径直从1200K跳到300K？

A：温度点的遴荐影响进军性权重的质地AG真人(中国)官网AppStore，跨度越大，相邻温度散布相反越大，有用样本比例会急剧下跌。SITA领受755.95K、555.52K、408.24K、300K四步过渡，每步约缩短约26%的温度，以保阐述足高的有用样本比例（丙氨酸二肽约13%~27%）。若径直从1200K跳到300K，两个温度下的玻尔兹曼散布相反极大，简直扫数生成样本的权重都会趋近于零，重采样简直失效，指示数据质地会严重劣化。

上一篇：上一篇：AG真人好意思国1-1扳平！罗宾逊凌空抽射轰出精彩寰宇波，随后灭亡空翻庆祝

AG真人中国官方网站

AG真人资讯

AG真人(中国)官网AppStore 用匹兹堡大学的"温度路子"指示法, 让AI透顶读懂分子的"跳舞言语"

AG真人资讯

AG真人(中国)官网AppStore 用匹兹堡大学的&quot;温度路子&quot;指示法, 让AI透顶读懂分子的&quot;跳舞言语&quot;

AG真人(中国)官网AppStore 用匹兹堡大学的"温度路子"指示法, 让AI透顶读懂分子的"跳舞言语"