结构搜索方法、结构搜索设备和计算机可读存储介质

文档序号:1939967 发布日期:2021-12-07 浏览:19次 >En<

阅读说明:本技术 结构搜索方法、结构搜索设备和计算机可读存储介质 (Structure search method, structure search apparatus, and computer-readable storage medium ) 是由 寺岛千绘子 谷田义明 佐藤博之 于 2021-03-16 设计创作,主要内容包括:提供了结构搜索方法、结构搜索设备和计算机可读存储介质。搜索其中多个化合物残基键合在一起的化合物的稳定结构的结构搜索设备包括:存储器;以及耦接至存储器的处理器电路,该处理器电路被配置成执行处理,该处理包括:执行相互作用势识别处理,该相互作用势识别处理被配置成识别多个化合物残基之中的化合物残基x与化合物残基y之间的相互作用势;执行空间结构识别处理,该空间结构识别处理被配置成通过考虑由相互作用势识别处理识别的相互作用势在作为晶格点的集合的三维晶格空间中的晶格点处布置多个化合物残基,来识别在三维晶格空间中的化合物的空间结构;以及响应于所获得的识别结果,输出指示所识别的化合物的空间结构的识别结果。(A structure search method, a structure search apparatus, and a computer-readable storage medium are provided. The structure search device that searches for a stable structure of a compound in which a plurality of compound residues are bonded together includes: a memory; and a processor circuit coupled to the memory, the processor circuit configured to perform a process, the process comprising: performing an interaction potential recognition process configured to recognize an interaction potential between a compound residue x and a compound residue y among the plurality of compound residues; performing a spatial structure identification process configured to identify a spatial structure of a compound in a three-dimensional lattice space by arranging a plurality of compound residues at lattice points in the three-dimensional lattice space that is a set of lattice points in consideration of interaction potentials identified by the interaction potential identification process; and in response to the obtained recognition result, outputting a recognition result indicating the spatial structure of the recognized compound.)

结构搜索方法、结构搜索设备和计算机可读存储介质

技术领域

本文中讨论的实施方式涉及结构搜索方法、结构搜索设备、存储结构搜索程序的非暂态计算机可读存储介质以及相互作用势识别方法。

背景技术

近年来,在诸如药物发现的情况下,存在必须通过使用计算器(计算机)来获得尺寸相对较大的分子的稳定结构的情况。然而,例如,全原子计算可能难以在实际时间内搜索诸如肽或蛋白质的尺寸相对较大的分子的稳定结构。

因此,为了减少计算时间,已经研究了粗略捕获分子结构(粗粒化)的技术。作为针对分子结构的粗粒化的技术,例如,已经研究了以下技术:其中基于关于蛋白质中氨基酸残基的一维序列的信息,将蛋白质粗粒化为以线性链(单链)的简单立方晶格结构,并且将其视为晶格蛋白质。关于使用晶格蛋白质的技术,已经报道了通过使用量子退火技术高速搜索稳定结构的技术(例如,参见非专利文献1)。

在这种使用晶格蛋白质的技术中,通常考虑粗粒化氨基酸残基之间的相互作用的大小来搜索分子的稳定结构。粗粒化氨基酸残基之间的相互作用可以通过使用例如氨基酸残基之间的相互作用势来计算。

相互作用势是取决于氨基酸残基的布置位置的粗粒化氨基酸残基中能量变化的总和。在使用上述晶格蛋白质的技术中,例如,通过搜索其中从相互作用势获得的能量最稳定的结构来执行对分子的稳定结构的搜索。

作为例如形成肽或蛋白质的一般的天然氨基酸残基的相互作用势,可以使用通过基于蛋白质的数据库对氨基酸残基之间的相对位置进行统计处理而产生的相互作用势(例如,参见非专利文献2)。因此,在形成分子的氨基酸残基是一般的天然氨基酸残基(20种类型的天然氨基酸)的情况下,可以使用基于如上所述的蛋白质的数据库而产生的公知的相互作用势。

关于除了天然氨基酸残基之外的氨基酸残基(例如化学改性的非天然氨基酸残基),已经提出了通过对氨基酸残基的提取的侧链部分的结构进行分子动力学计算来获得相互作用势的方法(例如,参见非专利文献3)。在形成分子的氨基酸残基包括除了天然氨基酸残基之外的氨基酸残基的情况下,不可以使用如上所述的公知的相互作用势,并且需要单独获得除了天然氨基酸残基之外的氨基酸残基的相互作用势。

近年来,在诸如药物发现的情况下,存在将诸如肽或蛋白质的中分子化合物或高分子化合物用作药物的情况。在这种情况下,为了改善化合物的生理活性和稳定性,有时将除了天然氨基酸残基之外的氨基酸残基引入至化合物中。因此,在诸如药物发现的情况下,搜索包含除了天然氨基酸残基之外的氨基酸残基(在下文中,也被称为“改性的氨基酸残基”)的化合物的稳定结构似乎是有用的。

然而,在诸如非专利文献3的相关技术中,不可能通过适当考虑分子中氨基酸残基的结构来获得相互作用势,这导致相互作用势的准确性不足,并且因此不能够准确地搜索分子的稳定结构。

发明内容

[技术问题]

一方面,本公开内容的目的是提供结构搜索方法、结构搜索设备和结构搜索程序,其在搜索其中多个化合物残基键合在一起的化合物的稳定结构时,即使当该化合物包含具有未知相互作用势的化合物基团时,也能够准确地搜索该化合物的稳定结构。

另一方面,本公开内容的目的是提供相互作用势识别方法,其能够在识别其中多个化合物残基键合在一起的化合物中的化合物残基之间的相互作用势时,准确地识别具有未知相互作用势的化合物基团的相互作用势。

[问题的解决方案]

根据实施方式的一个方面,提供了一种搜索化合物的稳定结构的结构搜索设备,在化合物中,多个化合物残基键合在一起。在示例中,该设备包括:存储器;以及耦接至存储器的处理器电路,该处理器电路被配置成执行处理,该处理包括:执行相互作用势识别处理,该相互作用势识别处理被配置成识别多个化合物残基之中的化合物残基x与化合物残基y之间的相互作用势;执行空间结构识别处理,该空间结构识别处理被配置成通过基于由相互作用势识别处理识别的相互作用势在作为晶格点的集合的三维晶格空间中的晶格点处布置多个化合物残基,来识别在三维晶格空间中的化合物的空间结构;以及响应于通过空间结构识别处理获得的识别结果,输出指示所识别的化合物的空间结构的识别结果。

在示例中,相互作用势识别处理通过使用针对化合物残基x的第一参数以及针对化合物残基y的第二参数来识别化合物残基x与化合物残基y之间的相互作用势。

在示例中,第一参数被配置成使得包含化合物残基x的化合物衍生物x中的包含饱和基团的结构部分x-1和包含饱和基团的结构部分x+1不会引起相互作用。

在示例中,第二参数被配置成使得包含化合物残基y的化合物衍生物y中的包含饱和基团的结构部分y-1和包含饱和基团的结构部分y+1不会引起相互作用。

在示例中,化合物衍生物x是通过将包含饱和基团的结构部分x-1和包含饱和基团的结构部分x+1添加至化合物残基x而获得的化合物衍生物。

在示例中,化合物衍生物y是通过将包含饱和基团的结构部分y-1和包含饱和基团的结构部分y+1添加至化合物残基y而获得的化合物衍生物。

在示例中,包含饱和基团的结构部分x-1是包括在与化合物残基x相邻的化合物残基x-1中的包含饱和基团的结构部分,化合物残基x-1具有与化合物残基x中的连接键所涉及的基团键合的官能团x-1。

在示例中,包含饱和基团的结构部分x-1由官能团x-1和饱和基团x-1组成,饱和基团x-1通过将氢原子键合至与官能团x-1键合的原子以使该原子的化合价饱和而获得。

在示例中,包含饱和基团的结构部分x+1是包括在与化合物残基x相邻的化合物残基x+1中的包含饱和基团的结构部分,化合物残基x+1具有与化合物残基x中的连接键所涉及的基团键合的官能团x+1。

在示例中,包含饱和基团的结构部分x+1由官能团x+1和饱和基团x+1组成,饱和基团x+1通过将氢原子键合至与官能团x+1键合的原子以使该原子的化合价饱和而获得。

在示例中,包含饱和基团的结构部分y-1是包括在与化合物残基y相邻的化合物残基y-1中的包含饱和基团的结构部分,化合物残基y-1具有与化合物残基y中的连接键所涉及的基团键合的官能团y-1。

在示例中,包含饱和基团的结构部分y-1由官能团y-1和饱和基团y-1组成,饱和基团y-1通过将氢原子键合至与官能团y-1键合的原子以使该原子的化合价饱和而获得。

在示例中,包含饱和基团的结构部分y+1是包括在与化合物残基y相邻的化合物残基y+1中的包含饱和基团的结构部分,化合物残基y+1具有与化合物残基y中的连接键所涉及的基团键合的官能团y+1。

在示例中,包含饱和基团的结构部分y+1由官能团y+1和饱和基团y+1组成,饱和基团y+1通过将氢原子键合至与官能团y+1键合的原子以使该原子的化合价饱和而获得。

[本发明的效果]

一方面,本公开内容可以提供结构搜索方法、结构搜索设备和结构搜索程序,其在搜索其中多个化合物残基键合在一起的化合物的稳定结构时,即使当该化合物包含具有未知相互作用势的化合物基团时,也能够准确地搜索该化合物的稳定结构。

另一方面,本公开内容可以提供相互作用势识别方法,其能够在识别其中多个化合物残基键合在一起的化合物中的化合物残基之间的相互作用势时,准确地识别具有未知相互作用势的化合物基团的相互作用势。

附图说明

图1A是示出通过将蛋白质粗粒化来搜索蛋白质的稳定结构的示例的示意图;

图1B是示出通过将蛋白质粗粒化来搜索蛋白质的稳定结构的示例的示意图;

图1C是示出通过将蛋白质粗粒化来搜索蛋白质的稳定结构的示例的示意图;

图2A是用于说明菱形编码方法的示例的示意图;

图2B是用于说明菱形编码方法的示例的示意图;

图2C是用于说明菱形编码方法的示例的示意图;

图2D是用于说明菱形编码方法的示例的示意图;

图2E是用于说明菱形编码方法的示例的示意图;

图3示出了在相关技术中用于计算氨基酸残基之间的相互作用势的分子动力学计算中使用的氨基酸残基的结构的示例;

图4示出了在肽中氨基酸残基键合在一起的状态的示例;

图5示出了在本文中公开的技术的一个示例中制备的氨基酸衍生物x的结构的示例;

图6示出了在本文中公开的技术的示例中的氨基酸衍生物x与氨基酸衍生物y之间的相互作用的示例;

图7示出了本文中公开的结构搜索设备的硬件配置示例;

图8示出了本文中公开的结构搜索设备的另一硬件配置示例;

图9示出了本文中公开的结构搜索设备的功能配置示例;

图10示出了通过使用本文中公开的技术的一个示例来识别用于搜索肽的稳定结构的相互作用势的流程图的示例;

图11示出了考虑通过使用上文中公开的技术的示例识别的相互作用势来搜索肽的稳定结构的流程图的示例;

图12是示出具有半径r的区域内的晶格点各自由Sr表示的情况的示例的图;

图13A是示出氨基酸残基的目的地晶格点的集合的示例的图;

图13B是示出氨基酸残基的目的地晶格点的集合的示例的图;

图13C是示出氨基酸残基的目的地晶格点的集合的示例的图;

图13D是示出氨基酸残基的目的地晶格点的集合的示例的图;

图14示出了S1、S2和S3的三维表示的示例;

图15A示出了将空间信息分配给位X1至位Xn的示例;

图15B示出了将空间信息分配给位X1至位Xn的示例;

图15C示出了将空间信息分配给位X1至位Xn的示例;

图16是用于说明Hone的示例的图;

图17是用于说明Holap的示例的图;

图18是用于说明Hconn的示例的图;

图19A是用于说明Hpair的示例的图;

图19B是用于说明Hpair的示例的图;

图20A示出了表示在粗粒化氨基酸残基中的主链和侧链的粒子的示例;

图20B示出了用于布置图20A所示的粗粒化氨基酸残基的晶格点的集合的示例;

图20C示出了图20A所示的粗粒化氨基酸残基布置在晶格点处的状态的示例;

图21示出了用于在退火方法中使用的退火机的功能配置的示例;

图22示出了转变控制单元的操作流程的示例;

图23示出了在示例1中计算的亮氨酸残基之间的PMF;

图24A示出了肽中的N-甲基苯丙氨酸残基的化学式的示例;

图24B示出了在示例2中制备的N-甲基苯丙氨酸衍生物的结构的示例;

图25示出了在示例2中计算的N-甲基苯丙氨酸残基与缬氨酸残基之间的PMF;

图26示出了将在示例3中搜索出的环肽的稳定结构的搜索结果叠加在通过NMR识别的环肽的结构上;以及

图27示出了在本文中公开的技术的一个实施方式中以及在相关技术中,通过识别氨基酸残基之间的相互作用势来搜索肽的稳定结构时的关系的示例。

具体实施方式

(结构搜索方法)

本文公开的技术基于本发明人的以下发现:在相关技术中对其中多个化合物残基键合在一起的化合物的稳定结构的搜索在该化合物包含具有未知相互作用势的化合物基团的情况下会导致对该化合物的稳定结构的搜索的准确性不足。在详细描述本文公开的技术之前,将作为稳定结构搜索目标的化合物为肽(蛋白质)的情况作为示例来描述相关技术中的问题和其它事项。

近年来,在诸如药物发现的情形下使用肽(蛋白质)作为药物的情况下,为了提高生理活性和稳定性,有时将除了天然氨基酸残基以外的氨基酸残基(改性的氨基酸残基)引入肽(蛋白质)中。出于此原因,在诸如药物发现的情况下,搜索包含具有未知相互作用势的改性的氨基酸残基的肽(蛋白质)的稳定结构似乎是有用的。

对肽(蛋白质)的稳定结构的搜索可以使用如上所述的其中对形成蛋白质的氨基酸残基进行粗粒化并且将其视为晶格蛋白质的技术。作为使用晶格蛋白质的技术之一,将描述通过菱形编码方法获得折叠结构作为蛋白质的稳定结构的方法。

在使用晶格蛋白质对蛋白质(或肽)的结构搜索中,首先执行蛋白质的粗粒化。蛋白质的粗粒化通过例如创建粗粒化模型来执行,在粗粒化模型中将构成蛋白质的原子2粗粒化为经粗粒化的粒子1A、1B和1C,经粗粒化的粒子1A、1B和1C中的每一个是每个氨基酸残基的单元,如图1A所示。

接着,使用所创建的粗粒化模型来搜索稳定键合结构。图1B示出了其中经粗粒化的粒子1C位于箭头的终点处的键合结构为稳定的情况的示例。通过稍后描述的菱形编码方法来执行对稳定键合结构的搜索。

如图1C所示,基于通过使用菱形编码方法搜索出的稳定键合结构,将粗粒化模型恢复为全原子模型。

菱形编码方法是以下方法:其中形成蛋白质的氨基酸链中的经粗粒化的粒子(粗粒化模型)中的每一个被分配至菱形晶格中的晶格点之一,并且能够表示蛋白质的三维结构。

为了简化说明,下面将通过示例的方式描述用于二维情况的菱形编码方法。

图2A示出了其中具有键合在一起的五个氨基酸残基的线性五肽具有线性结构的结构的示例。在图2A至图2E中,每个圆圈中的数字表示线性五肽中的对应氨基酸残基的编号。

在菱形编码方法中,一旦首先将编号为1的氨基酸残基布置在菱形晶格的中心处,如图2A所示的可布置编号为2的氨基酸残基的位置限于如图2B所示的与中心相邻的位置(具有编号2的位置)。接下来,可布置与编号为2的氨基酸残基键合的编号为3的氨基酸残基的位置限于与图2B中的具有编号2的位置相邻的位置(具有编号3的位置),如图2C所示。

可布置与编号为3的氨基酸残基键合的编号为4的氨基酸残基的位置限于与图2C中的具有编号3的位置相邻的位置(具有编号4的位置),如图2D所示。可布置与编号为4的氨基酸残基键合的编号为5的氨基酸残基的位置限于与图2D中的具有编号4的位置相邻的位置(具有编号5的位置),如图2E所示。

因此,可以通过将其中可布置氨基酸残基的已识别位置按照氨基酸残基的编号的顺序连接来表示蛋白质的粗粒化结构。

使用菱形编码方法等,将粗粒化氨基酸残基顺序地布置在三维晶格空间中的对应晶格点处,该三维晶格空间是如上所述的晶格点的集合,使得可以在三维晶格空间中创建蛋白质(肽)的空间结构。

在通过在三维晶格空间中创建蛋白质的空间结构来搜索蛋白质(肽)的稳定结构时,要求适当地选择粗粒化氨基酸残基在三维晶格空间中的布置位置的组合。例如,为了适当地选择粗粒化氨基酸残基的布置位置的组合,优选地将氨基酸残基的布置位置确定成使得氨基酸残基的布置位置满足预定条件。

氨基酸残基的布置位置的条件可以是例如以下条件:使得通过在三维晶格空间中布置氨基酸残基而创建的空间结构是可以作为蛋白质(肽)一直存在的结构并且是能量稳定的结构。这些条件可以是例如包括以下三个约束和氨基酸残基之间的相互作用的条件。

[约束]

·形成蛋白质(肽)的氨基酸残基中的每个氨基酸残基单独存在;

·形成蛋白质(肽)的氨基酸残基中的两个或更多个氨基酸残基在一个晶格点处不共存;以及

·在形成蛋白质(肽)的氨基酸残基中,彼此肽键合的氨基酸残基存在于三维晶格空间中彼此相邻的晶格点处。

[相互作用]

·在形成蛋白质(肽)的氨基酸残基中,未彼此肽键合的氨基酸残基之间的相互作用。

例如,在通过在三维晶格空间中创建蛋白质的空间结构来搜索蛋白质的稳定结构时,优选的是搜索满足上述三个约束并且在未彼此肽键合的氨基酸残基之间具有稳定相互作用(能量低)的结构。

可以通过使用例如上文所述的氨基酸残基之间的相互作用势来计算未彼此肽键合的氨基酸残基之间的相互作用。

相互作用势是取决于氨基酸残基的布置位置的粗粒化氨基酸残基的能量变化的总和。

作为例如形成蛋白质的一般的天然氨基酸残基(20种类型的天然氨基酸)的相互作用势,可以使用通过基于蛋白质数据库对氨基酸残基之间的相对位置进行统计处理而产生的相互作用势。例如,在形成分子的氨基酸残基是一般的天然氨基酸残基(20种类型的天然氨基酸)的情况下,可以使用基于蛋白质数据库产生的公知的相互作用势。

另一方面,对于除天然氨基酸残基以外的氨基酸残基(例如化学改性的非天然氨基酸残基),已知如非专利文献3中的使用通过对提取的氨基酸残基的侧链部分的结构进行分子动力学计算获得的相互作用势的技术。在形成分子的氨基酸残基包括除天然氨基酸残基以外的氨基酸残基的情况下,不能使用公知的相互作用势,并且如上所述要求单独地计算并获得相互作用势。

如上所述,相关技术例如非专利文献3是在计算相互作用势时,通过对提取的氨基酸侧链部分(侧链类似物)的结构执行分子动力学计算来计算氨基酸残基之间的相互作用势的技术。这样,在相关技术中,通过对提取的氨基酸侧链部分(侧链类似物)的结构和单独的氨基酸分子的结构执行分子动力学计算来计算相互作用势。

图3示出了在相关技术中用于计算氨基酸残基之间的相互作用势的分子动力学计算中使用的氨基酸残基的结构的示例。

如图3所示,肽中的氨基酸残基和与所关注的氨基酸残基相邻存在的氨基酸残基形成肽键。例如,图3中被虚线包围的氨基酸残基存在于肽中,同时与肽中的相邻氨基酸残基肽键合。因此,图3中被虚线包围的氨基酸残基在肽中可以具有的结构受到与所关注的氨基酸残基相邻的氨基酸残基的肽键的影响。例如,作为计算目标(要计算针对其的相互作用势)的氨基酸残基的一部分,即形成肽的主链的部分的结构受到所关注的氨基酸残基与相邻的氨基酸残基之间的肽键的影响。

然而,在相关技术中,对图3中被实线包围的提取的氨基酸侧链部分(侧链类似物)的结构和图3中被虚线包围的单独氨基酸分子的结构执行分子动力学计算。出于此原因,相关技术没有考虑与作为计算目标的氨基酸残基相邻的氨基酸残基的肽键的影响。因此,在相关技术中,不能考虑作为计算目标(要计算针对其的相互作用势)的氨基酸残基中的形成肽的主链的部分的结构从所关注的氨基酸残基与其相邻氨基酸残基之间的肽键接收的影响。

出于此原因,在相关技术中,不能适当地评估作为计算目标(要计算针对其的相互作用势)的氨基酸残基中的肽的主链与所关注的氨基酸残基的侧链之间的相互作用。在相关技术中,例如,不能适当地评估氨基酸残基中肽的主链与所关注的氨基酸残基的侧链之间的相互作用,这导致相互作用势的准确性不足,并且因此不能够准确搜索肽的空间结构。

已经作为示例描述了化合物为肽且化合物残基为氨基酸残基的情况,在相关技术中,通过使用提取的化合物的一部分的结构等来计算包含具有未知相互作用势的化合物残基的化合物的相互作用势。因此,在相关技术中,不能考虑化合物残基中形成化合物主链的部分的结构从所关注的化合物残基与其相邻化合物残基之间的连接键接收的影响。因此,在相关技术中,计算出的相互作用势的准确性非常低,使得不能准确地搜索化合物的空间结构。

在这些情况下,发明人对在搜索其中多个化合物残基键合在一起的化合物的稳定结构时,即使在化合物包含具有未知相互作用势的化合物基团的情况下也能够准确地搜索化合物的稳定结构的设备等进行了广泛的研究并且获得以下发现。

例如,发明人已经发现,以下结构搜索方法等在搜索其中多个化合物残基键合在一起的化合物的稳定结构时,即使在该化合物包含具有未知相互作用势的化合物基团时,也能够高度准确地搜索该化合物的稳定结构。

作为本文公开的技术的示例的结构搜索方法是用于搜索其中多个化合物残基键合在一起的化合物的稳定结构的基于计算机的结构搜索方法,该方法包括:

识别多个化合物残基中的化合物残基x与化合物残基y之间的相互作用势;以及

通过考虑在识别相互作用势时获得的相互作用势将多个化合物残基顺序地布置在作为晶格点的集合的三维晶格空间中的某些晶格点处,来识别三维晶格空间中的化合物的空间结构,其中

识别相互作用势包括:通过以下步骤识别化合物残基x与化合物残基y之间的相互作用势:

设置针对化合物残基x的参数,使得包含化合物残基x的化合物衍生物x中的包含饱和基团的结构部分x-1和包含饱和基团的结构部分x+1不会引起相互作用,

包含饱和基团的结构部分x-1包括在与化合物残基x相邻的化合物残基x-1中,化合物残基x-1具有与化合物残基x中的连接键所涉及的基团键合的官能团,

包含饱和基团的结构部分x-1由官能团和饱和基团组成,该饱和基团通过将氢原子键合至与官能团键合的原子以使原子的化合价饱和而获得,

包含饱和基团的结构部分x+1包括在与化合物残基x相邻的化合物残基x+1中,并且化合物残基x+1具有与化合物残基x中的连接键所涉及的基团键合的官能团,

包含饱和基团的结构部分x+1由官能团和饱和基团组成,该饱和基团通过将氢原子键合至与官能团键合的原子以使原子的化合价饱和而获得,

化合物衍生物x通过将包含饱和基团的结构部分x-1和包含饱和基团的结构部分x+1添加至化合物残基x而获得,以及

设置针对化合物残基y的参数,使得包含化合物残基y的化合物衍生物y中的包含饱和基团的结构部分y-1和包含饱和基团的结构部分y+1不会引起相互作用,

包含饱和基团的结构部分y-1包括在与化合物残基y相邻的化合物残基y-1中,并且化合物残基y-1具有与化合物残基y中的连接键所涉及的基团键合的官能团,

包含饱和基团的结构部分y-1由官能团和饱和基团组成,该饱和基团通过将氢原子键合至与官能团键合的原子以使原子的化合价饱和而获得,

包含饱和基团的结构部分y+1包括在与化合物残基y相邻的化合物残基y+1中,并且化合物残基y+1具有与化合物残基y中的连接键所涉及的基团键合的官能团,

包含饱和基团的结构部分y+1由官能团和饱和基团组成,该饱和基团通过将氢原子键合至与官能团键合的原子以使原子的化合价饱和而获得,

化合物衍生物y通过将包含饱和基团的结构部分y-1和包含饱和基团的结构部分y+1添加至化合物残基y而获得。

在将上述结构搜索方法应用于由氨基酸残基形成的肽(蛋白质)的情况下,可以如下改述结构搜索方法。

例如,本文公开的结构搜索方法的另一示例是用于搜索其中多个氨基酸残基键合在一起的肽的稳定结构的基于计算机的结构搜索方法,该方法包括:

识别多个氨基酸残基中的氨基酸残基x与氨基酸残基y之间的相互作用势;以及

通过考虑在识别相互作用势时获得的相互作用势将多个氨基酸残基顺序地布置在作为晶格点的集合的三维晶格空间中的某些晶格点处,来识别三维晶格空间中的肽的空间结构,其中,

识别相互作用势包括:通过以下步骤识别化合物残基x与化合物残基y之间的相互作用势:

设置针对氨基酸残基x的参数,使得包含氨基酸残基x的氨基酸衍生物x中的乙酰基结构部分和N-甲基结构部分不会引起相互作用,

乙酰基结构部分包括在与氨基酸残基x相邻的氨基酸残基x-1中,并且氨基酸残基x-1具有与氨基酸残基x中的肽键所涉及的氨基键合的羰基,

乙酰基结构部分由羰基和甲基组成,该甲基通过将氢原子键合至与羰基键合的碳原子以使碳原子的化合价饱和而获得,

N-甲基结构部分包括在与氨基酸残基x相邻的氨基酸残基x+1中,并且氨基酸残基x+1具有与氨基酸残基x中的肽键所涉及的羰基键合的氨基,

N-甲基结构部分由氨基和甲基组成,该甲基通过将氢原子键合至与氨基键合的碳原子以使碳原子的化合价饱和而获得,

氨基酸衍生物x通过将乙酰基结构部分和N-甲基结构部分添加至氨基酸残基x而获得,以及

设置针对氨基酸残基y的参数,使得包含氨基酸残基y的氨基酸衍生物y中的乙酰基结构部分和N-甲基结构部分不会引起相互作用,

乙酰基结构部分包括在与氨基酸残基y相邻的氨基酸残基y-1中,并且氨基酸残基y-1具有与氨基酸残基y中的肽键所涉及的氨基键合的羰基,

乙酰基结构部分由羰基和甲基组成,该甲基通过将氢原子键合至与羰基键合的碳原子以使碳原子的化合价饱和而获得,

N-甲基结构部分包括在与氨基酸残基y相邻的氨基酸残基y+1中,并且氨基酸残基y+1具有与化合物残基y中的肽键所涉及的羰基键合的氨基,

N-甲基结构部分由氨基和甲基组成,该甲基通过将氢原子键合至与氨基键合的碳原子以使碳原子的化合价饱和而获得,

氨基酸衍生物y通过将乙酰基结构部分和N-甲基结构部分添加至氨基酸残基y而获得。

在下文中,将以化合物为肽的情况作为示例来描述本文公开的技术的示例,在该示例中,对化合物的稳定结构的搜索实现了即使在化合物包含具有未知相互作用势的化合物基团时,也能够准确搜索化合物的稳定结构。

首先,在本文公开的技术的示例中,识别(计算)多个氨基酸残基中的氨基酸残基x与氨基酸残基y之间的相互作用势。在本文公开的技术的示例中,考虑在识别相互作用势的步骤中获得的相互作用势,将多个氨基酸残基顺序地布置在作为晶格点的集合的三维晶格空间中的晶格点处。在本文公开的技术的示例中,通过顺序地布置多个氨基酸残基在三维晶格空间中识别(创建)肽的空间结构。

如上所述,本文公开的技术通过识别氨基酸残基x与氨基酸残基y之间的相互作用势并且考虑识别出的相互作用势来搜索肽的空间结构,从而搜索肽的稳定结构。

在本文公开的技术的示例中,在识别相互作用势的步骤中针对氨基酸残基x捕获的内容不仅包括仅由氨基酸残基组成的部分,而且还包括与所关注的氨基酸残基相邻键合的氨基酸残基的部分结构。

在本文公开的技术的示例中,例如,针对氨基酸残基x捕获与在氨基酸残基x的一端处的肽键所涉及的氨基的侧边相邻的氨基酸残基的一部分以及与在氨基酸残基x的另一端处的肽键所涉及的羰基侧边相邻的氨基酸残基的一部分。

在本文公开的技术的示例中,将参照附图关于氨基酸残基x来详细描述如何捕获与所关注的氨基酸残基x相邻键合的氨基酸残基的部分结构。

图4示出了氨基酸残基如何在肽中键合在一起的示例。在图4中,位于图4中心的氨基酸残基x键合至与氨基酸残基x的左侧相邻的氨基酸残基x+1和与氨基酸残基x的右侧相邻的氨基酸残基x-1。氨基酸残基x具有侧链R、与R键合的碳原子(Cα原子),与Cα原子键合的氨基,以及与Cα原子键合的羰基。

如图4所示,氨基酸残基x中的氨基(NH基)键合至与氨基酸残基x的右侧相邻的氨基酸残基x-1中的羰基(CO基),并且氨基酸残基x中的羰基键合至与氨基酸残基x的左侧相邻的氨基酸残基x+1中的氨基。

在本文公开的技术的示例中,以这样的方式制备氨基酸衍生物x:使得从与氨基酸残基x相邻键合的氨基酸残基x+1和氨基酸残基x-1的结构中取出包括在图4中被实心矩形框线包围的区域中的部分结构,并且将所述部分结构添加至氨基酸残基x。

在本文公开的技术的示例中,为了考虑与氨基酸残基x相邻键合的两个氨基酸残基,通过执行以下两个处理针对氨基酸残基x制备包含氨基酸残基x的氨基酸衍生物x:

·对肽键所涉及的氨基酸残基x的氨基侧进行乙酰化;以及

·对肽键所涉及的氨基酸残基x的羰基侧进行N-甲基化。

此处,如图4所示,与氨基酸残基x相邻键合的两个氨基酸残基分别被称为氨基酸残基x-1和氨基酸残基x+1。

氨基酸残基x-1是与氨基酸残基x相邻并且具有与氨基酸残基x中的肽键所涉及的氨基键合的羰基的氨基酸残基。氨基酸残基x+1是与氨基酸残基x相邻并且具有与氨基酸残基x中的肽键所涉及的羰基键合的氨基的氨基酸残基。

在这些条件下,氨基酸残基x-1中的由羰基和甲基组成的结构部分被称为乙酰基结构部分,该甲基通过将氢原子键合至与羰基键合的碳原子以使碳原子的化合价饱和而获得。然后,氨基酸残基x+1中的由氨基和甲基组成的结构部分被称为N-甲基结构部分,该甲基通过将氢原子键合至与氨基键合的碳原子以使碳原子的化合价饱和而获得。

例如,在本文公开的技术的示例中,对肽键所涉及的氨基酸残基x的氨基侧末端部分进行乙酰化,而对肽键所涉及的氨基酸残基x的羰基侧末端部分进行N-甲基化,从而使得能够考虑氨基酸残基x中的肽的主链的结构。

图5示出了本文公开的技术的示例中制备的氨基酸衍生物x的结构的示例。在图5中,被右框线包围的区域表示由羰基和甲基组成的乙酰基结构部分(其中对氨基酸残基x的氨基侧末端进行乙酰化的结构),该甲基通过将氢原子键合至与羰基键合的碳原子以使碳原子的化合价饱和而获得。在图5中,被左框线包围的区域表示由氨基和甲基组成的N-甲基结构部分(其中对氨基酸残基x的羰基侧末端进行N-甲基化的结构),该甲基通过将氢原子键合至与氨基键合的碳原子以使碳原子的化合价饱和而获得。

在本文公开的技术的示例中,制备氨基酸衍生物x,氨基酸衍生物x包含氨基酸残基x并且通过将乙酰基结构部分和N-甲基结构部分添加至氨基酸残基x而获得,如图5所示。该制备使得能够考虑与氨基酸残基x相邻键合的两个氨基酸残基的肽键的影响。

在本文公开的技术的示例中,还对氨基酸残基y执行了氨基酸残基x的前述处理。例如,在本文公开的技术的示例中,通过执行与上述针对氨基酸残基x的处理相同的处理来制备包含氨基酸残基y并且通过将乙酰基结构部分和N-甲基结构部分添加至氨基酸残基y而获得的氨基酸衍生物y。该制备使得能够考虑与氨基酸残基y相邻键合的两个氨基酸残基的肽键的影响。

在本文公开的技术的示例中,识别(计算)多个氨基酸残基中的氨基酸残基x与氨基酸残基y之间的相互作用势,并且考虑识别出的相互作用势,在三维晶格空间中识别(创建)肽的空间结构。因此,在识别相互作用势时,优选地通过准确地评估氨基酸残基x与氨基酸残基y之间的相互作用来识别相互作用势。

出于此原因,为了识别氨基酸残基x与氨基酸残基y之间的相互作用势,在评估由此制备的氨基酸衍生物x与氨基酸衍生物y之间的相互作用时,优选地使所添加的结构部分与其他分子不会相互作用。

为此,在本文公开的技术的示例中,设置参数使得氨基酸衍生物x中的乙酰基结构部分和N-甲基结构部分不会引起相互作用。类似地,在本文公开的技术的示例中,设置参数使得氨基酸衍生物y中的乙酰基结构部分和N-甲基结构部分不会引起相互作用。例如,在本文公开的技术的示例中,设置参数使得氨基酸衍生物x和氨基酸衍生物y中的乙酰基结构部分和N-甲基结构部分都不会引起相互作用。

在本文公开的技术的示例中,氨基酸衍生物x中的乙酰基结构部分和N-甲基结构部分由于与氨基酸衍生物x的分子中的由氨基酸残基x(氨基酸衍生物x的主要部分)组成的部分的化学键而引起作用。类似地,在本文公开的技术的示例中,氨基酸衍生物y中的乙酰基结构部分和N-甲基结构部分由于与氨基酸衍生物y的分子中的由氨基酸残基y(氨基酸衍生物y的主要部分)组成的部分的化学键而引起作用。

图6示出了在本文公开的技术的示例中的氨基酸衍生物x与氨基酸衍生物y之间的相互作用的示例。

在本文公开的技术的示例中,例如,设置参数使得氨基酸衍生物x和氨基酸衍生物y中的乙酰基结构部分和N-甲基结构部分将不会引起与另外的分子的相互作用,如图6所示。在图6中,要考虑其间的相互作用的部分通过实线箭头连接,而不考虑其间的相互作用的部分(针对其设置参数,使得所述部分不会引起相互作用的部分)通过虚线箭头连接。

如图6所示,在本文公开的技术的示例中,例如,设置参数使得氨基酸衍生物x中的氨基酸残基x将产生与氨基酸衍生物y中的氨基酸残基y的相互作用。在本文公开的技术的示例中,例如,在考虑溶剂分子(例如水分子)的影响来识别相互作用势的情况下,设置参数以使得氨基酸衍生物x中的氨基酸残基x也与溶剂分子相互作用,如图6所示。

在本文公开的技术的示例中,设置参数使得氨基酸衍生物x中的乙酰基结构部分和N-甲基结构部分不会与氨基酸衍生物y中的氨基酸残基y、乙酰基结构部分以及N-甲基结构部分中的任何一个产生相互作用。在本文公开的技术的示例中,例如,在考虑溶剂分子的影响来识别相互作用势的情况下,设置参数,使得氨基酸衍生物x中的乙酰基结构部分和N-甲基结构部分都将不与溶剂分子相互作用,如图6所示。

在本文公开的技术的示例中,例如,在考虑溶剂分子的影响来识别相互作用势的情况下,优选地设置参数,使得溶剂分子彼此相互作用,如图6所示。

在本文公开的技术的示例中,通过在如图6中的示例中设置参数,使得乙酰基结构部分和N-甲基结构部分将均不会引起相互作用,可以评估氨基酸衍生物x中的氨基酸残基x与氨基酸衍生物y中的氨基酸残基y之间的相互作用。在本文公开的技术的示例中,这使得可以通过适当地评估氨基酸残基x与氨基酸残基y之间的相互作用来准确地识别氨基酸残基x与氨基酸残基y之间的相互作用势。

在本文公开的技术的示例中,如上所述制备包含氨基酸残基x并且通过将乙酰基结构部分和N-甲基结构部分添加至氨基酸残基x而获得的氨基酸衍生物x。在本文公开的技术的示例中,制备包含氨基酸残基y并且通过将乙酰基结构部分和N-甲基结构部分加至氨基酸残基y获得的氨基酸衍生物y。

以这种方式,在本文公开的技术的示例中,对于氨基酸残基x和氨基酸残基y中的每一个,可以考虑与两个相邻键合的氨基酸残基的肽键的影响。例如,在本文公开的技术的示例中,可以适当地评估作为计算目标(要计算针对其的相互作用势)的每个氨基酸残基中的肽的主链与所关注的氨基酸残基的链侧之间的相互作用。

在本文公开的技术的示例中,设置参数使得氨基酸衍生物x和氨基酸衍生物y中的乙酰基结构部分和N-甲基结构部分将均不会引起相互作用。

以这种方式,在本文公开的技术的示例中,可以适当地评估氨基酸衍生物x中的氨基酸残基x与氨基酸衍生物y中的氨基酸残基y之间的相互作用。

因此,在本文公开的技术的示例中,可以准确地评估每个氨基酸残基中的肽的主链与所关注的氨基酸残基的侧链之间的相互作用,以及氨基酸残基之间的相互作用,并且因此识别高度准确的相互作用势。

在本文公开的技术的示例中,由于如上所述考虑高度准确的相互作用势来识别肽的空间结构,因此即使当该肽包含具有未知相互作用势的氨基酸残基时,也可以准确地搜索该肽的稳定结构。

在本文公开的技术的示例中,通过以作为稳定结构搜索目标的化合物为肽且形成该化合物的化合物残基为氨基酸残基的情况作为示例提供了以上描述。本文公开的技术不限于上述示例,但是还能够在搜索其中多个化合物残基键合在一起的化合物的稳定结构时,以与如上所述相同的方式高度准确地搜索化合物的稳定结构。

在下文中,将详细描述本文公开的结构搜索方法的示例中的步骤。

本文公开的结构搜索方法包括例如识别相互作用势的步骤和识别空间结构的步骤,并且还包括所要求的其他步骤。

首先,本文公开的结构搜索方法可以是用于搜索其中多个化合物残基键合在一起的化合物的稳定结构的基于计算机的结构搜索方法。

此处,作为稳定结构搜索目标的化合物没有特别限制,只要它是其中多个化合物残基键合在一起的化合物即可,但是可以根据预期目的适当地选择。

对化合物残基没有特别限制,只要化合物残基能够键合在一起即可,但是可以根据预期目的适当地选择。化合物残基的示例包括氨基酸残基和反应性单体。例如,在化合物残基是氨基酸残基的情况下,该化合物可以是肽(蛋白质)。替代地,在化合物残基是反应性单体的情况下,该化合物可以是聚合物。在这些之中,在本文公开的技术的示例中优选地化合物残基为氨基酸残基并且化合物为肽(蛋白质)。

其中多个化合物残基键合在一起的化合物不限于直链化合物(单链),而可以是具有支链结构的化合物。

要从其获得氨基酸残基的氨基酸可以是天然氨基酸或非天然氨基酸(改性氨基酸或人工氨基酸)。天然氨基酸的示例包括丙氨酸、精氨酸、天冬酰胺、天冬氨酸、半胱氨酸、谷氨酰胺、谷氨酸、甘氨酸、组氨酸、异亮氨酸、亮氨酸、赖氨酸、蛋氨酸、苯丙氨酸、脯氨酸、丝氨酸、苏氨酸、色氨酸、酪氨酸、缬氨酸、β-丙氨酸、β-苯丙氨酸等。肽(蛋白质)中的氨基酸残基的数目没有特别限制,但可以根据预期目的适当地进行选择,并且例如为约10至50或几百个。

改性氨基酸的示例是通过修改(替换)如以上列出的任一种天然氨基酸的结构的一部分而获得的氨基酸。作为改性氨基酸,例如,可以使用通过对天然氨基酸等的结构的一部分进行甲基化而得到的氨基酸。此处,本文公开的技术的示例即使在化合物包含具有未知相互作用势的化合物基团例如以上所述的改性氨基酸时,也能够准确地搜索化合物的稳定结构。

由于在化合物残基是反应性单体时似乎通常是相互作用势未知的情况,因此优选将可以包含在化合物中的单体中的每一个都视为具有未知相互作用势的化合物残基。

在识别空间结构的步骤中,每个化合物残基优选地被视为可布置在三维晶格空间中的晶格点之一处的粒子。为此,优选地将每个化合物残基视为例如氨基酸残基的经粗粒化的粒子、单体的经粗粒化的粒子等。

例如,在将氨基酸残基视为经粗粒化的粒子的情况下,可以将肽中的每个氨基酸残基视为一个经粗粒化的粒子,或者可以将肽中的每个氨基酸残基划分为主链和侧链,并且视为单独的粒子(主链粒子和侧链粒子)。在将肽中的每个氨基酸残基划分为主链和侧链,并且将主链和侧链视为单独的粒子的情况下,不具有侧链的氨基酸的主链粒子(诸如例如,甘氨酸)优选地视为侧链粒子。

<识别相互作用势的步骤(相互作用势识别步骤)>

在识别相互作用势的步骤(相互作用势识别步骤)中,例如,识别多个化合物残基中的化合物残基x与化合物残基y之间的相互作用势。在以下的描述中,在一些情况下,“识别相互作用势”将被称为“计算相互作用势”,并且“识别相互作用势的步骤”将被称为“计算相互作用势的步骤”。

在识别相互作用势的步骤中,如上所述制备具有化合物残基x并且通过将包含饱和基团的结构部分x-1和包含饱和基团的结构部分x+1添加至化合物残基中x而获得的化合物衍生物x。

此处,化合物残基x与化合物残基x-1和化合物残基x+1相邻。化合物残基x-1和化合物残基x+1中的每一个具有与化合物残基x中的连接键所涉及的基团键合的官能团。

在化合物残基x-1和化合物残基x+1中的每一个中,与化合物残基x中的连接键所涉及的基团键合的官能团没有特别限制,但是可以根据预期选择目的适当地选择。在化合物残基x-1和化合物残基x+1中的每一个中,与化合物残基x中的连接键所涉及的基团键合的官能团的示例包括羟基、醛基、羰基、羧基、磺基、氨基等。

在识别相互作用势的步骤中,例如,将包含饱和基团的结构部分x-1和包含饱和基团的结构部分x+1添加至化合物残基x中,该包含饱和基团的结构部分x-1和包含饱和基团的结构部分x+1均由上述官能团之一和饱和基团组成,该饱和基团通过将氢原子键合至与所关注的官能团键合的原子以使该原子的化合价饱和而获得。

键合至官能团的原子没有特别限制,只要它是能够与另外的原子键合的原子既可,但是可以根据预期目的适当地选择。该原子的示例包括碳原子、氧原子、氮原子、硫原子、磷原子等。

通过使原子的化合价饱和而获得的饱和基团的示例包括甲基、羟基、氨基等。

在识别相互作用势的步骤中,例如,可以使用已知的分子建模软件将包含饱和基团的结构部分x-1和包含饱和基团的结构部分x+1添加至化合物残基x(化合物衍生物x的制备)。

在化合物是肽的情况下,氨基酸残基x中的肽键所涉及的氨基和氨基酸残基x中的肽键所涉及的羰基可以被部分化学改性。例如,在本文公开的技术的示例中,氨基酸残基x中的肽键所涉及的氨基可以是例如其中氨基中的氢被甲基取代(甲基化)的氨基。在本文公开的技术的示例中,例如,可以将乙酰基结构部分添加至如上所述甲基化的氨基侧末端。

在本文公开的技术的示例中,例如,如上所述对其中肽键所涉及的氨基或肽键所涉及的羰基进行改性的氨基酸残基被视为具有未知相互作用势的改性氨基酸残基。

在识别相互作用势的步骤中,例如,设置针对制备的化合物衍生物x的参数,使得包含饱和基团的结构部分x-1和包含饱和基团的结构部分x+1均不会引起相互作用。当化合物是肽时,设置参数使得氨基酸衍生物x中的乙酰基结构部分和N-甲基结构部分均不会引起相互作用。

在识别相互作用势的步骤中,例如,以与制备化合物衍生物x的方法相同的方法制备化合物衍生物y,该化合物衍生物y具有化合物残基y并且通过将包含饱和基团的结构部分y-1和包含饱和基团的结构部分y+1添加至化合物残基y而获得。

在识别相互作用势的步骤中,例如,以与设置针对化合物衍生物x的参数的方法相同的方法设置针对化合物衍生物y的参数,使得包含饱和基团的结构部分y-1和包含饱和基团的结构部分y+1均不会引起相互作用。

在识别相互作用势的步骤中,通过使用针对化合物衍生物x和化合物衍生物y设置的参数,识别(计算)化合物残基x和化合物残基y之间的相互作用势。

计算化合物残基x与化合物残基y之间的相互作用势的方法没有特别限制,只要该方法能够通过计算化合物残基x与化合物残基y之间的相互作用来计算相互作用势即可,但是也可以根据预期目的适当地选择。计算化合物残基x与化合物残基y之间的相互作用势的方法的示例包括使用分子力学的方法、使用分子动力学的方法等。作为计算相互作用势的方法,例如,还可以通过指定化合物残基x与化合物残基y的多个布置位置对并且对指定的布置位置对执行分子力学计算,使用蒙特卡洛(MC)方法来计算相互作用势。

在这些之中,优选使用分子动力学的方法作为计算化合物残基x与化合物残基y之间的相互作用势的方法。在本文公开的技术的示例中,计算相互作用势的步骤优选地包括通过分子动力学计算来计算化合物残基x与化合物残基y之间的相互作用势。以此方式,在本文公开的技术的示例的一方面,可以更适当地评估化合物残基x与化合物残基y之间的相互作用,并且可以以较高的准确性计算相互作用势。在通过分子动力学方法计算相互作用势的情况下,例如,可以使用分子力学方法来计算化合物残基x与化合物残基y之间的能量。

在下文中,将详细描述在识别相互作用势的步骤中通过使用分子动力学计算获得氨基酸残基之间的相互作用势的情况下的参数设置和相互作用势识别(计算)。

在通过分子动力学计算来计算相互作用势的情况下,可以例如通过设置氨基酸衍生物中的分子力场的参数来进行对每个氨基酸衍生物的参数的设置。

分子力场是例如被公式化为分子例如肽中存在的原子从其他原子接收的力的函数的数学表达式。在基于分子力场的分子力学计算或分子动力学计算中,通过使用由原子的类型和键状态决定的包括例如表示原子之间的键的参数(例如键长度和键角度)作为变量的势函数,将原子之间作用的力用数值表示。

在本文公开的技术的示例中,例如,调节和设置针对分子力场的参数,使得氨基酸衍生物x和氨基酸衍生物y中的乙酰基结构部分和N-甲基结构部分均不会引起相互作用。

分子力场没有特别限制,但是可以根据预期目的适当地选择。例如,可以使用创建的分子力场或现有的分子力场。

在创建和使用分子力场的情况下,例如,可以使用已知的分子力场创建软件来创建分子力场。

关于现有的分子力场,针对肽(蛋白质)的分子力场的示例包括:基于辅助模型构建和能量细化(Amber)的分子力场、基于哈佛化学大分子力学(CHARMm)的分子力场、基于液体模拟的优化势(OPLS)的分子力场等。基于Amber的分子力场的示例包括Amber ff99SB-ILDN、Amber12SB等。基于CHARMm的分子力场的示例包括CHARMm 36等。

关于分子力场,例如,可以使用作为针对有机化合物的通用分子力场的常规AMBER力场(GAFF)作为除肽(蛋白质)以外的化合物的现有力场。当肽包含改性氨基酸(非天然氨基酸)时,例如,可以使用通过使用分子力场创建软件GAFF等创建的分子力场作为改性氨基酸的分子力场。

在本文公开的技术的示例中,在参数的设置中调节表示原子的电荷的参数和表示分散力(范德华力)的参数,使得使乙酰基结构部分和N-甲基结构部分不会引起相互作用。

在本文公开的技术的示例中,例如,通过使用现有分子力场的值,固定乙酰基结构部分和N-甲基结构部分的电荷,使得各个结构部分的电荷的总值是整数,并且通过量子化学计算得到除这些结构部分以外的部分的电荷。

例如,在本文公开的技术的示例中,将乙酰基结构部分的电荷固定至“ACE基团”的电荷,该“ACE基团”是与乙酰基对应的残基类型,并且将N-甲基结构部分的电荷固定至“NME基团”的电荷,该“NME基团”是与N-甲基对应的残基类型。对于这些残基类型,通常设置各个原子的电荷使得残基类型的电荷的总值为整数。

在本文公开的技术的示例中,例如,通过量子化学计算对每个氨基酸衍生物执行结构优化以计算静电势,并且基于计算出的静电势,获得氨基酸衍生物中的电荷的参数。

优选地使用例如受抑制的静电势(RESP)电荷作为基于静电势而设置的氨基酸衍生物中的电荷。

如上所述,优选地获得氨基酸衍生物中的电荷的参数,使得乙酰基结构部分和N-甲基结构部分的电荷的总值为整数。

例如,为了使用Ewald方法或粒子网格Ewald方法(PME方法)——其为在使用周期性边界条件的分子动力学计算中以高速计算静电相互作用的方法,优选的是计算系统(计算单元)中电荷的总和为0。在分子动力学计算中,计算系统中包括抗衡离子例如Na+离子和Cl-离子以调节计算系统中的电荷。因此,当将乙酰基结构部分和N-甲基结构部分的电荷的总和设置为整数时,可以将计算系统(计算单元)中的电荷的总和容易地调节为0。通常,作为现有分子力场中“ACE基团”和“NME基团”的电荷的参数,设置各个原子的电荷使得这些基团的电荷的总和为0。

在本文公开的技术的示例中,在如上所述的针对氨基酸衍生物设置的参数中,例如,将针对乙酰基结构部分和N-甲基结构部分的表示电荷的参数和表示分散力的参数设置为0。可以例如通过校正用于设置针对氨基酸衍生物的参数的文件来完成将针对乙酰基结构部分和N-甲基结构部分的表示电荷的参数和表示分散力的参数设置为0。

在本文公开的技术的示例中,将针对乙酰基结构部分和N-甲基结构部分的表示电荷的参数和表示分散力的参数设置为0,使得可以将这些结构部分与其他分子的相互作用(施加至未与这些结构部分键合的原子的力)设置为0。例如,在本文公开的技术的示例中,将针对乙酰基结构部分和N-甲基结构部分的表示电荷的参数和表示分散力的参数设置为0,使得可以设置参数,使得乙酰基结构部分和N-甲基结构部分不会引起相互作用。

在本文公开的技术的示例中,例如,通过使用如上所述设置的使乙酰基结构部分和N-甲基结构部分不会引起相互作用的参数执行分子动力学计算来计算氨基酸残基x与氨基酸残基y之间的相互作用势。

分子动力学计算意为例如通过数值求解牛顿运动方程来模拟粒子(质点)例如原子的运动。

可以通过使用例如已知的分子动力学计算程序来执行分子动力学计算(分子动力学模拟)。分子动力学计算程序的示例包括AMBER、CHARMm、格罗宁根化学模拟机(Groningenmachine for chemical simulations)(GROMACS)、格罗宁根分子模拟(GROMOS)、纳米级分子动力学(NAMD)、myPresto、利用良好平衡系统的绝对结合自由能的大规模并行计算(MAPLECAFEE)(注册商标)等。

在分子动力学计算中,例如,在创建计算目标分子的初始结构之后,设置计算系统(计算单元)的尺寸,并且将溶剂分子(例如水分子)布置在计算目标分子周围。作为水分子的模型,例如,可以使用具有3点的可转移分子间电势(TIP3P)模型等。

在分子动力学计算中,例如,将Na+离子、Cl-离子等插入至计算单元中,使得计算单元中原子的电荷的总和为0,并且计算在周期性边界条件下作用在各个原子上的力。在分子动力学计算中,例如,基于牛顿运动方程来计算包括在计算系统中的每个原子如何通过接收力而移动。

在分子动力学计算中,优选地执行溶剂分子的结构弛豫和计算系统的尺寸的调节,以执行更稳定的模拟。溶剂分子的结构弛豫可以通过例如在计算系统的尺寸是固定的并且将位置约束施加至在目标分子的主链中的原子的条件下用固定数目的粒子、固定体积和固定温度的分子动力学计算(恒定的数目、体积和温度(NVT)计算)来执行。在执行溶剂分子的结构弛豫后,可以通过借助于例如使用固定数目的粒子、固定压力和固定温度的分子动力学计算(恒定的数目、压力和温度(NPT)计算)平衡整个计算系统来调节计算系统的尺寸。

在分子动力学计算中,例如,在如上所述的尺寸调节之后,可以通过对计算单元执行NVT计算或NPT计算来连续地执行更稳定的模拟。

分子动力学计算优选在例如约280K(开尔文)至320K的设置温度下执行。

在本文公开的技术的示例中,例如,通过使用使乙酰基结构部分和N-甲基结构部分不会引起相互作用的参数执行分子动力学计算,对氨基酸残基x和氨基酸残基y进行结构采样。

通过分子动力学计算对氨基酸残基x和氨基酸残基y的结构采样可以例如通过对其中氨基酸残基x和氨基酸残基y以预定距离布置的计算系统执行NPT计算来进行。以此方式,在本文公开的技术的示例中,例如,可以通过借助于分子动力学计算对氨基酸残基x和氨基酸残基y进行结构采样来分析氨基酸残基x与氨基酸残基y等之间的相互作用的大小。

在本文公开的技术的示例中,例如,氨基酸残基x和氨基酸残基y的自由能可以通过分析氨基酸残基x和氨基酸残基y的结构采样数据(例如轨迹数据)来获得。在本文公开的技术的示例中,例如,可以基于氨基酸残基x和氨基酸残基y的结构采样数据来获得针对氨基酸残基x与氨基酸残基y之间的距离的平均力势(PMF)。

PMF表示例如计算系统的自由能曲面(通过沿某个反应坐标绘制自由能而获得的曲面)。因此,例如,通过获得针对氨基酸残基x与氨基酸残基y之间的距离的PMF,可以获得取决于氨基酸残基x与氨基酸残基y之间的距离的自由能的变化。

在本文公开的技术的示例中,基于氨基酸残基x和氨基酸残基y的结构采样数据获得PMF的方法没有特别限制,但是可以根据预期目的适当地选择。基于氨基酸残基x和氨基酸残基y的结构采样数据获得PMF的方法的示例包括伞形采样法、副本交换伞形采样法、多正则法(multi-canonical method)等。在这些之中,优选地使用伞形采样法作为基于氨基酸残基x和氨基酸残基y的结构采样数据获得PMF的方法。

例如,在通过使用伞形采样法获得PMF的情况下,在约束(保留)氨基酸衍生物x与氨基酸衍生物y之间的距离的条件下,通过改变约束的距离来多次进行分子动力学计算。然后,例如,通过对分别借助于多次分子动力学计算而获得的采样数据的片段进行耦合,可以获得取决于氨基酸残基x与氨基酸残基y之间的距离的PMF。例如,根据取决于氨基酸残基x与氨基酸残基y之间的距离的PMF,可以获得其中设置了氨基酸残基x与氨基酸残基y之间的距离作为反应坐标的PMF的图(自由能形貌)。

例如,可以使用加权直方图分析法(WHAM方法)等作为对分别通过多次分子动力学计算而获得的采样数据的片段进行耦合的方法。

在本文公开的技术的示例中,例如,基于如上所述获得的PMF来计算氨基酸残基x与氨基酸残基y之间的相互作用势。氨基酸残基x与氨基酸残基y之间的相互作用势可以例如以以下方式计算:使得对取决于氨基酸残基x与氨基酸残基y之间的距离的PMF的值进行转换以对应于布置有氨基酸残基的三维晶格空间中氨基酸残基之间的距离。

在本文公开的结构搜索方法中的计算相互作用势的步骤中,例如,如上所述基于针对包括氨基酸残基x和氨基酸残基y的系统的分子动力学计算,获得取决于氨基酸残基x与氨基酸残基y之间的距离的PMF。在计算相互作用势的步骤中,例如,基于取决于氨基酸残基x与氨基酸残基y之间的距离的PMF,计算在创建肽的空间结构的步骤中可以使用的氨基酸残基x与氨基酸残基y之间的相互作用势。

在本文公开的技术的示例中,优选地对作为空间结构搜索目标的肽类型的所有组合进行氨基酸残基x与氨基酸残基y之间的相互作用势的上述计算。在本文公开的技术的示例的一方面,优选地计算多个氨基酸残基中两个氨基酸残基的所有组合的相互作用势。例如,在本文公开的技术的示例的一方面,优选地计算多个化合物残基中两种类型的化合物残基的所有组合的相互作用势。

因此,在本文公开的技术的示例中,在将形成化合物的多个氨基酸残基中的每一个布置在三维晶格空间中的晶格点之一处的操作中,可以考虑而不忽略高度准确的相互作用势,并且因此可以进一步提高搜索化合物的稳定结构的准确性。

本文公开的技术不限于以上示例。而是,例如,上述公知的相互作用势可以用于一般的天然氨基酸残基(20种类型的天然氨基酸)的组合。

<识别空间结构的步骤(空间结构识别步骤)>

在识别空间结构的步骤中,例如,通过考虑在识别相互作用势的步骤中获得的相互作用势将多个化合物残基顺序地布置在作为晶格点的集合的三维晶格空间中的某些晶格点处,来识别三维晶格空间中的化合物的空间结构。在以下描述中,在一些情况下,“识别空间结构”将被称为“创建空间结构”,并且“识别空间结构的步骤”将被称为“创建空间结构的步骤”。

在识别空间结构的步骤中,对识别(创建)三维晶格空间中的化合物的空间结构的方法没有特别限制,只要可以考虑在识别相互作用势的步骤中获得的相互作用势即可,但是可以根据预期目的适当地选择。在识别空间结构的步骤中,例如,可以适当地使用基于根据化合物的布置条件和约束的目标函数表达式来识别空间结构的方法,作为识别(创建)三维晶格空间中的化合物的空间结构的方法。

<<目标函数表达式>>

目标函数表达式通常是指组合优化问题中基于条件和约束的函数,并且是组合优化问题中当目标函数表达式中的变量(参数)的组合为最优时取最小值的函数。目标函数表达式(目标函数)也可以称为能量函数、成本函数、哈密顿函数等。

此处,通过将多个化合物残基顺序地布置在三维晶格空间中的某些晶格点处来识别三维晶格空间中的化合物的空间结构可以被认为是用于优化布置在晶格点处的化合物残基的组合的优化问题。因此,例如,通过搜索使目标函数表达式的值最小的变量的组合,可以搜索组合优化问题的解,或者可以搜索三维晶格空间中的化合物的稳定空间结构。

目标函数表达式没有特别限制,只要能够考虑在识别相互作用势的步骤中获得的相互作用势并且当化合物具有稳定的空间结构时取小的值即可,但是可以根据预期目的适当地选择。

目标函数表达式优选地包括例如至少以下四项:

■指示多个化合物残基中的每个化合物残基单独存在的项;

■指示多个化合物残基中的两个或更多个化合物残基在一个晶格点处不共存的项;

■指示多个化合物残基中的键合在一起的化合物残基存在于三维晶格空间中的相邻晶格点处的项;以及

■表示在识别相互作用势的步骤中获得的相互作用势的项。

此处,在以上列出的四项中,除表示相互作用势的项以外的三项可以被认为是例如要创建的化合物的空间结构为可以作为化合物一直存在的结构的约束项。这三个约束项可以被公式化为例如下述的项:当满足由每个项表示的约束时,所述项取小的值(例如,该值为0)。因此,本文公开的技术的示例能够搜索化合物的更合适的空间结构,这是因为例如当搜索出的化合物的空间结构是可以作为化合物一直存在的结构时,目标函数表达式取小的值。

可以将以上目标函数表达式中的表示相互作用势的项视为表示下述相互作用的项:以该相互作用,要识别的化合物的空间结构将是能量稳定结构。表示相互作用势的项可以被公式化为例如下述的项:当取决于布置在三维晶格空间中的晶格点处的化合物残基之间的距离而使相互作用较稳定(能量较低)时,所述项取较小值。因此,本文公开的技术的示例能够搜索化合物的更合适的空间结构,这是因为例如当搜索出的化合物的空间结构是能量上较稳定的结构时,目标函数表达式取较小的值。

例如,在本文公开的技术的示例中,基于包括以上列出的四项的目标函数表达式来识别化合物的空间结构,使得搜索出的空间结构将是可以作为化合物一直存在的结构和能量稳定的结构。

在本文公开的技术的示例中,优选地使用例如由以下表达式(1)表示的目标函数表达式。在本文公开的技术的示例中,例如,可以通过最小化(优化)以下表达式(1)来识别化合物的空间结构,并且从而搜索化合物的更稳定的结构。

E=Hone+Holap+Hconn+Hpair

...表达式(1)

在表达式(1)中,E是目标函数表达式。

Hone是指示多个化合物残基中的每个化合物残基单独存在的项。

Holap是指示多个化合物残基中的两个或更多个化合物残基在一个晶格点处不共存的项。

Hconn是指示多个化合物残基中的键合在一起的化合物残基存在于三维晶格空间中的相邻晶格点处的项。

Hpair是表示在识别相互作用势的步骤中获得的相互作用势的项。

在以上表达式(1)中,Hone、Holap和Hconn是例如下述约束项,利用该约束项,要识别的化合物的空间结构将是可以作为化合物一直存在的结构,并且上述约束项可以公式化为当满足由所述项表示的约束时取小的值(例如,值为0)的项。

在以上表达式(1)中,Hpair是例如表示下述相互作用的项,以所述相互作用,要识别的化合物的空间结构将是能量稳定的结构,并且所述项可以公式化为当相互作用较稳定(能量较低)时,取较小值的项。

稍后将描述针对以上表达式(1)中的Hone、Holap和Hconn以及Hpair的更具体的表述等。

此处,最小化目标函数表达式的方法没有特别限制,但是可以根据预期目的适当地选择。然而,优选的方法例如是基于从目标函数表达式转换并且由以下表达式(2)表示的伊辛模型表达式来执行最小化的方法。本文公开的技术的示例中,例如,优选地,基于从目标函数表达式转换并且由以下表达式(2)表示的伊辛模型表达式,通过优化处理来执行识别空间结构的步骤。由以下表达式(2)表示的伊辛模型表达式是以二次无约束二进制优化(QUBO)格式的伊辛模型表达式。

在以上表达式(2)中,E是从目标函数表达式转换的伊辛模型表达式,wij是表示第i位与第j位之间的相互作用的数值,bi是表示第i位的偏置的数值,xi是指示第i位为0或1的二进制变量,以及xj是指示第j位为0或1的二进制变量。

此处,对于xi和xj的每种组合,可以通过例如在转换为伊辛模型表达式之前提取目标函数表达式中的各个参数的数值等来获得以上表达式(2)中的wij,并且wij通常是矩阵。

以上表达式(2)的右侧的第一项是在没有遗漏和重复情况下,在可从所有电路中选择的两个电路的所有组合中的两个电路的状态与权重值的乘积之和。

以上表达式(2)的右侧的第二项通过将所有电路的偏置值与状态的乘积相加来获得。

例如,通过在转换为伊辛模型表达式之前提取目标函数表达式的参数并获得wij和bi,可以将目标函数表达式转换为由以上表达式(2)表示的伊辛模型表达式。

如上所述从目标函数表达式转换的伊辛模型表达式可以例如在短时间内通过使用退火机等执行退火方法而被优化(最小化)。例如,在本文公开的技术的示例中,优选的是,通过使用退火方法对伊辛模型表达式执行基态搜索,并且从而识别(计算)伊辛模型表达式的最低能量,来执行识别空间结构的步骤。

用于优化目标函数表达式的退火机的示例包括例如量子退火机、使用半导体技术的半导体退火机、执行通过使用中央处理单元(CPU)以及图形处理单元(GPU)的软件执行的模拟退火的机器等。作为退火机,例如,可以使用数字退火器(注册商标)。

稍后将描述使用退火机的退火方法的细节。

<其他步骤>

其他步骤没有特别限制,但是可以根据预期目的适当地选择。

(结构搜索设备)

本文公开的结构搜索设备是搜索其中多个化合物残基键合在一起的化合物的稳定结构的结构搜索设备,该结构搜索设备包括:

相互作用势识别单元,其识别多个化合物残基中的化合物残基x与化合物残基y之间的相互作用势;以及

空间结构识别单元,其通过考虑通过使用相互作用势识别单元识别的相互作用势将多个化合物残基顺序地布置在作为晶格点的集合的三维晶格空间中的某些晶格点处,来识别三维晶格空间中的化合物的空间结构,其中,

相互作用势识别单元通过以下步骤识别化合物残基x与化合物残基y之间的相互作用势:

设置针对化合物残基x的参数,使得包含化合物残基x的化合物衍生物x中的包含饱和基团的结构部分x-1和包含饱和基团的结构部分x+1不会引起相互作用,

包含饱和基团的结构部分x-1包括在与化合物残基x相邻的化合物残基x-1中,并且化合物残基x-1具有与化合物残基x中的连接键所涉及的基团键合的官能团,

包含饱和基团的结构部分x-1由官能团和饱和基团组成,该饱和基团通过将氢原子键合至与官能团键合的原子以使原子的化合价饱和而获得,

包含饱和基团的结构部分x+1包括在与化合物残基x相邻的化合物残基x+1中,并且化合物残基x+1具有与化合物残基x中的连接键所涉及的基团键合的官能团,

包含饱和基团的结构部分x+1由官能团和饱和基团组成,该饱和基团通过将氢原子键合至与官能团键合的原子以使原子的化合价饱和而获得,

化合物衍生物x通过将包含饱和基团的结构部分x-1和包含饱和基团的结构部分x+1添加至化合物残基x而获得,以及

设置针对化合物残基y的参数,使得包含化合物残基y的化合物衍生物y中的包含饱和基团的结构部分y-1和包含饱和基团的结构部分y+1不会引起相互作用,

包含饱和基团的结构部分y-1包括在与化合物残基y相邻的化合物残基y-1中,并且化合物残基y-1具有与化合物残基y中的连接键所涉及的基团键合的官能团,

包含饱和基团的结构部分y-1由官能团和饱和基团组成,该饱和基团通过将氢原子键合至与官能团键合的原子以使原子的化合价饱和而获得,

包含饱和基团的结构部分y+1包括在与化合物残基y相邻的化合物残基y+1中,并且化合物残基y+1具有与化合物残基y中的连接键所涉及的基团键合的官能团,

包含饱和基团的结构部分y+1由官能团和饱和基团组成,该饱和基团通过将氢原子键合至与官能团键合的原子以使原子的化合价饱和而获得,

化合物衍生物y通过将包含饱和基团的结构部分y-1和包含饱和基团的结构部分y+1添加至化合物残基y而获得。

本文公开的结构搜索设备可以是例如执行本文公开的结构搜索方法的设备。本文公开的结构搜索设备中的优选实施方式可以与本文公开的结构搜索方法中的优选实施方式相同。

(结构搜索程序)

本文公开的结构搜索程序是使计算机执行结构搜索以搜索其中多个化合物残基键合在一起的化合物的稳定结构的程序,该程序使计算机执行包括以下的处理:

识别多个化合物残基中的化合物残基x与化合物残基y之间的相互作用势;以及

通过考虑在识别相互作用势时获得的相互作用势将多个化合物残基顺序地布置在作为晶格点的集合的三维晶格空间中的某些晶格点处,来识别三维晶格空间中的化合物的空间结构,其中

识别相互作用势包括:通过以下步骤识别化合物残基x与化合物残基y之间的相互作用势:

设置针对化合物残基x的参数,使得包含化合物残基x的化合物衍生物x中的包含饱和基团的结构部分x-1和包含饱和基团的结构部分x+1不会引起相互作用,

包含饱和基团的结构部分x-1包括在与化合物残基x相邻的化合物残基x-1中,并且化合物残基x-1具有与化合物残基x中的连接键所涉及的基团键合的官能团,

包含饱和基团的结构部分x-1由官能团和饱和基团组成,该饱和基团通过将氢原子键合至与官能团键合的原子以使原子的化合价饱和而获得,

包含饱和基团的结构部分x+1包括在与化合物残基x相邻的化合物残基x+1中,并且化合物残基x+1具有与化合物残基x中的连接键所涉及的基团键合的官能团,

包含饱和基团的结构部分x+1由官能团和饱和基团组成,该饱和基团通过将氢原子键合至与官能团键合的原子以使原子的化合价饱和而获得,

化合物衍生物x通过将包含饱和基团的结构部分x-1和包含饱和基团的结构部分x+1添加至化合物残基x而获得,以及

设置针对化合物残基y的参数,使得包含化合物残基y的化合物衍生物y中的包含饱和基团的结构部分y-1和包含饱和基团的结构部分y+1不会引起相互作用,

包含饱和基团的结构部分y-1包括在与化合物残基y相邻的化合物残基y-1中,并且化合物残基y-1具有与化合物残基y中的连接键所涉及的基团键合的官能团,

包含饱和基团的结构部分y-1由官能团和饱和基团组成,该饱和基团通过将氢原子键合至与官能团键合的原子以使原子的化合价饱和而获得,

包含饱和基团的结构部分y+1包括在与化合物残基y相邻的化合物残基y+1中,并且化合物残基y+1具有与化合物残基y中的连接键所涉及的基团键合的官能团,

包含饱和基团的结构部分y+1由官能团和饱和基团组成,该饱和基团通过将氢原子键合至与官能团键合的原子以使原子的化合价饱和而获得,

化合物衍生物y通过将包含饱和基团的结构部分y-1和包含饱和基团的结构部分y+1添加至化合物残基y而获得。

本文公开的结构搜索程序可以是例如使计算机执行本文公开的结构搜索方法的程序。本文公开的结构搜索程序中的优选实施方式可以与本文公开的结构搜索方法中的优选实施方式相同。

可以使用各种已知程序语言中的任何一种来创建本文公开的结构搜索程序,这取决于诸如计算机系统的配置以及所使用的操作系统的类型和版本的条件。

本文公开的结构搜索程序可以记录在诸如内部硬盘、外部硬盘等的记录介质上,或者记录在诸如光盘只读存储器(CD-ROM)、数字通用盘只读存储器(DVD-ROM)、磁光(MO)盘或通用串行总线(USB)存储器的记录介质上。

在本文公开的结构搜索程序被记录在上述记录介质上的情况下,结构搜索程序可以被直接使用或者通过根据要求借助于包括在计算机系统中的记录介质读取器被安装在硬盘上来使用。本文公开的结构搜索程序可以被记录在可通过信息通信网络从计算机系统访问的外部存储区域(另一计算机等)中。在这种情况下,记录在外部存储区域中的本文公开的结构搜索程序可以被直接使用,或者通过根据要求通过信息通信网络从外部存储区域被安装在硬盘上来使用。

本文公开的结构搜索程序可以被划分为某些处理单元,其可以被记录在多个记录介质上。

(计算机可读记录介质)

通过记录本文公开的结构搜索程序来获得本文公开的计算机可读记录介质。

本文公开的计算机可读记录介质没有特别限制,但是可以根据预期目的适当地选择。计算机可读记录介质的示例包括内部硬盘、外部硬盘、CD-ROM、DVD-ROM,MO盘、USB存储器等。

本文公开的计算机可读记录介质可以是多个记录介质,多个记录介质中的每一个在其中记录本文公开的结构搜索程序被划分为的某些处理单元中的一个。

(相互作用势识别方法)

本文公开的相互作用势识别方法是识别其中多个化合物残基键合在一起的化合物中的化合物残基之间的相互作用势的基于计算机的相互作用势识别方法,该方法包括通过以下步骤识别多个化合物残基中的化合物残基x与化合物残基y之间的相互作用势:

设置针对化合物残基x的参数,使得包含化合物残基x的化合物衍生物x中的包含饱和基团的结构部分x-1和包含饱和基团的结构部分x+1不会引起相互作用,

包含饱和基团的结构部分x-1包括在与化合物残基x相邻的化合物残基x-1中,并且化合物残基x-1具有与化合物残基x中的连接键所涉及的基团键合的官能团,

包含饱和基团的结构部分x-1由官能团和饱和基团组成,该饱和基团通过将氢原子键合至与官能团键合的原子以使原子的化合价饱和而获得,

包含饱和基团的结构部分x+1包括在与化合物残基x相邻的化合物残基x+1中,并且化合物残基x+1具有与化合物残基x中的连接键所涉及的基团键合的官能团,

包含饱和基团的结构部分x+1由官能团和饱和基团组成,该饱和基团通过将氢原子键合至与官能团键合的原子以使原子的化合价饱和而获得,

化合物衍生物x通过将包含饱和基团的结构部分x-1和包含饱和基团的结构部分x+1添加至化合物残基x而获得,以及

设置针对化合物残基y的参数,使得包含化合物残基y的化合物衍生物y中的包含饱和基团的结构部分y-1和包含饱和基团的结构部分y+1不会引起相互作用,

包含饱和基团的结构部分y-1包括在与化合物残基y相邻的化合物残基y-1中,并且化合物残基y-1具有与化合物残基y中的连接键所涉及的基团键合的官能团,

包含饱和基团的结构部分y-1由官能团和饱和基团组成,该饱和基团通过将氢原子键合至与官能团键合的原子以使原子的化合价饱和而获得,

包含饱和基团的结构部分y+1包括在与化合物残基y相邻的化合物残基y+1中,并且化合物残基y+1具有与化合物残基y中的连接键所涉及的基团键合的官能团,

包含饱和基团的结构部分y+1由官能团和饱和基团组成,该饱和基团通过将氢原子键合至与官能团键合的原子以使原子的化合价饱和而获得,

化合物衍生物y通过将包含饱和基团的结构部分y-1和包含饱和基团的结构部分y+1添加至化合物残基y而获得。

例如,可以以与本文公开的结构搜索方法中的识别相互作用势的步骤相同的方式来执行本文公开的相互作用势识别方法。本文公开的相互作用势识别方法中的优选实施方式可以与例如本文公开的结构搜索方法中的识别相互作用势的步骤中的优选实施方式相同。

在下文中,将通过使用设备、流程图等的配置示例来更详细地描述本文公开的技术的示例。

图7示出了本文公开的结构搜索设备的硬件配置示例。

在结构搜索设备100中,例如,控制单元101、主存储装置102、辅助存储装置103、输入/输出(I/O)接口104、通信接口105、输入装置106、输出装置107和显示装置108经由系统总线109彼此耦合。

控制单元101执行运算(例如四则算术运算、比较运算和退火方法运算)、硬件和软件的操作控制等。控制单元101可以是例如中央处理单元(CPU)、用于退火方法的退火机的一部分或它们的组合。

控制单元101通过例如执行读取到主存储装置102等中的程序(诸如例如,本文公开的结构搜索程序)来实现各种功能。

例如,由本文公开的结构搜索设备中的相互作用势识别单元和空间结构识别单元执行的处理可以由控制单元101执行。

主存储装置102存储各种程序,并且存储要用于执行各种程序的数据等。作为主存储装置102,例如,可以使用包括只读存储器(ROM)和随机存取存储器(RAM)中的至少一个的存储装置。

ROM存储例如各种程序,例如基本输入/输出系统(BIOS)。ROM没有特别限制,但是可以根据预期目的适当地选择,并且ROM的示例包括掩模ROM、可编程ROM(PROM)等。

RAM用作例如工作区,在该工作区中,存储在ROM、辅助存储装置103等中的各种程序在由控制单元101执行时被扩展。RAM没有特别限制,但是可以根据预期目的适当地选择,并且RAM的示例包括动态随机存取存储器(DRAM)、静态随机存取存储器(SRAM)等。

辅助存储装置103没有特别限制,只要它能够存储各种信息即可,但是可以根据预期目的适当地选择。辅助存储装置103的示例包括固态驱动器(SSD)、硬盘驱动器(HDD)等。辅助存储装置103可以是便携式存储装置,例如光盘(CD)驱动器、数字通用盘(DVD)驱动器或蓝光(注册商标)盘(BD)驱动器。

本文公开的结构搜索程序存储在例如辅助存储装置103中,被加载到主存储装置102的RAM(主存储器)中,并且由控制单元101执行。

I/O接口104是用于耦接至各种外部装置的接口。I/O接口104允许从以下装置的数据输入以及将数据输出至以下装置:例如光盘只读存储器(CD-ROM)、数字通用盘只读存储器(DVD-ROM)、磁光(MO)盘、通用串行总线(USB)存储器[USB闪存驱动器]等。

通信接口105没有特别限制,并且可以适当地使用任何已知的接口。通信接口105的示例是无线或有线通信装置等。

输入装置106没有特别限制,只要其能够接收对结构搜索设备100的各种请求和信息的输入即可,并且可以适当地使用任何已知的装置。输入装置106的示例包括键盘、鼠标、触摸面板、麦克风等。当输入装置106是触摸面板(触摸显示器)时,输入装置106还可以用作显示装置108。

输出装置107没有特别限制,并且可以适当地使用任何已知的装置。输出装置107的示例是打印机等。

显示装置108没有特别限制,并且可以适当地使用任何已知的显示装置。显示装置108的示例包括液晶显示器、有机EL显示器等。

图8示出了本文公开的结构搜索设备的另一硬件配置示例。

在图8所示的示例中,结构搜索设备100被划分为执行识别相互作用势的处理、定义目标函数的处理以及其他处理的计算机200,以及执行伊辛模型表达式的优化(基态搜索)的退火机300。在图8所示的示例中,结构搜索设备100中的计算机200和退火机300经由网络400彼此耦合。

在图8所示的示例中,例如,可以使用CPU等作为计算机200中的控制单元101a,并且可以使用专用于退火方法(退火)的装置作为退火机300中的控制单元101b。

在图8所示的示例中,例如,计算机200通过执行识别相互作用势的处理以及进行用于定义目标函数表达式的各种设置来定义目标函数表达式,并且将所定义的目标函数表达式转换为伊辛模型表达式。计算机200经由网络400将关于伊辛模型表达式中的权重(wij)和偏置(bi)的值的信息发送至退火机300。

退火机300基于所接收的关于权重(wij)和偏置(bi)的值的信息来优化(最小化)伊辛模型表达式,并且获得伊辛模型表达式的最小值和给出最小值的位的状态。退火机300经由网络400将所获得的伊辛模型表达式的最小值和所获得的给出最小值的位的状态发送至计算机200。

随后,计算机200基于所接收到的给出伊辛模型表达式的最小值的位的状态来获得化合物的稳定结构等。

图9示出了本文公开的结构搜索设备的功能配置示例。

如图9所示,结构搜索设备100包括通信功能单元120、输入功能单元130、输出功能单元140、显示功能单元150、存储功能单元160和控制功能单元170。

例如,通信功能单元120向外部装置发送各种数据,以及从外部装置接收各种数据。例如,通信功能单元120可以从外部装置接收作为稳定结构搜索目标的化合物的结构数据、从目标函数表达式转换的伊辛模型表达式中的偏置和权重的数据等。

输入功能单元130例如接收对结构搜索设备100的各种指令。例如,输入功能单元130可以接收作为稳定结构搜索目标的化合物的结构数据、从目标函数表达式转换的伊辛模型表达式中的偏置和权重的数据的输入等。

输出功能单元140例如打印并输出搜索出的化合物的稳定结构的数据等。

显示功能单元150例如在显示器上显示搜索出的化合物的稳定结构的数据等。

存储功能单元160例如存储各种程序、作为稳定结构搜索目标的化合物的结构数据、要用于分子动力学计算的参数文件(拓扑文件)、识别出的相互作用势的数据、搜索出的化合物的稳定结构的数据等。

控制功能单元170包括相互作用势识别单元171和空间结构识别单元175。

相互作用势识别单元(相互作用势计算单元)171例如识别化合物残基x与化合物残基y之间的相互作用势。相互作用势识别单元171包括化合物衍生物生产单元172、参数设置单元173和分子动力学计算单元174。

化合物衍生物生产单元172生产和制备例如包含化合物残基x的化合物衍生物x和包含化合物残基y的化合物衍生物y。例如,参数设置单元173设置参数,使得化合物衍生物x和化合物衍生物y中的包含饱和基团的结构部分x-1、x+1、y-1和y+1均不会引起相互作用。分子动力学计算单元174例如对包括化合物衍生物x和化合物衍生物y的计算系统执行分子动力学计算。

例如,空间结构识别单元(空间结构创建单元)175通过考虑使用相互作用势识别单元识别的相互作用势将多个化合物残基顺序地布置在作为晶格点的集合的三维晶格空间中的某些晶格点处,来识别三维晶格空间中的化合物的空间结构。空间结构识别单元175包括目标函数表达式创建单元176和优化处理单元177。

例如,目标函数表达式创建单元176创建将用于创建化合物的空间结构的目标函数表达式,并且将所创建的目标函数表达式转换为伊辛模型表达式。例如,优化处理单元177通过使用退火方法对伊辛模型表达式执行基态搜索来计算伊辛模型表达式的最低能量。

图10示出了用于通过使用本文公开的技术的示例来识别用于搜索肽的稳定结构的相互作用势的流程图的示例。

首先,相互作用势识别单元171识别作为稳定结构搜索目标的肽中的氨基酸残基的序列(S101)。例如,在S101中,相互作用势识别单元171识别包括在作为稳定结构搜索目标的肽中的氨基酸残基的类型以及肽中氨基酸残基的键合顺序。

接下来,相互作用势识别单元171从包括在肽中的氨基酸残基中选择氨基酸残基x和氨基酸残基y(S102)。例如,在S102中,相互作用势识别单元171从包括在肽中的氨基酸残基中选择两个氨基酸残基。

接下来,相互作用势识别单元171将乙酰基结构部分和N-甲基结构部分添加至氨基酸残基x和氨基酸残基y中的每一个以制备氨基酸衍生物x和氨基酸衍生物y(S103)。例如,在S103中,相互作用势识别单元171制备包含氨基酸残基x的氨基酸衍生物x,氨基酸衍生物x通过将乙酰基结构部分和N-甲基结构部分添加至氨基酸残基x而获得。在S103中,相互作用势识别单元171制备包含氨基酸残基y的氨基酸衍生物y,氨基酸衍生物y通过将乙酰基结构部分和N-甲基结构部分添加至氨基酸残基y而获得。

随后,相互作用势识别单元171设置针对氨基酸衍生物x和氨基酸衍生物y的分子力场的参数,使得乙酰基结构部分和N-甲基结构部分均不会引起相互作用(S104)。例如,在S104中,通过使用现有分子力场的值来固定乙酰基结构部分和N-甲基结构部分的电荷,使得结构部分的电荷的总值是整数,并且通过量子化学计算获得除这些结构部分以外的部分的电荷。在S104中,例如,将针对乙酰基结构部分和N-甲基结构部分的表示电荷的参数和表示分散力的参数设置为0。

然后,在约束氨基酸衍生物x与氨基酸衍生物y之间的距离的条件下,相互作用势识别单元171使用具有设置的参数的分子力场通过改变约束的距离来多次执行分子动力学计算(S105)。例如,在S105中,在改变距离的范围内通过使用S104中设置的分子力场将其中改变氨基酸衍生物x与氨基酸衍生物y之间的距离的分子动力学计算执行预定次数,从而对氨基酸衍生物x和氨基酸衍生物y进行结构采样。

接下来,相互作用势识别单元171基于通过借助于分子动力学计算对氨基酸衍生物x和氨基酸衍生物y进行结构采样而获得的氨基酸衍生物x和氨基酸衍生物y的分布数据来获得PMF(S106)。例如,在S106中,相互作用势识别单元171通过例如耦接通过S105中的多次分子动力学计算获得的采样数据的片段,计算取决于氨基酸残基x与氨基酸残基y之间的距离的PMF。

接下来,相互作用势识别单元171基于PMF识别(计算)氨基酸残基x与氨基酸残基y之间的相互作用势(S107)。在S107中,例如,以以下方式计算相互作用势:使得对取决于氨基酸残基x与氨基酸残基y之间的距离的PMF的值进行转换以对应于布置有氨基酸残基的三维晶格空间中的氨基酸残基之间的距离。

随后,相互作用势识别单元171确定是否已经针对包括在肽中的两种类型的氨基酸残基的所有组合识别了相互作用势(S108)。例如,在相互作用势识别单元171在S108中确定尚未针对两种类型的氨基酸残基的所有组合识别相互作用势时,相互作用势识别单元171将处理返回至S102。另一方面,当相互作用势识别单元171在S108中确定已经针对两种类型的氨基酸残基的所有组合识别了相互作用势时,相互作用势识别单元171结束处理。在相互作用势识别单元171在S108中将处理返回至S102时,相互作用势识别单元171优选地在S102中选择尚未针对其识别相互作用势的氨基酸残基x和氨基酸残基y。

图11示出了考虑使用本文中公开的技术的示例识别的相互作用势来搜索肽的稳定结构的流程图的示例。

首先,空间结构识别单元175限定三维晶格空间(S201)。例如,在S201中,空间结构识别单元175限定三维晶格空间,该三维晶格空间是用于基于作为稳定结构搜索目标的肽中的氨基酸残基的编号来顺序地布置多个氨基酸残基的晶格点的集合。

在下文中,将描述三维晶格空间的限定的示例。尽管晶格空间实际上是三维的,但是为了简化,下面将给出二维情况的描述作为示例。

首先,在菱形晶格空间中具有半径r的区域内的晶格点的集合被称为壳(Shell),并且每个晶格点被称为Sr。晶格点Sr可以如图12所示来表示。

当晶格点Sr如图12中所限定时,例如,第一氨基酸残基至第五氨基酸残基的目的地晶格点的集合V1至V5如图13A至图13D所示。

在图13A中,V1=S1并且V2=S2。类似地,在图13B中V3=S3,在图13C中V4=S2和S4,并且在图13D中V5=S3和S5

S1、S2和S3的三维表示如图14所示。在图14中,A=S1,B=S2,并且C=S3

具有n个氨基酸残基的肽中第i个氨基酸残基所要求的空间Vi由以下表达式表示。

此处,i={1,2,3,...,n}。

然后,针对奇数(i=奇数)氨基酸残基,J={1,3,...,i},或者针对偶数(i=偶数)氨基酸残基,J={2,4,...,i}。

随后,返回至图11,空间结构识别单元175将针对第i个氨基酸残基的目的地晶格点的集合限定为Vi(S202)。作为在S202中将第i个氨基酸残基的目的地晶格点的集合限定为Vi的结果,限定了用于布置每个氨基酸残基的空间。

接下来,空间结构识别单元175将用于计算的位分配到晶格点(S203)。在S203中,例如,空间结构识别单元175将空间信息分配给位X1至位Xn中的每一个。

例如,如图15A至图15C所示,位被分配到用于布置氨基酸残基的空间,每个具有值“1”的位指示在所关注的晶格点处存在氨基酸残基,或者每个具有值“0”的位指示在所关注的晶格点处不存在氨基酸残基。尽管为了便于说明,在图15A至图15C中针对氨基酸残基2至4中的每一个分配了多个位Xi,但是实际上针对一个氨基酸残基分配一个位Xi

接下来,返回至图11,空间结构识别单元175考虑计算的相互作用势来定义由以下表达式(1)表示的目标函数表达式(S204)。

E=Hone+Holap+Hconn+Hpair

...表达式(1)

在表达式(1)中,E是目标函数表达式。

Hone是指示多个化合物残基中的每个化合物残基单独存在的项。

Holap是指示多个化合物残基中的两个或更多个化合物残基在一个晶格点处不共存的项。

Hconn是指示多个化合物残基之中的键合在一起的化合物残基存在于三维晶格空间中的相邻晶格点处的项。

Hpair是表示在识别相互作用势的步骤中获得的相互作用势的项。

在下文中,将描述在以上表达式(1)中的每个项的示例。

在下面将要描述的图16至图19B中,X1表示编号为1的氨基酸残基可布置的位置。X2至X5表示编号为2的氨基酸残基可布置的位置。X6至X13表示编号为3的氨基酸残基可布置的位置。X14至X29表示编号为4的氨基酸残基可布置的位置。

下面呈现Hone的示例。

在Hone中,Xa和Xb中的每一个取1或0。例如,由于在图16中X2、X3、X4和X5中仅一个取1,因此如果X2、X3、X4和X5中的两个或更多个为1,则Hone是增加能量的函数,并且如果X2、X3、X4和X5中仅一个为1,则Hone是取0的惩罚项。

在Hone中,λone是加权系数。

下面呈现Holap的示例。

在Holap中,Xa和Xb中的每一个取1或0。例如,在图17中,当X2为1时,如果X14为1,则Holap是产生惩罚的项。

在Holap中,λolap是加权系数。

下面呈现Hconn的示例。

Hconn是用于评估氨基酸残基之间的连接键的函数,并且Xd和Xu中的每一个取1或0。例如,在图18中,当X2为1时,如果X13、X6和X7中的任一个为1,则Hconn是降低能量的表达式,并且如果肽中的所有氨基酸残基键合在一起同时满足键合序列,则Hconn是取0的惩罚项。

在Hconn中,λconn是加权系数。例如,可以设置关系λoneconn

通过转化以上表达式,如果肽中的氨基酸残基键合在一起,则Hconn可以形成为将其值降低至负值的函数。

下面呈现Hpair的示例。

在Hpair中,Xa和Xb中的每一个取1或0。例如,在图19A和图19B中,当X1为1时,如果X15为1,则Hpair是由于作用在氨基酸残基X1与氨基酸残基X15之间的相互作用Pω(x1)ω(x15)而改变能量的函数。相互作用Pω(x1)ω(x15)例如通过本文中公开的技术中识别相互作用势的步骤来确定。

随后,返回至图11,空间结构识别单元175将目标函数表达式转换为表达式(2)中的伊辛模型表达式(S205)。例如,在S205中,空间结构识别单元175提取目标函数表达式中的参数,并且获得以下表达式(2)中的bi(偏置)和wij(权重),从而将目标函数表达式转换为由以下表达式(2)表示的伊辛模型表达式。

在以上表达式(2)中,E是从目标函数表达式转换的伊辛模型表达式,wij是表示第i位与第j位之间的相互作用的数值,bi是表示针对第i位的偏置的数值,xi是指示第i位是0或1的二进制变量,并且xj是指示第j位是0或1的二进制变量。

接下来,空间结构识别单元175通过使用退火机使以上表达式(2)最小化(S206)。例如,在S206中,空间结构识别单元175使用退火方法对以上表达式(2)执行基态搜索(优化计算),以计算以上表达式(2)的最小值,从而识别向目标函数表达式赋予最小值的位的状态。

随后,空间结构识别单元175基于向以上表达式(2)赋予最小值的位的状态来识别(创建)肽的空间结构,并且从而识别肽的稳定结构(S207)。例如,在S207中,空间结构识别单元175通过基于赋予以上表达式(2)最小值的位的状态在三维晶格空间中顺序布置氨基酸残基来识别(创建)肽的空间结构,并且从而识别肽的稳定结构。

空间结构识别单元175输出肽的稳定结构,并且结束该处理。肽的稳定结构可以作为肽的空间结构图输出,或者可以作为关于形成肽的氨基酸残基的坐标信息输出。

尽管已经根据图10和图11中的特定顺序描述了本文中公开的技术的示例中的处理序列,但是本文中公开的技术中的步骤顺序可以在技术上可能的范围内适当地改变。在本文中公开的技术中,一些步骤可以在技术上可能的范围内共同执行。

图20A至图20C示出了计算氨基酸残基之间的相互作用势的方法的另一示例。

作为示例,考虑如图20A所示的氨基酸残基的主链和侧链是粗粒化的并且在图20B中作为单独的粒子布置在晶格点处的情况。在图20A中,粒子1至4是在分别不同的氨基酸残基中形成主链的粒子,粒子5是在主链中具有粒子1的氨基酸残基的侧链,并且粒子6是在主链中具有粒子3的氨基酸残基的侧链。

针对图20A所示的粒子,“qi a”表示代表粒子a的第i位变量(0或1),并且“R(i)”和“R(j)”表示分别由第i和第j位变量表示的氨基酸残基的类型。此外,“JR(i)R(j)”表示氨基酸残基R(i)与氨基酸残基R(j)之间的相互作用势。

在这种情况下,如果作为执行结构搜索的结果,粒子如图20C所示地布置,则假设相互作用发生在所有未键合在一起的粒子对之间,以下八个粒子对引起相互作用。

“qm 5-qn 6、qm 5-qj 2、qm 5-qk 3、qm 5-ql 4、qn 6-qi 1、qn 6-qj 2、qn 6-qk 3和qn 6-ql 4

以上八个对中的相互作用(Hpair)可以例如根据以下表达式来计算。

Hpair+=JR(i)R(j)×qi a×qj b

因此,在本文中公开的技术的示例中,可以通过考虑例如未键合在一起的粒子的所有组合的相互作用势来创建空间结构,从而搜索稳定的结构。

下面将描述退火方法和退火机的一个示例。

退火方法是通过使用随机数值或量子位的叠加随机获得解的方法。在下文中,将作为示例描述使期望被优化的评估函数的值最小化的问题,并且评估函数的值将被称为能量。当期望使评估函数的值最大化时,评估函数的符号可以改变。

首先,从初始状态开始,其中向每个变量分配一个离散值,考虑从当前状态(变量的值的组合)至接近当前状态的所选择的状态(例如,变量中的仅一个被改变的状态)的状态转变。计算与状态转变相关联的能量变化,并且根据计算的能量变化的值随机确定是接受状态转变并且改变状态还是保持原始状态而不接受状态转变。当能量减少的情况下的接受概率被选择为高于能量增加的情况下的接受概率时,预期在能量平均减少的方向上发生状态变化,并且状态随时间转变为更合适的状态。因此,有可能最终获得给出最优解或接近最优值处的能量的近似解。

如果在能量减少的情况下确定性地接受状态转变,能量的变化将随时间微弱地减少。然而,一旦达到局部解,状态转变将不再发生。由于在如上所述的离散优化问题中存在非常大量的局部解,因此状态经常停留在不太接近最优值的局部解处。出于这个原因,在解决离散优化问题时,随机确定是否接受状态是重要的。

在退火方法中,已经证明通过确定如下确定的状态转变的接受概率,状态在无限次数(迭代次数)的限制下达到最优解。

在下文中,将描述使用退火方法确定最优解的方法的序列。

(1)针对与状态转变相关联的能量变化(能量减少)值(-ΔE),针对状态转变的接受概率p由以下函数f()中的任一个确定。

p(ΔE,T)=f(-ΔE/T) (表达式1-1)

fmetro(x)=min(1,ex) (蒙特卡洛方法)(表达式1-2)

(吉布斯方法)(表达式1-3)

此处,T是被称为温度值的参数并且可以例如如下来改变。

(2)温度值T根据由以下公式表示的迭代次数t以对数方式减小。

此处,T0表示初始温度值,并且根据问题被理想地设置为足够大的值。

在充分的迭代之后达到由表达式(1)表示的接受概率和稳态的情况下,每个状态被占用的概率遵循热力学中热平衡状态下的玻尔兹曼分布。

当温度从高温逐渐降低时,低能态被占用的概率增加。出于这个原因,当温度充分降低时,预期获得低能态。这种方法被称为退火方法(或模拟退火方法),这是因为这种行为类似于材料退火中的状态变化。能量增加的状态转变的随机发生相当于物理学中的热激发。

图21示出了执行退火方法的退火机的功能配置的示例。尽管下面的描述也将说明用于产生状态转变的多个候选的情况,但是在基本退火方法中一次产生一个转变候选。

退火机300包括保持当前状态S(多个状态变量的值)的状态保持单元111。退火机300还包括能量计算单元112,该能量计算单元112在作为改变多个状态变量的值中的任一个的结果而从当前状态S发生状态转变的情况下,针对状态转变中的每一个计算能量变化值{-ΔEi}。退火机300包括控制温度值T的温度控制单元113和控制状态变化的转变控制单元114。退火机300可以被配置成上述结构搜索设备100的一部分。

转变控制单元114基于温度值T、能量变化值{-ΔEi}和随机数值,根据能量变化值{-ΔEi}与热激发能量之间的相对关系,随机地确定是否接受多个状态转变中的任一个。

转变控制单元114包括:候选生成单元114a,其生成针对状态转变的候选;以及可接受性确定单元114b,其基于能量变化值{-ΔEi}和温度值T随机地确定候选中的每一个中的状态转变是否为可接受的。转变控制单元114包括:转变确定单元114c,其从被确定为可接受的候选中确定要实际使用的候选;以及随机数生成单元114d,其生成概率变量。

退火机300在一次迭代中的操作如下。

首先,候选生成单元114a生成用于从由状态保持单元111保持的当前状态S到下一状态的状态转变的一个或更多个候选(候选数{Ni})。能量计算单元112通过使用当前状态S和针对状态转变的候选来计算在候选中的每一个中指定的针对状态转变的能量变化值{-ΔEi}。可接受性确定单元114b通过使用在温度控制单元113中生成的温度值T和在随机数生成单元114d中生成的概率变量(随机数值),根据针对状态转变的能量变化值{-ΔEi},以由以上表达式(1)表示的接受概率将状态转变中的每一个确定为可接受的。

可接受性确定单元114b输出每个状态转变的可接受性{fi}。在多个状态转变被确定为可接受的情况下,转变确定单元114c通过使用随机数值随机选择其中之一。然后,转变确定单元114c输出所选择的状态转变的转变数N和转变可接受性f。在存在接受的状态转变的情况下,根据接受的状态转变更新存储在状态保持单元111中的状态变量的值。

从初始状态开始,迭代上述操作,同时使温度控制单元113降低温度值,并且当达到一定数目的迭代时或者当满足结束确定条件例如能量变得低于预定值的条件时,结束上述操作。由退火机300输出的答案是结束时的状态。

图21所示的退火机300可以通过使用例如半导体集成电路来实现。例如,转变控制单元114可以包括用作随机数生成单元114d的随机数生成电路、用作可接受性确定单元114b的至少一部分的比较器电路、稍后将描述的噪声表等。

关于图21所示的转变控制单元114,将更详细地描述利用由表达式(1)表示的接受概率来接受状态转变的机制。

以接受概率p输出1并且以接受概率(1-p)输出0的电路可以通过下述操作实现:使用具有两个输入A和B并且当A>B时输出1以及当A<B时输出0的比较器,并且将接受概率p输入至输入A以及将具有单位间隔[0,1)中的值的均匀随机数输入至输入B。因此,当将通过使用基于能量变化值和温度值T的表达式(1)计算的接受概率p的值输入至比较器的输入A时,可以实现以上功能。

例如,假设f表示表达式(1)中使用的函数,并且u表示具有单位间隔[0,1)中的值的均匀随机数,则当f(ΔE/T)大于u时输出1的电路实现以上功能。

即使当进行如下修改时,该电路也可以实现与上述相同的功能。

即使当对两个数应用相同的单调递增函数时,两个数也保持相同的大小关系。因此,即使当将相同的单调递增函数应用于比较器的两个输入时,也获得相同的输出。当使用f的反函数f-1作为这个单调递增函数时,可以看出,电路可以被修改为当-ΔE/T大于f-1(u)时输出1的电路。由于温度值T为正,可以看出,电路可以是当-ΔE大于Tf-1(u)时输出1的电路。

图21中的转变控制单元114可以包括噪声表,该噪声表是用于实现反函数f-1(u)的转换表,并且针对单位间隔[0,1)内的每个离散值的输入,该噪声表输出以下函数中的任一个的值。

图22示出了转变控制单元114的操作流程的一个示例。图22所示的操作流程包括:选择一个状态转变作为候选的步骤(S0001),通过将针对状态转变的能量变化值与温度值和随机数值的乘积进行比较来确定状态转变是否为可接受的步骤(S0002),以及当状态转变为可接受时接受状态转变或者当状态转变为不可接受时拒绝状态转变的步骤(S0003)。

[示例]

尽管将描述本文中公开的技术的一些示例,但是本文中公开的技术根本不限于这些示例。

(示例1)

作为示例1,通过使用本文中公开的结构搜索设备的示例来识别(计算)亮氨酸残基之间的相互作用势。

在示例1中,根据图10的流程图,通过使用具有如图8所示的硬件配置的结构搜索设备,并且通过使用亮氨酸残基作为氨基酸残基x和氨基酸残基y,来识别相互作用势。

在示例1中,通过使用分子建模软件,将由羰基和甲基组成的乙酰基结构部分添加至每个亮氨酸残基的氨基侧末端,所述甲基通过将氢原子键合至与羰基键合的碳原子以使碳原子的化合价饱和而获得。以相同的方式,在示例1中,将由氨基和甲基组成的N-甲基结构部分添加至每个亮氨酸残基的羰基侧末端,所述甲基通过将氢原子键合至与氨基键合的碳原子以使碳原子的化合价饱和而获得。以这种方式,在示例1中制备亮氨酸衍生物。

在示例1中,通过使用量子化学计算软件高斯09并且使用HF/6-31g*作为基函数来执行亮氨酸衍生物的结构优化,并且计算每个亮氨酸衍生物的静电势。在结构优化中,乙酰基结构部分的电荷被固定为“ACE基团”的值,该“ACE基团”是对应于分子力场中Amberff99SB-ILDN中的乙酰基的残基类型。类似地,在结构优化中,N-甲基结构部分的电荷被固定为“NME基团”的值,该“NME基团”是对应于分子力场中Amber ff99SB-ILDN中的N-甲基的残基类型。因此,在示例1中,乙酰基结构部分和N-甲基结构部分的电荷的总值被固定为整数。

接下来,在示例1中,通过使用计算的静电势,每个亮氨酸衍生物中的乙酰基结构部分和N-甲基结构部分中的原子电荷参数(RESP电荷)由装备在Amber工具中的模块前室获得。在示例1中,分子力场创建软件FF-FOM用于创建分子动力学计算中使用的分子力场中除了电荷参数之外的参数(关于键合角等的参数)。

在示例1中,通过将针对乙酰基结构部分和N-甲基结构部分的表示电荷的参数和表示分散力的参数设置为0,所创建的分子力场被校正,使得乙酰基结构部分和N-甲基结构部分不会引起相互作用。

随后,在示例1中,使用校正的分子力场执行分子动力学计算,以计算取决于亮氨酸残基之间的距离的PMF。分子动力学计算中的初始结构是通过随机布置两个亮氨酸衍生物并且用水分子(TIP3P)填充4.5×4.5×4.5nm3的立方晶格的内部而创建的。

在示例1的分子动力学计算中,首先,通过使用具有在设置文件中指定的“最速”(steep)的分子动力学模拟软件GROMACS,对所创建的具有1000+50000个步长(step)的初始结构执行能量最小化计算。

作为示例1的分子动力学计算,通过改变约束的距离,在亮氨酸衍生物之间的距离被约束(保留)的条件下执行多次分子动力学计算。亮氨酸衍生物之间的距离被约束使得亮氨酸衍生物的Cα碳或侧链的重心之间的距离被约束为固定的。在多次分子动力学计算中,在每个分子动力学计算(每个窗)中添加具有弹簧常数k=6000的强度的谐振势,使得亮氨酸衍生物之间的距离在0.4nm至1.4nm的范围内以0.05nm的步长变化。例如,在示例1中,在亮氨酸衍生物之间的距离为0.4nm至1.4nm的范围内执行伞形采样。

在每个分子动力学计算(每个窗)中,将温度设置为298K,执行100ps的NVT计算以平衡计算系统,并且其后执行300ps的NPT计算。随后,在示例1中,针对每个分子动力学计算(每个窗),执行51ns的采样(其中亮氨酸衍生物之间的距离保留在预定距离处的NPT计算)。

接下来,在示例1中,通过使用在如上所述执行的51ns的采样中的第1ns至第51ns的采样数据片段,并且通过WHAM方法耦合每个窗中的数据片段来计算PMF(自由能)。考虑在亮氨酸衍生物之间的距离r之中自由度变化的事实,PMF的计算通过添加β-1ln(4πr2)来校正,以便消除由于熵引起的稳定性项。为了将长距离处的PMF的收敛值保持在0,将-β-1ln(4π×1.42)添加至用于上述校正的计算中。

图23示出了在示例1中计算的亮氨酸残基之间的PMF。在图23中,纵轴代表PMF(kcal/mol),并且横轴代表亮氨酸残基之间的距离(nm)。从图23可以看出,例如,当亮氨酸残基之间的距离为0.5nm至0.6nm时,PMF低并且结构稳定。

在示例1中,计算的PMF被转换为对应于三维晶格空间中的氨基酸残基之间的距离,并且从而识别亮氨酸残基之间的相互作用势。

(示例2)

在示例2中,除了将示例1中的两个亮氨酸残基改变为N-甲基苯丙氨酸残基和缬氨酸残基之外,以与示例1相同的方式识别N-甲基苯丙氨酸残基与缬氨酸残基之间的相互作用势。例如,在示例2中,识别作为改性的氨基酸残基的N-甲基苯丙氨酸残基与缬氨酸残基之间的相互作用势。

图24A示出了肽中的N-甲基苯丙氨酸残基的化学式的示例。如图24A中的圆圈所示,N-甲基苯丙氨酸残基是改性的氨基酸残基,其中肽键中涉及的氨基(NH-基)被改为甲基。

图24B示出了示例2中制备的N-甲基苯丙氨酸衍生物的结构的示例。在示例2中,通过向N-甲基苯丙氨酸残基添加乙酰基结构部分和N-甲基结构部分来生产和制备N-甲基苯丙氨酸衍生物。

类似地,还通过向缬氨酸残基添加乙酰基结构部分和N-甲基结构部分来生产和制备缬氨酸衍生物。

图25示出了在示例2中计算的N-甲基苯丙氨酸残基与缬氨酸残基之间的PMF。在图25中,纵轴代表PMF(kcal/mol),并且横轴代表N-甲基苯丙氨酸残基与缬氨酸残基之间的距离(nm)。从图25可以看出,例如,当残基之间的距离约为0.5nm时,PMF低并且结构稳定。

在示例2中,计算的PMF被转换为对应于三维晶格空间中的氨基酸残基之间的距离,并且从而识别N-甲基苯丙氨酸残基与缬氨酸残基之间的相互作用势。

(示例3)

在示例3中,通过计算相互作用势来搜索由八个氨基酸残基形成并且具有已经通过核磁共振(NMR(核磁共振设备))识别的空间结构的环肽的稳定结构。

示例3使用了具有氨基酸残基序列“天冬氨酸(D)-亮氨酸(L)-苯丙氨酸(F)-缬氨酸(V)-脯氨酸(P)-脯氨酸(P)-异亮氨酸(I)-天冬氨酸(D)”的环肽(蛋白质数据库(PDB)ID:6AXI)。

在示例3中,以与示例1和示例2中相同的方式,识别环肽中的氨基酸残基类型的所有组合的相互作用势。在示例3中,每个氨基酸残基被粗粒化为作为单独的粒子的主链和侧链,并且这些粒子被布置在面心立方晶格(FCC)中的三维晶格空间中。

在示例3中,不仅考虑最接近的(相邻的)氨基酸残基之间的相互作用,而且考虑其间具有(为0.1nm)或更小的距离的氨基酸残基之间的相互作用,来搜索稳定的结构。在示例3中,三维晶格空间中彼此相邻的晶格点之间的距离被设置为

示例3使用由以上表达式(1)表示的目标函数表达式,并且通过使用数字退火器(注册商标)使表达式(2)最小化以搜索稳定结构,表达式(2)是从表达式(1)转换的伊辛模型表达式。

图26示出了在示例3中搜索出的环肽的稳定结构的搜索结果叠加在通过NMR识别的环肽的结构上。在图26中,具有小直径的深色圆圈指示在示例3中获得的稳定结构中每个氨基酸残基的主链的位置,并且具有大直径的浅色圆圈指示通过NMR识别的PDB ID:6AXI中每个氨基酸残基的Cα碳原子的位置。

在示例3中获得的稳定结构中每个氨基酸残基的主链的位置与PDB ID:6AXI中对应氨基酸残基的Cα碳原子的位置之间的均方根偏差(RMSD)为该结果意味着在示例3中搜索出的稳定结构与由NMR识别的实验结构良好匹配。

图27示出了在本文中公开的技术的一个实施方式中以及在相关技术中,通过识别氨基酸残基之间的相互作用势来搜索肽的稳定结构时的关系的示例。

如图27所示,例如,肽中的氨基酸残基与所关注的氨基酸残基相邻的氨基酸残基形成肽键。出于这个原因,由图27中虚线包围的氨基酸残基存在于肽中,同时与相邻的氨基酸残基肽键合。因此,肽中氨基酸残基可能具有的结构受到例如氨基酸残基与相邻氨基酸残基之间的肽键的影响。

在相关技术中,例如,通过对从氨基酸提取并且由图27中的实线包围的侧链部分(侧链类似物)的结构或者由图27中的虚线包围的单独氨基酸分子的结构执行分子动力学计算来识别相互作用势。

出于这个原因,相关技术没有考虑与作为计算目标的氨基酸残基相邻的氨基酸残基的肽键的影响。因此,在相关技术中,由于不能适当地评估氨基酸残基中肽的主链与所关注的氨基酸残基的侧链之间的相互作用,因此相互作用势的准确性不足,并且不能准确地搜索肽的空间结构。

另一方面,在本文中公开的技术的一个实施方式中,例如,考虑肽中的氨基酸残基结构,通过向氨基酸残基添加乙酰基结构部分和N-甲基结构部分来制备氨基酸衍生物。以这种方式,在本文中公开的技术的一个实施方式中,可以考虑与氨基酸残基相邻键合的两个氨基酸残基的肽键的影响。例如,在本文中公开的技术的一个实施方式中,可以适当地评估作为计算目标(针对其计算相互作用势)的氨基酸残基中肽的主链与所关注的氨基酸残基的侧链之间的相互作用。

在本文中公开的技术的一个实施方式中,例如,设置参数使得氨基酸衍生物x和氨基酸衍生物y中的乙酰基结构部分和N-甲基结构部分都不会引起相互作用。以这种方式,在本文中公开的技术的一个实施方式中,可以适当地评估氨基酸衍生物x中的氨基酸残基x与氨基酸衍生物y中的氨基酸残基y之间的相互作用。

如上所述,在本文中公开的技术的一个实施方式中,可以准确地评估氨基酸残基中肽的主链与所关注的氨基酸残基的侧链之间的相互作用以及氨基酸残基之间的相互作用两者,并且可以相应地识别(计算)高度准确的相互作用势。

在本文中公开的技术的一个实施方式中,由于肽的空间结构是考虑如上所述的高度准确的相互作用势而被识别(创建)的,因此即使当肽包含具有未知相互作用势的氨基酸残基时,也可以准确地搜索肽的稳定结构。

关于以上实施方式,进一步公开了以下附录。

[附图标记列表]

100 结构搜索设备

101 控制单元

102 主存储装置

103 辅助存储装置

104 I/O接口

105 通信接口

106 输入装置

107 输出装置

108 显示装置

109 总线

120 通信功能单元

130 输入功能单元

140 输出功能单元

150 显示功能单元

160 存储功能单元

170 控制功能单元

171 相互作用势识别单元

172 化合物衍生物生产单元

173 参数设置单元

174 分子动力学计算单元

175 空间结构识别单元

176 目标函数表达式创建单元

177 优化处理单元

[引用列表]

[非专利文献]

非专利文献1:Babbush Ryan等人,"Construction of Energy Functions forLattice Heteropolymer Models:A Case Study in Constraint SatisfactionProgramming and Adiabatic Quantum Optimization",Advances in Chemical Physics,155,201-244。

非专利文献2:Dror Tobi等人,"Distance-Dependent,Pair Potential forProtein Folding:Results From Linear Optimization",PROTEINS:Structure,Function,and Genetics,41:40-46(2000)。

非专利文献3:Andrew Pohorille,"Good Practices in Free-EnergyCalculations",J.Phys.Chem.B,2010,114,10235-10253。

72页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:一种功能有机晶体材料设计方法

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!