Exploring the computational methods for protein-ligand binding site prediction - ScienceDirect
2020, Computational and structural biotechnology
Le Zhang Group
Inter-molecular interaction 은 단백질의 아미노산 잔기의 특정 위치를 통해 일어나는데, 이 위치들은 보통 pocket-like region 에 위치해 있음. 이 위치들은 LBS ( Ligand-binding site ) 라고 부름.
CASP, CAMEO, CAFA, PDB, BioLip 등의 등장은 하나의 standard evaluation 을 제공했음. BioLip 에서 제공하는 정의에 의하면, 리간드 분자에 있는 어떤 한 원자와 아미노산 잔기에 있는 어떤 한 원자의 거리가 the sum of the radii of these two atoms plus 0.5 Å 을 넘지 않는다면, 그 아마노산 잔기는 ligand-binding residue 라고 함.
붙고 붙지 않고는 정통적인 이분법 문제이기 때문에, 이분법 알고리즘에 따라서 성능을 계산할 수 있고 acc, sen, spe, pre, mcc 같은 indicator 를 사용함.
이 논문에서는 prediction method 를 크게 4가지 정도로 구분하여 설명할것임.
1) 3D-구조 기반의 LBS prediction
대부분 작은 리간드 결합은 protein 의 hollow 나, cavity 에서 일어나게 되는데, 이는 충분히 넓은 공간이 제공되었을 때 강한 결합력이 나타나기 때문이다. 이 특징은 PDB 의 많은 구조들에서 찾아볼 수 있다.
따라서 LBS 를 geometry / energy feature 에 위치시키는 노력들이 많이 이루어져왔다. 이는 두 가지 적용점이 있는데,
하나는 단백질 구조에 특별한 geometric measurement 를 사용하여 단백질에서 hollow / cavity 구조를 찾으려고 하는 것,
나머지 하나는 protein 의 표면에 probe 를 붙여서 probe 와 cavity 사이의 energy potential 을 예상하는 것이다.
공간적 수치 ( spatial geometry measurements ) 에 기반한 LBS prediciton 방법은 protein cavity 나 hollow 를 위치시키는 것인데, 이는 protein structure information 에 따른 geometric measure 의 계산에 따른다.
위의 표는 spatial geometry measurements 관련 tool 개발 연대기를 나타냄.
1990년대부터 publish 되기 시작함.
단백질의 3차원 좌표 정보에 기반하여 단백질 원자 사이에 구(sphere)를 끼워 넣어서, Ligand binding residual 을 찾는 것이 목표 (1990s)
- SURFNET : sphere 의 크기는 원자에 닿기만 하도록 ( tangent to ) 원자의 크기에 맞춤. 만약 sphere 가 다른 원자와 부딛힌다면, sphere 의 부피는 부딛히지 않을 때 까지 감소시킴. 이 과정은 모든 단백질 원자 쌍이 만족될 때 까지 반복됨. 결과적으로는 단백질 원자 사이를 채운 sphere 의 집합이 생성되고, 이는 protein 의 cavity, hollow 를 알게 되게 하고 이는 possible LBS 를 알려줌.
- LIGSITE : Target protein 을 cover 할 수 있는 3D mesh 를 설정하고, 각각의 grid point 로부터 7개의 방향으로 scan 을 하는데, 이는 x,y,z, 그리고 4개의 grid diagonal 을 포함함. 그리고 grid score 를 측정함. 만약 특정 방향의 scan line 의 양쪽 끝이 단백질 부분에 포함되어 있다면, 이는 pocket 일 것이고, grid point 는 +1 point 가 됨. 모든 grid 가 scan 이 되면 candidate ligand binding residue 는 각 grid point의 점수에 따라 결정됨. Running speed 가 빠르기 때문에 많은 양의 protein 을 검사할 때 좋음.
probe 의 에너지 기반 LBS prediction method 는 먼저 target protein 에 specific probe molecule 을 달고 probe molecule 과 인접하는 residue 사이의 interaction energy signal 을 측정함. 그 후 signal intensity 를 분석하여 pocket 을 찾아냄. 이 방법은 보통 각자 다른 probe parameter 를 사용하거나 다수의 probe 를 사용하기도 함.
- SITEHOUND : grid 가 있는 box 를 사용해서 target protein 을 cover함. carbon probe, phosphate probe 가 grid point 로 방출되고 각 point 별로 interaction signal 이 기록됨. 높은 interaction energy 를 가지는 grid point 가 추출되고 모아짐(clutered). residue-grid point mapping 이 끝나면 clustered residue 에 기반하여 potential LBS 가 정해짐. 77개의 실험으로 증명된 protein 이 SITEHOUND 를 테스트하기 위해서 쓰임.
- FTSite : 2011년에 발표된 논문으로, protein 에 dense grid 를 위치시키고, 16개의 다른 small molecule probe 를 사용하여 objective free energy function 을 사용하여 적합한 위치를 찾음. Probe 들은 cluster 되고 평균 자유에너지 값에 따라서 순위가 매겨짐. 다른 probe 에 의해서 cluster 되어 겹치는 위치는 probe-protein 의 interaction 에 의해서 순위를 매김. top cluster 와 상호작용하는 아미노산 잔기가 possible LBS가 됨. FTSite 는 LIGSITE, QSiteFinder 의 데이터를 이용하여 benchmark 진행함. 94,97 % acc 나옴.
3D 구조 기반의 prediction method 는 오랜 시간 쓰여 왔지만 apo 상태에서 pocket 이 발견되지 않는데 holo state 에서는 발견되는 경우에는 사용되기 어려울 수 있음.
댓글