논문 리뷰/Protein

Exploring the computational methods for protein-ligand binding site prediction (1)

Cho et al. 2022. 7. 7.

Exploring the computational methods for protein-ligand binding site prediction - ScienceDirect

 

2020, Computational and structural biotechnology

Le Zhang Group

 

Inter-molecular interaction 은 단백질의 아미노산 잔기의 특정 위치를 통해 일어나는데, 이 위치들은 보통 pocket-like region 에 위치해 있음. 이 위치들은 LBS ( Ligand-binding site ) 라고 부름. 

CASP, CAMEO, CAFA, PDB, BioLip 등의 등장은 하나의 standard evaluation 을 제공했음. BioLip 에서 제공하는 정의에 의하면, 리간드 분자에 있는 어떤 한 원자와 아미노산 잔기에 있는 어떤 한 원자의 거리가 the sum of the radii of these two atoms plus 0.5 Å 을 넘지 않는다면, 그 아마노산 잔기는 ligand-binding residue 라고 함. 

 

Figure from original paper

 

붙고 붙지 않고는 정통적인 이분법 문제이기 때문에, 이분법 알고리즘에 따라서 성능을 계산할 수 있고 acc, sen, spe, pre, mcc 같은 indicator 를 사용함. 

이 논문에서는 prediction method 를 크게 4가지 정도로 구분하여 설명할것임.

 

1) 3D-구조 기반의 LBS prediction

 

대부분 작은 리간드 결합은 protein 의 hollow 나, cavity 에서 일어나게 되는데, 이는 충분히 넓은 공간이 제공되었을 때 강한 결합력이 나타나기 때문이다. 이 특징은 PDB 의 많은 구조들에서 찾아볼 수 있다. 

따라서 LBS 를 geometry / energy feature 에 위치시키는 노력들이 많이 이루어져왔다. 이는 두 가지 적용점이 있는데, 

하나는 단백질 구조에 특별한 geometric measurement 를 사용하여 단백질에서 hollow / cavity 구조를 찾으려고 하는 것, 

나머지 하나는 protein 의 표면에 probe 를 붙여서 probe 와 cavity 사이의 energy potential 을 예상하는 것이다. 

 

공간적 수치 ( spatial geometry measurements ) 에 기반한 LBS prediciton 방법은 protein cavity 나 hollow 를 위치시키는 것인데, 이는 protein structure information 에 따른 geometric measure 의 계산에 따른다. 

 

Table from originial paper

위의 표는 spatial geometry measurements 관련 tool 개발 연대기를 나타냄.

 

 

1990년대부터 publish 되기 시작함. 

단백질의 3차원 좌표 정보에 기반하여 단백질 원자 사이에 구(sphere)를 끼워 넣어서, Ligand binding residual 을 찾는 것이 목표 (1990s)

- SURFNET : sphere 의 크기는 원자에 닿기만 하도록 ( tangent to ) 원자의 크기에 맞춤. 만약 sphere 가 다른 원자와 부딛힌다면, sphere 의 부피는 부딛히지 않을 때 까지 감소시킴. 이 과정은 모든 단백질 원자 쌍이 만족될 때 까지 반복됨. 결과적으로는 단백질 원자 사이를 채운 sphere 의 집합이 생성되고, 이는 protein 의 cavity, hollow 를 알게 되게 하고 이는 possible LBS 를 알려줌.

 

- LIGSITE : Target protein 을 cover 할 수 있는 3D mesh 를 설정하고, 각각의 grid point 로부터 7개의 방향으로 scan 을 하는데, 이는 x,y,z, 그리고 4개의 grid diagonal 을 포함함. 그리고 grid score 를 측정함. 만약 특정 방향의 scan line 의 양쪽 끝이 단백질 부분에 포함되어 있다면, 이는 pocket 일 것이고, grid point 는 +1 point 가 됨. 모든 grid 가 scan 이 되면 candidate ligand binding residue 는 각 grid point의 점수에 따라 결정됨. Running speed 가 빠르기 때문에 많은 양의 protein 을 검사할 때 좋음.

 

 

probe 의 에너지 기반 LBS prediction method 는 먼저 target protein 에 specific probe molecule 을 달고 probe molecule 과 인접하는 residue 사이의 interaction energy signal 을 측정함. 그 후 signal intensity 를 분석하여 pocket 을 찾아냄. 이 방법은 보통 각자 다른 probe parameter 를 사용하거나 다수의 probe 를 사용하기도 함. 

 

- SITEHOUND : grid 가 있는 box 를 사용해서 target protein 을 cover함. carbon probe, phosphate probe 가 grid point 로 방출되고 각 point 별로 interaction signal 이 기록됨. 높은 interaction energy 를 가지는 grid point 가 추출되고 모아짐(clutered). residue-grid point mapping 이 끝나면 clustered residue 에 기반하여 potential LBS 가 정해짐. 77개의 실험으로 증명된 protein 이 SITEHOUND 를 테스트하기 위해서 쓰임. 

 

- FTSite : 2011년에 발표된 논문으로, protein 에 dense grid 를 위치시키고, 16개의 다른 small molecule probe 를 사용하여 objective free energy function 을 사용하여 적합한 위치를 찾음. Probe 들은 cluster 되고 평균 자유에너지 값에 따라서 순위가 매겨짐. 다른 probe 에 의해서 cluster 되어 겹치는 위치는 probe-protein 의 interaction 에 의해서 순위를 매김. top cluster 와 상호작용하는 아미노산 잔기가 possible LBS가 됨. FTSite 는 LIGSITE, QSiteFinder 의 데이터를 이용하여 benchmark 진행함. 94,97 % acc 나옴. 

 

3D 구조 기반의 prediction method 는 오랜 시간 쓰여 왔지만 apo 상태에서 pocket 이 발견되지 않는데 holo state 에서는 발견되는 경우에는 사용되기 어려울 수 있음. 

 

댓글