Resources/Classes

[EMBL] Bioinformatics resources for protein biology : Protein structures – AlphaFold DB

Cho et al. 2022. 10. 29.

Introduction to AlphaFold DB

 

이 강의는 실험적인 것 보다 예측된 구조에 대한 것.

 

구조 예측에 대한 필요성 : 200M 개의 단백질 서열이 알려져 있지만 그중 일부만 구조가 알려져 있음

50년이나 걸렸음. 이러한 정확성을 가지고 오기까지

 

3D-Beacons : 구조 DB와 협력해서 하고 있는 프로젝트 중 하나임. 구조 정보는 예측된 구조, 실험적 구조라도 상관 없고, 여러 데이터베이스를 모아서 한 번에 검색할 수 있도록 할 수 있는 프로젝트임. 

 

AlphaFold DB

- DeepMind 

- EMBL-EBI, DeepMind 는 협력하고 있음. 

- 현재 AlphaFold 는 Human proteome 의 99% 를 포함하고 있음

- output은 예측된 좌표, Predicted aligned errors ( PAE ) 가 제일 주요함

 

Limitations in AlphaFold DB

- Uniprot reference protein 중 2700 개 이상의 잔기를 가지는 protein 에 대해서는 정보 제공하고 있지 않음

- AlphaFold 가 train 되지 않은 부분들이 있음

Complex, effect of mutation, docking of small molecules ( 이것 중 현재 진행 된 부분들도 많음 )

 

 

Predicted aligned error : 

두개 residue 의 신뢰도 ?  를 나타내주는 지표. 색이 진할수록 confidence 가 좋다. 

위의 그림은 GTPase Kras Protein 에 대한 구조임

 

Exercises

댓글