Introduction to AlphaFold DB
이 강의는 실험적인 것 보다 예측된 구조에 대한 것.
구조 예측에 대한 필요성 : 200M 개의 단백질 서열이 알려져 있지만 그중 일부만 구조가 알려져 있음
50년이나 걸렸음. 이러한 정확성을 가지고 오기까지
3D-Beacons : 구조 DB와 협력해서 하고 있는 프로젝트 중 하나임. 구조 정보는 예측된 구조, 실험적 구조라도 상관 없고, 여러 데이터베이스를 모아서 한 번에 검색할 수 있도록 할 수 있는 프로젝트임.
AlphaFold DB
- DeepMind
- EMBL-EBI, DeepMind 는 협력하고 있음.
- 현재 AlphaFold 는 Human proteome 의 99% 를 포함하고 있음
- output은 예측된 좌표, Predicted aligned errors ( PAE ) 가 제일 주요함
Limitations in AlphaFold DB
- Uniprot reference protein 중 2700 개 이상의 잔기를 가지는 protein 에 대해서는 정보 제공하고 있지 않음
- AlphaFold 가 train 되지 않은 부분들이 있음
Complex, effect of mutation, docking of small molecules ( 이것 중 현재 진행 된 부분들도 많음 )
Predicted aligned error :
두개 residue 의 신뢰도 ? 를 나타내주는 지표. 색이 진할수록 confidence 가 좋다.
위의 그림은 GTPase Kras Protein 에 대한 구조임
댓글