Resources/Personal Projects

[UniProt Challenge] PSSM : Binding residue representation

Cho et al. 2022. 9. 15.

Protein ligand-specific binding residue predictions by an ensemble classifier | BMC Bioinformatics | Full Text (biomedcentral.com)

 

Protein ligand-specific binding residue predictions by an ensemble classifier - BMC Bioinformatics

Background Prediction of ligand binding sites is important to elucidate protein functions and is helpful for drug design. Although much progress has been made, many challenges still need to be addressed. Prediction methods need to be carefully developed to

bmcbioinformatics.biomedcentral.com

Figure from original paper

 

이 논문에서는 binding residue 기준으로 window 를 정해서 그 부분을 PSSM , Local structure, Conservation score 를 구해서 SVM... 등의 input 으로 넣는다고 함. 

 

부탁입니다. 생물정보학 PSI- BLAST 해보신분 ..... > BRIC (ibric.org)-> 여기에 설명 잘 되어있음

 

부탁입니다. 생물정보학 PSI- BLAST 해보신분 .....

지금까지 blastn을 통해 16s rRNA 유전자 blast를 계속해서 연구를 하였습니다. 그런데 갑자기 선생님께서 Pro...

www.ibric.org

저렇게 자른 부분을 positive labeling 하면

Negative labeling 하는데도 skill 이 필요할까 아니면 random sequence 로 하는 것이 좋을까 ?

 

Automatic generation of bioinformatics tools for predicting protein-ligand binding sites. - Abstract - Europe PMC

위 논문에서는 Ligand binding site 주위의 5-25 residue 를 negative 로 사용함. 

Automatic generation of bioinformatics tools for predicting protein-ligand binding sites. - Abstract - Europe PMC

위의 설명에 있는 논문과 같은 논문인데 여기서는 PSSM + Spacer 라는 feature 를 하나 추가하였는데 이는 N, C terminal 을 고려한 feature 임. 

 

 

Matrix 구하기

Bio.motifs.matrix module — Biopython 1.76 documentation

 

Bio.motifs.matrix module — Biopython 1.76 documentation

© Copyright 1999-2020, The Biopython Contributors

biopython.org

 

또한 metal binding site 는 마치 enhancer 가 DNA 와 interaction 하는 것과 같이 Long range interaction 도 고려한다고 들었는데, 그를 위해서는 window size 를 어디까지 키워야 할지?

 

HMM ( Hidden Markov Model ) 

What are profile hidden Markov models? | Pfam (ebi.ac.uk)

 

What are profile hidden Markov models? | Pfam

They are one of the computational algorithms used for predicting protein structure and function, identifies significant protein sequence similarities allowing the detection of homologs and consequently the transfer of information, i.e. sequence homology-ba

www.ebi.ac.uk

 

(8) Position Specific Score Matrix(PSSM) 이용한 Motif 찾기 알고리즘 - YouTube

댓글