이 논문에서는 binding residue 기준으로 window 를 정해서 그 부분을 PSSM , Local structure, Conservation score 를 구해서 SVM... 등의 input 으로 넣는다고 함.
부탁입니다. 생물정보학 PSI- BLAST 해보신분 ..... > BRIC (ibric.org)-> 여기에 설명 잘 되어있음
저렇게 자른 부분을 positive labeling 하면
Negative labeling 하는데도 skill 이 필요할까 아니면 random sequence 로 하는 것이 좋을까 ?
위 논문에서는 Ligand binding site 주위의 5-25 residue 를 negative 로 사용함.
위의 설명에 있는 논문과 같은 논문인데 여기서는 PSSM + Spacer 라는 feature 를 하나 추가하였는데 이는 N, C terminal 을 고려한 feature 임.
Matrix 구하기
Bio.motifs.matrix module — Biopython 1.76 documentation
또한 metal binding site 는 마치 enhancer 가 DNA 와 interaction 하는 것과 같이 Long range interaction 도 고려한다고 들었는데, 그를 위해서는 window size 를 어디까지 키워야 할지?
HMM ( Hidden Markov Model )
What are profile hidden Markov models? | Pfam (ebi.ac.uk)
(8) Position Specific Score Matrix(PSSM) 이용한 Motif 찾기 알고리즘 - YouTube
'Resources > Personal Projects' 카테고리의 다른 글
[UniProt Challenge] CNN + Attention (0) | 2022.09.17 |
---|---|
[UniProt Challenge] Amino acid binding / pocket signature (0) | 2022.09.15 |
[UniProt Challenge] Protein representation vector to image (0) | 2022.08.29 |
[UniProt Challenge] Key words (0) | 2022.07.10 |
[UniProt Challenge] Reference (0) | 2022.07.06 |
댓글