Data Science2 [UniProt Challenge] Inferencing test data : 메모리... 메모리... 학습 완료. 드디어 Uniprot binding challenge 의 모델의 학습이 끝났다. 시험보고 하느라 좀 늦어진 것 같긴 한데... 그래도 validation metric 은 괜찮은 듯 하다. 이 대회는 training set : 19만개, test test : 100만개 (...?) 인 대회라, 대회 Kickoff meeting 에서도 말했지만 Uniprot 에서 annotated 되지 않은 protein 들의 binding site 를 조금이라도 예측해보고자 만든 대회다. 문제점 모델 파라미터는 0.6M , 가벼운 모델인데 아무래도 테스트 데이터가 100만개 정도이다 보니 이게 좀 걸림돌이었다. 1) 지금 모델이 아미노산 잔기에 대해서 하나하나 binding ion 과, binding scor.. Resources/Personal Projects 2022. 12. 13. [1] Pandas query : 한 번만 써보자! Introduction Pandas 를 사용하여 EDA 를 진행할 때, import seaborn as sns import matplotlib.pyplot as plt import os import numpy as np import pandas as pd iris = sns.load_dataset('iris') iris 에서 sepal_length 가 5~6 사이인 row만 뽑고 싶을 때, 보통 이렇게 많이 쓴다. iris[(iris.sepal_length>5) & (iris.sepal_length 데이터/Data Manipulation 2022. 5. 27. 이전 1 다음