2022년 다시 참가한 TPS 4월이 끝났다. 106/816 (13%) Multivariable Time Series Classification 문제였고, 처음에는 CNN, LSTM 모델 만들어보고, 나중에 XGBoost, LGBM 모델 만들어서 대회 끝나기 이틀 전부터 앙상블했다. 앙상블은 그냥 점수보면서 weighted averaging했다. 모델은 xgboost, lgbm, bi-lstm, lstm, cnn-lstm 이렇게 다섯개 사용했다. 이번 대회에서 가장 많이 시간을 쓴건 LSTM인데, 전에 코세라 딥러닝에서 내용만 들어봤고 써보는건 처음이였다.
그 외에,
- Pandas가 복잡해지면 어려웠음. ➡️ kaggle course Pandas
- EDA할 때 통계적인 부분이 모자란게 FE까지 영향을 미쳤는데, 이번 대회는 다른 사람들 퍼블릭 노트북 읽으면서 했다.
- 시간문제로 공부랑 구현을 못한 내용들 (Attention, Transformer, Stacking...)
💪🏻 일단 이번 대회 1, 2, 3등 솔루션 읽어야겠다. 다음으로는 TPS 5월이랑, 지금 열린 대회중에 time series 다루는게 JPK 주식 예측 있길래, 그거 건드려봐야겠다.
'Computer Science > [21-하] Projects' 카테고리의 다른 글
[Bioinfo] RNA-seq project 1 - (2) data cleaning, indexing (0) | 2022.08.12 |
---|---|
[Bioinfo] RNA-seq project 1 - (1) data download (0) | 2022.07.25 |
[캐글] Tabular Playground Series - November 회고 (0) | 2021.12.01 |
[캐글] Tabular Playground Series - October 회고 (0) | 2021.11.05 |
[캐글] 첫번째 노트북 발행 - Fish Market (0) | 2021.09.05 |
댓글