본문 바로가기
Computer Science/[21-하] Projects

[캐글] Tabular Playground Series - April 회고

by gojw 2022. 5. 1.

  2022년 다시 참가한 TPS 4월이 끝났다. 106/816 (13%) Multivariable Time Series Classification 문제였고, 처음에는 CNN, LSTM 모델 만들어보고, 나중에 XGBoost, LGBM 모델 만들어서 대회 끝나기 이틀 전부터 앙상블했다. 앙상블은 그냥 점수보면서 weighted averaging했다. 모델은 xgboost, lgbm, bi-lstm, lstm, cnn-lstm 이렇게 다섯개 사용했다. 이번 대회에서 가장 많이 시간을 쓴건 LSTM인데, 전에 코세라 딥러닝에서 내용만 들어봤고 써보는건 처음이였다.

 

그 외에,

- Pandas가 복잡해지면 어려웠음. ➡️ kaggle course Pandas

- EDA할 때 통계적인 부분이 모자란게 FE까지 영향을 미쳤는데, 이번 대회는 다른 사람들 퍼블릭 노트북 읽으면서 했다.

- 시간문제로 공부랑 구현을 못한 내용들 (Attention, Transformer, Stacking...)

 

💪🏻 일단 이번 대회 1, 2, 3등 솔루션 읽어야겠다. 다음으로는 TPS 5월이랑, 지금 열린 대회중에 time series 다루는게 JPK 주식 예측 있길래, 그거 건드려봐야겠다.

댓글