데이터 사이언스
[Kaggle] ASHRAE - Great Energy Predictor III (2)
ankisile
2021. 9. 8. 00:41
이전 포스트에서 데이터분석까지 살펴봤다.
이 포스트에서는 이제 KFold LigthGBM을 이용하여 Train하고 Prediction까지 해보겠다.
생각할 점
LightGBM이라는것을 이 대회를 통해 처음 들어봤는데 이에 대해 공부해 봐야 될것같다.
이 대회 같은 경우에 데이터가 매우 크다. 따라서 LightGBM을 사용하는 것으로 알고 있다.
문제는 데이터를 처리, train, prediction을 하는데 런타임 에러가 났다는 점이다.
필자는 총 4개의 커널을 살펴보았고 각 커널과 내가 공부한 내용을 바탕으로 작성할 때 데이터를 처리하거나 train 하는데 런타임 에러를 겪었고 결국에는 위에 첨부한 코드를 사용한 커널을 사용할 수 밖에 없었다.
런타임 에러를 겪지 않기 위해 데이터를 처리하는 과정에 대해 좀더 공부할 필요성을 느꼈다.
발표했던 자료
ASHRAE-_-Great-Energy-Predictor-III.pdf
3.18MB