데이터 사이언스

[Kaggle] ASHRAE - Great Energy Predictor III (2)

ankisile 2021. 9. 8. 00:41

이전 포스트에서 데이터분석까지 살펴봤다.

이 포스트에서는 이제 KFold LigthGBM을 이용하여 Train하고 Prediction까지 해보겠다.

 

생각할 점

LightGBM이라는것을 이 대회를 통해 처음 들어봤는데 이에 대해 공부해 봐야 될것같다.

이 대회 같은 경우에 데이터가 매우 크다. 따라서 LightGBM을 사용하는 것으로 알고 있다.

문제는 데이터를 처리, train, prediction을 하는데 런타임 에러가 났다는 점이다.

필자는 총 4개의 커널을 살펴보았고 각 커널과 내가 공부한 내용을 바탕으로 작성할 때 데이터를 처리하거나 train 하는데 런타임 에러를 겪었고 결국에는 위에 첨부한 코드를 사용한 커널을 사용할 수 밖에 없었다.

런타임 에러를 겪지 않기 위해 데이터를 처리하는 과정에 대해 좀더 공부할 필요성을 느꼈다.

 

 

발표했던 자료

ASHRAE-_-Great-Energy-Predictor-III.pdf
3.18MB