이번 심화프로젝트에서는 7일에시간이 주어졌다 주제는
스포츠 업계에 취업하고 싶은 나는 회귀(예측)에 관심이있어서 이커머스나 고장시점(RUL)에 관심이있었다
다행이 팀원분들도 이커머스 주간 판매량 예측에 관심이있어서 이커머스 주간 판매량 예측을 하게되었다
어떤 분석을 할지도 중요하지만 플래닝도 중요하다고 느꼈다 전팀원들이 현업 종사자여서 그런지 처음에 러프하게라도
계획을 꼭 짜놓고 가야한다라는걸 설명을 간단하게 해주셨고 피와 살이되었다 이번 프로젝트에서는 먼저 계획을 러프하게
짜자고 제안하였고 그에 대한 결과로
이렇게 나왔다 월요일은 발표영상만들고 수정하는 시간으로 가지면 될것이다 만약 금요일까지 ppt를 작성하지 못한다면
주말에 ppt를 완성하면되니까 어느정도 프로젝트 마감일을 잘 지킬수있을것이다
오늘의 문제는 전처리 과정에서 나왔다
8189개의 데이터중에 markDown1,2,3,4,5가 모두 절반이 넘는 결측치를 가지고있었다. 예전 강의를 들으며 결측치가 50%가 넘으면 사용하지않는다고 들었기때문에 markdown데이터는 지우고 가는 거에 힘을 실었다 12개의 데이터중 무려 5개의 칼럼이라 너무 많은 데이터의 소실이 아닐까 생각도했지만 null값이 50%나되는 데이터를 사용하는것이 부적절하다고 생각이 되서 삭제하는쪽으로 생각을 해봤다.
'심화프로젝트' 카테고리의 다른 글
심화프로젝트 5일차 (0) | 2024.06.21 |
---|---|
심화프로젝트 4일차 TIL (0) | 2024.06.20 |
심화프로젝트 3일차 TIL (0) | 2024.06.19 |
심화프로젝트 2일차 -TIL (0) | 2024.06.18 |