본문 바로가기

심화프로젝트

(5)
심화프로젝트 5일차 5일차까지 목표였던 PPT제작을 거의 8~90% 마쳤고 발표스크렙트도 어느정도 마쳤다 1.안녕하세요, 여러분. 저는 심화프로젝트 발표를 맡은 이준민입니다. 저희 팀 칠성사이다는 월마트의 주간 판매량 예측에 대한 연구를 진행했습니다. 오늘 발표에서는 저희가 사용한 데이터 분석 방법과 예측 모델, 그리고 이를 통해 얻은 주요 인사이트들을 공유하고자 합니다. 지금부터 발표를 시작하겠습니다.2.오늘 발표에서는 프로젝트의 전반적인 개요를 시작으로, 데이터를 전처리한 과정, EDA, 예측 모델의 설계, 결론, 한계점까지 순차적으로 진행하겠습니다.3.그럼 이제 첫 번째 섹션인 프로젝트 개요부터 시작하겠습니다.5. 다음으로는 저희가 사용한 칼럼에 대해 살펴보겠습니다데이터는 케글데이터섹 안에있는 45개의 월마트 매장에 ..
심화프로젝트 4일차 TIL 오늘은 모델링 LGBM과 catboost 모델링을 해봣다.Gradient Boosting 인 LGBM모델과 Ordered Boosting catboost모델을해봣다 Gradient Boosting:Gradient Boosting에서는 이전 트리(또는 모델)의 오차(잔차)를 줄이는 방향으로 새로운 트리를 학습시킵니다.트리는 순서에 상관없이 독립적으로 학습되며, 모든 트리가 동일한 방향으로 학습될 수 있습니다.Ordered Boosting (CatBoost):Ordered Boosting에서는 트리들이 순서대로 학습됩니다.각 트리는 이전 트리들의 예측 값에 따라 순서가 정해지며, 그 순서대로 학습이 진행됩니다.이전 트리의 예측 결과가 더 큰 오차를 가진 샘플들에 집중하여 다음 트리를 학습시키는 방식으로 오차..
심화프로젝트 3일차 TIL XGBoost 모델 생성 및 하이퍼파라미터 튜닝  XGBoost 모델 생성: xgb.XGBRegressor를 사용하여 XGBoost 회귀 모델을 생성합니다. objective='reg:squarederror'는 회귀 문제를 다루기 위한 목적 함수로 설정합니다.하이퍼파라미터 그리드 설정: param_grid에 탐색할 하이퍼파라미터들을 지정합니다.GridSearchCV를 사용한 하이퍼파라미터 튜닝: GridSearchCV를 사용하여 최적의 하이퍼파라미터를 탐색합니다. cv=3은 3-fold cross-validation을 사용함을 의미하며, scoring='r2'는 평가 지표로 R^2를 사용합니다. # XGBoost 모델 생성model = xgb.XGBRegressor(objective='reg:square..
심화프로젝트 2일차 -TIL 머신러닝 심화 프로젝트를 진행하며 오늘 있었던 가장 큰 문제는 EDA를 통해 유의미한 시각화가 나오지 않아서튜터님께 찾아가서 질문을 드렸더니 EDA로 유의미한 인사이트를 도출하는것보다 머신러닝을 학습시키고 유의미한 결과가 나올때까지 하이퍼파라미터나 모델을 업그레이드 및 전처리를 하여 평가를 유의미하게 만들어보라고 하셔서 그렇게 하기로 했다. 모델학습방법:  데이터 샘플링 - 제일 관련없는 피쳐를 삭제해나가는 과정 오늘 내 역할은 칼럼간의 상관관계 분석을 해보는 거였는데for 문으로 칼럼간의 상관관계 분석하는 법을 고안해서 해봤다 LinearRegression, Decision Tree Regressor # 각 칼럼을 X와 y로 하여 선형 회귀 모델의 성능 평가for x_column in columns: ..
심화프로젝트 TIL 1일차 이번 심화프로젝트에서는 7일에시간이 주어졌다 주제는스포츠 업계에 취업하고 싶은 나는 회귀(예측)에 관심이있어서 이커머스나 고장시점(RUL)에 관심이있었다다행이 팀원분들도 이커머스 주간 판매량 예측에 관심이있어서 이커머스 주간 판매량 예측을 하게되었다어떤 분석을 할지도 중요하지만 플래닝도 중요하다고 느꼈다 전팀원들이 현업 종사자여서 그런지 처음에 러프하게라도계획을 꼭 짜놓고 가야한다라는걸 설명을 간단하게 해주셨고 피와 살이되었다 이번 프로젝트에서는 먼저 계획을 러프하게짜자고 제안하였고 그에 대한 결과로이렇게 나왔다 월요일은 발표영상만들고 수정하는 시간으로 가지면 될것이다 만약 금요일까지 ppt를 작성하지 못한다면주말에 ppt를 완성하면되니까 어느정도 프로젝트 마감일을 잘 지킬수있을것이다 오늘의 문제는 전처..