벌써 5차 미니 프로젝트 .... (끝난지 한달됨) 의 주제는

 

유통 판매량 예측 및 재고 최적화

 

한개의 게시글로 될 줄 알았는데 쓰면서 오랜만에 복습도 하다 보니까 내용이 길어져서 ... 아마 2개로 나눌 것 같다. 

내가 지금까지 했던 미니 프로젝트들 중에 가장 재미있었는데, 그래서 리뷰할 내용이 많은 것 일수도 있다. 

TMI 로 5차 미프에서 내 걸로 2번이나 제출했당 희희 쁘이~

 

1. 상품별 변화량 비교

여기서 먼저 단변량 분석을 해보았는데, 이 글에서는 Product ID가 42인 상품에 대해서만 분석을 할 예정이다.

먼저 42번 상품은Agricultural products 농산물이다. 

df['변수'].diff() 형태로 변화량을 확인할 수 있는 코드는 다음과 같다. 

 

sales_42['Qty_Diff'] = sales_42['Qty'].diff()

 

Product ID가 42인 상품 (농산물) 의 판매량과 변화량을 시각화해 보면 다음과 같은 그래프가 나온다. 

 

판매량
변화량

 

히스토그램으로도 시각화해 보았다. 

 

 

2. 요일별 변화량 비교

두 번째로 Product ID == 42 (농산물) 의 요일별 판매량과 변화량을 막대그래프로 시각화해 비교해 보자

 

먼저 요일은 sales_42['Weekday'] = sales_42['Date'].dt.weekday 형태로 얻을 수 있다.

map 으로 0 : '월요일' , 1 : '화요일' .... 으로 연결해준다.

 

sales_42.groupby('Weekday')[['Qty', 'Qty_Diff']].mean() 으로 요일별 판매량의 평균 테이블을 새로 작성해 주고,

한눈에 보기 위해 막대그래프로 시각화를 해주었다.

 

 

참고. 예쁘게 꾸미고 싶어서 파스텔 무지개색 팔레트색을 사용했다. 

pastel_rainbow_palette = sns.color_palette("pastel")

 

 

 

3. 결론

 

[5-10월에 농산물 판매량이 높음]
1. 계절적 요인 :  농산물 생산이 활발하게 이루어지는 따뜻한 계절이며, 다양한 종류의 작물이 수확되는 시기임. 이로 인해 시장에 공급되는 농산물의 양이 증가하게 되어 판매량이 높아질 수 있음.
=> 농산물의 수확량이 증가하면 구매할 수 있는 양도 더 많아짐 : 판매량 증가
2. 휴가철 : 여름철에는 학생들의 방학 및 휴가철이 겹치는 경우가 많이 있음. 이로 인해 가정 내 식품 소비가 증가하고, 여행객들도 지역적인 농산물을 구매하는 경향 => 수요 높아지면 판매량 높아짐

[주말이 판매량 가장 높음 / 월요일이 가장 낮음]
1. 주말에는 사람들이 외식을 즐기거나 집에서 요리를 하기 위해 재료를 구매하는 경향 => 판매량 높음
그래서 월요일에는 집에서 준비한 음식을 먹는 경우가 많아져서 판매량 감소할 수도 있음
2. 일부 소비자들은 주말에 휴식을 취하고 주중에는 바빠서 외식을 하거나 식료품을 구매하는 시간을 갖지 않을 수 있음 이는 특히 월요일에 나타남
3. 일부 소비자들은 주말에 큰 쇼핑을 하고 월요일에 무거운 소비를 자제하는 경향. 이는 주말에 구매한 식료품을 사용하고 소비를 줄이는 것과 관련이 있음
4. 공급망 요인: 공급망이 월요일에 활성화되지 않아 식료품 재고가 부족할 수 있음. 이는 판매량이 감소하는 요인이 될 수 있음

 

 

마지막으로 지금까지 분석한 판매량과 변화량의 상관 계수를 알아보았다.

시각화만으로도 충분히 연관이 있다고 느꼈고, 상관 계수는 0.65 로 중간 정도의 관계가 나왔다. 

사실 생각했던 것보단 낮아서 조금 충격이었다.

0.8은 나올 줄 알았,,,

correlation = weekday_mean['Qty'].corr(weekday_mean['Qty_Diff'])

print("판매량과 변화량의 상관 계수:", correlation)
판매량과 변화량의 상관 계수: 0.653969813069822

 

 

이 글에서는 여기까지만 리뷰를 하고 다음 글에서 이어서 분석을 하고 예측 모델을 만들 예정이다. 

그럼 뿅 

+ Recent posts