-
Notifications
You must be signed in to change notification settings - Fork 0
/
Copy pathapp.py
856 lines (718 loc) · 36.6 KB
/
app.py
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
481
482
483
484
485
486
487
488
489
490
491
492
493
494
495
496
497
498
499
500
501
502
503
504
505
506
507
508
509
510
511
512
513
514
515
516
517
518
519
520
521
522
523
524
525
526
527
528
529
530
531
532
533
534
535
536
537
538
539
540
541
542
543
544
545
546
547
548
549
550
551
552
553
554
555
556
557
558
559
560
561
562
563
564
565
566
567
568
569
570
571
572
573
574
575
576
577
578
579
580
581
582
583
584
585
586
587
588
589
590
591
592
593
594
595
596
597
598
599
600
601
602
603
604
605
606
607
608
609
610
611
612
613
614
615
616
617
618
619
620
621
622
623
624
625
626
627
628
629
630
631
632
633
634
635
636
637
638
639
640
641
642
643
644
645
646
647
648
649
650
651
652
653
654
655
656
657
658
659
660
661
662
663
664
665
666
667
668
669
670
671
672
673
674
675
676
677
678
679
680
681
682
683
684
685
686
687
688
689
690
691
692
693
694
695
696
697
698
699
700
701
702
703
704
705
706
707
708
709
710
711
712
713
714
715
716
717
718
719
720
721
722
723
724
725
726
727
728
729
730
731
732
733
734
735
736
737
738
739
740
741
742
743
744
745
746
747
748
749
750
751
752
753
754
755
756
757
758
759
760
761
762
763
764
765
766
767
768
769
770
771
772
773
774
775
776
777
778
779
780
781
782
783
784
785
786
787
788
789
790
791
792
793
794
795
796
797
798
799
800
801
802
803
804
805
806
807
808
809
810
811
812
813
814
815
816
817
818
819
820
821
822
823
824
825
826
827
828
829
830
831
832
833
834
835
836
837
838
839
840
841
842
843
844
845
846
847
848
849
850
851
852
853
854
855
from PIL import Image
from matplotlib import pyplot as plt
import openai
import os
import streamlit as st
import pandas as pd
import matplotlib.font_manager as fm
import requests
from io import BytesIO
import random
from st_pages import show_pages_from_config, add_page_title
# ======================================================================================================================
# open ai key
# ======================================================================================================================
os.environ["OPENAI_TOKEN"] = st.secrets["OPENAI_TOKEN"]
openai_token = os.environ.get("OPENAI_TOKEN")
if not openai_token:
raise ValueError("no openai token!")
openai.api_key = openai_token
# ======================================================================================================================
# streamlit 설정
# ======================================================================================================================
add_page_title(layout="wide")
show_pages_from_config()
st.title("온국민 ESG 가계부")
st.markdown("""안녕하세요. 사용자님의 이름을 입력하시면 사용자님의 소비 내역을 ESG 기준으로 분석하여 제공합니다.\n
더 나아가, ESG 중에서 가장 소비가 적은 분야에 대해 대체 소비를 유도할 수 있도록 해당 카테고리의 지수가 더 높은 브랜드를 추천해 드립니다. 🌟\n
마지막으로, 은행 마스코트가 포함된 개인화된 이미지와 함께 마스코트 친구가 분석한 소비 패턴을 경험해 보세요!🤩""")
# strealit font 설정 (구글 font만 가능)
font = "Noto Sans Korean"
# strealit 배경색 설정
backgroundColor = "#F0F0F0"
# plot font 설정
font_dirs = ['./fonts']
font_files = fm.findSystemFonts(fontpaths=font_dirs)
for font_file in font_files:
fm.fontManager.addfont(font_file)
fm._load_fontmanager(try_read_cache=False)
plt.rcParams['font.family'] = 'NanumGothicCoding'
# ======================================================================================================================
# data 선언
# ======================================================================================================================
brand_df_col_dict = {
'대분류': str,
'중분류': str,
'법인명': str,
'브랜드명': str,
'brno': str,
'crno': str,
}
spending_df = pd.read_csv("./data/base_data.csv", encoding="utf-8")
influence_df = pd.read_csv("./data/influence_df.csv")
influence_df['날짜'] = pd.to_datetime(influence_df['날짜'])
influence_df['월'] = influence_df['날짜'].dt.month
brand_df = pd.read_csv("./data/brand_df.csv", dtype=brand_df_col_dict, encoding="utf-8-sig")
# ======================================================================================================================
# 변수 선언
# ======================================================================================================================
color_palette = ["#ffa505", "#ffb805", "#ffc905", "#ffe505", "#fffb05"]
brand_dict = {
"CU":"cu",
"쿠팡": "coupang",
"다이소":"daiso",
"홈플러스":"homeplus",
"인터파크":"interpark",
"제주항공":"jejuair",
"올리브영":"oliveyoung",
"세븐일레븐":"seven",
"스타벅스":"starbucks",
"넷플릭스":"netflix",
"GS25":"gs25",
"11번가":"11st",
"버거킹":"burgerking",
"본도시락":"bonif",
"애플":"apple",
"더벤티":"theventi",
"지마켓":"gmarket",
"네이버페이":"naverpay",
"카카오페이":"cacaopay",
"티몬":"tmon",
"위메프":"wemap",
"크린토피아":"cleantopia",
"투썸플레이스":"towsome",
"이마트":"emart",
"SK브로드밴드":"skbro",
"현대해상" : "hdmi",
"SK매직":"skmagic",
"롯데쇼핑":"lotteshop",
"뚜레쥬르":"torejo",
"장난감도서관":"toylib",
"파리바게뜨":"paba",
"무신사":"musinsa",
"이디야커피":"ediya",
"배스킨라빈스":"br",
"롯데리아":"lotteria",
"멜론티켓":"melon",
"옥션":"auction",
"티머니":"tmoney",
"우체국":"postoffice",
"KT통신":"kytele"
}
# 업종 분류 : 영어번역
eng_cat_dict = {
"(건강)식품": "healthy food",
"종합소매점": "retail",
"기타도소매": "wholesale and retail",
"농수산물": "grocery store",
"의류/패션": "clothing Store",
"편의점": "convenience store",
"화장품": "makeup shop",
"PC방": "internet cafe",
"교육": "educational institute",
"기타 서비스": "service industries",
"반려동물 관련": "animal hospital",
"배달": "food delivery",
"임대": "real estate agent",
"부동산 중개": "real estate agent",
"세탁": "laundry shop",
"숙박": "hotel",
"스포츠": "gym",
"안경": "optician´s shop",
"약국": "pharmacy",
"오락": "Amusement arcade",
"운송": "delivery",
"유아 관련": "baby product store",
"미용": "hair salon",
"인력 파견": "moving van",
"이사": "moving van",
"자동차": "car dealership",
"분식": "korean restaurant",
"한식": "korean restaurant",
"서양식": "american restaurant",
"아이스크림/빙수 ": "icecream shop",
"커피/음료": "cafe",
"일식": "japanese restaurant",
"제과제빵": "bakery",
"주점": "pub",
"중식": "chinese restaurant",
"기타 외식": "restaurant",
"치킨": "restaurant",
"패스트푸드": "restaurant",
"피자": "restaurant",
"전자상거래" : "e-commerce",
"결제대행" : "payment agency",
"금융/보험" : "finance/insurance",
"문화" : "theater",
"건강/의료" : "health/medical care",
"통신업" : "telecommunications",
"대중교통" : "public transport",
"공과금" : "utilities",
"교통" : "traffic",
"스트리밍": "streaming service",
"통신": "the information and communications",
"금융": "finance",
"가전": "appliance",
}
# 국민은행 캐릭터 성격
personality_dict = {
"심쿵비비":"듬직하고 배려깊게 친구들을 잘 보듬어주는 다정다감하고 순둥순둥한 성격",
"멜랑콜리":"항상 무심한 표정으로 뚱해보이지만 말 없이 친구들을 잘 챙기는 따뜻한 성격",
"포스아거":"무모할 정도로 도전정신이 넘치고 허당미 뿜뿜한 성격",
"롤로라무":"언제 어떤 일이 있어도 다 괜찮다고 생각하는 무한긍정 성격",
"루나키키":"호불호가 분명하고 감정표현이 자유분방하며, 솔직하고 뒤 끝 없는 성격"
}
# 각 등급별 하위 몇%
idx_grade_dict = {
"S": 0.9,
"A": 0.6,
"B": 0.4,
"C": 0.2,
"D": 0.1,
}
# 브랜드 리스트
brand_list = list(spending_df["이용 브랜드"].unique())
# ======================================================================================================================
# 함수 선언
# ======================================================================================================================
# 날짜 col 9월 기준으로 9, 8, 7 가중치 적용? 최근일 수록 가중치가 높은 6월 이전은 같은 점수
# 가중치기준... 1.5 / 1.25 / 1.1 / 1
# 각 브랜드별 ESG 성적표 df 제작
def make_brand_esg_grad_df(influence_df):
data = {
"브랜드 이름": [],
"환경 점수": [],
"사회 점수": [],
"지배구조 점수": []
}
grade_dict = {"매우 긍정적인 영향력": 10,
"약간 긍정적인 영향력": 5,
"약간 부정적인 영향력": -5,
"매우 부정적인 영향력": -10,
}
target_month = 9
# 성적 담을 빈 데이터프레임 제작
brand_esg_grade_df = pd.DataFrame(data)
green = "환경"
social = "사회"
gover = "지배구조"
for brand in brand_list:
green_weight = 0
social_weight = 0
gover_weight = 0
filtered_brand_df = influence_df[influence_df["브랜드"] == brand]
# 영향력 수치화
for i in range(len(filtered_brand_df)):
influence = filtered_brand_df.iloc[i]["영향력"]
if filtered_brand_df.iloc[i]["esg_idx"] == green:
if filtered_brand_df.iloc[i]["월"] == target_month:
green_weight += (grade_dict[influence] * 1.5)
elif filtered_brand_df.iloc[i]["월"] == target_month - 1:
green_weight += (grade_dict[influence] * 1.25)
elif filtered_brand_df.iloc[i]["월"] == target_month - 2:
green_weight += (grade_dict[influence] * 1.1)
else:
green_weight += (grade_dict[influence] * 1)
elif filtered_brand_df.iloc[i]["esg_idx"] == social:
if filtered_brand_df.iloc[i]["월"] == target_month:
social_weight += (grade_dict[influence] * 1.5)
elif filtered_brand_df.iloc[i]["월"] == target_month - 1:
social_weight += (grade_dict[influence] * 1.25)
elif filtered_brand_df.iloc[i]["월"] == target_month - 2:
social_weight += (grade_dict[influence] * 1.1)
else:
social_weight += (grade_dict[influence] * 1)
else:
if filtered_brand_df.iloc[i]["월"] == target_month:
gover_weight += (grade_dict[influence] * 1.5)
elif filtered_brand_df.iloc[i]["월"] == target_month - 1:
gover_weight += (grade_dict[influence] * 1.25)
elif filtered_brand_df.iloc[i]["월"] == target_month - 2:
gover_weight += (grade_dict[influence] * 1.1)
else:
gover_weight += (grade_dict[influence] * 1)
# concat() 함수를 사용하여 데이터프레임을 병합
new_row = pd.DataFrame({
"브랜드 이름": [brand],
"환경 점수": [green_weight],
"사회 점수": [social_weight],
"지배구조 점수": [gover_weight]
})
# 데이터 추가
brand_esg_grade_df = pd.concat([brand_esg_grade_df, new_row], ignore_index=True)
brand_esg_grade_df = brand_esg_grade_df.fillna(0)
return brand_esg_grade_df
# 전체 브랜드 대비 특정 브랜드가 상위 n%인지 계산하여 등급 매기기
def cal_esg_grade(brand_esg_grade_df):
brand_esg_grade_df = brand_esg_grade_df.fillna(0) # 새로운 DataFrame으로 할당
# 각 지표별 총합 점수 계산
green_total_score = int(brand_esg_grade_df["환경 점수"].sum())
social_total_score = int(brand_esg_grade_df["사회 점수"].sum())
gover_total_score = int(brand_esg_grade_df["지배구조 점수"].sum())
# 점수 초기화
brand_esg_grade_df["환경 지수"] = ""
brand_esg_grade_df["사회 지수"] = ""
brand_esg_grade_df["지배구조 지수"] = ""
# 브랜드 리스트의 브랜드별로 계산
for brand in brand_list:
filtered_brand_df = brand_esg_grade_df[brand_esg_grade_df["브랜드 이름"] == brand]
green_score = filtered_brand_df["환경 점수"].item()
social_score = filtered_brand_df["사회 점수"].item()
gover_score = filtered_brand_df["지배구조 점수"].item()
if green_total_score != 0 and social_total_score != 0 and gover_total_score != 0:
green_pie = (green_score / green_total_score) * 100
social_pie = (social_score / social_total_score) * 100
gover_pie = (gover_score / gover_total_score) * 100
else:
green_pie = 0
social_pie = 0
gover_pie = 0
if green_pie >= idx_grade_dict["S"]:
brand_esg_grade_df.loc[brand_esg_grade_df["브랜드 이름"] == brand, "환경 지수"] = "S"
elif green_pie >= idx_grade_dict["A"]:
brand_esg_grade_df.loc[brand_esg_grade_df["브랜드 이름"] == brand, "환경 지수"] = "A"
elif green_pie >= idx_grade_dict["B"]:
brand_esg_grade_df.loc[brand_esg_grade_df["브랜드 이름"] == brand, "환경 지수"] = "B"
elif green_pie >= idx_grade_dict["C"]:
brand_esg_grade_df.loc[brand_esg_grade_df["브랜드 이름"] == brand, "환경 지수"] = "C"
else:
brand_esg_grade_df.loc[brand_esg_grade_df["브랜드 이름"] == brand, "환경 지수"] = "D"
if social_pie >= idx_grade_dict["S"]:
brand_esg_grade_df.loc[brand_esg_grade_df["브랜드 이름"] == brand, "사회 지수"] = "S"
elif social_pie >= idx_grade_dict["A"]:
brand_esg_grade_df.loc[brand_esg_grade_df["브랜드 이름"] == brand, "사회 지수"] = "A"
elif social_pie >= idx_grade_dict["B"]:
brand_esg_grade_df.loc[brand_esg_grade_df["브랜드 이름"] == brand, "사회 지수"] = "B"
elif social_pie >= idx_grade_dict["C"]:
brand_esg_grade_df.loc[brand_esg_grade_df["브랜드 이름"] == brand, "사회 지수"] = "C"
else:
brand_esg_grade_df.loc[brand_esg_grade_df["브랜드 이름"] == brand, "사회 지수"] = "D"
if gover_pie >= idx_grade_dict["S"]:
brand_esg_grade_df.loc[brand_esg_grade_df["브랜드 이름"] == brand, "지배구조 지수"] = "S"
elif gover_pie >= idx_grade_dict["A"]:
brand_esg_grade_df.loc[brand_esg_grade_df["브랜드 이름"] == brand, "지배구조 지수"] = "A"
elif gover_pie >= idx_grade_dict["B"]:
brand_esg_grade_df.loc[brand_esg_grade_df["브랜드 이름"] == brand, "지배구조 지수"] = "B"
elif gover_pie >= idx_grade_dict["C"]:
brand_esg_grade_df.loc[brand_esg_grade_df["브랜드 이름"] == brand, "지배구조 지수"] = "C"
else:
brand_esg_grade_df.loc[brand_esg_grade_df["브랜드 이름"] == brand, "지배구조 지수"] = "D"
# 브랜드 ESG 성적표가 담긴 df 반환
return brand_esg_grade_df
# choosed_df에 esg 소비액 추가
def add_spending_esg_col(choosed_df):
idx_grade_dict = {
"S": 0.9,
"A": 0.6,
"B": 0.4,
"C": 0.2,
"D": 0.1,
}
choosed_brand_list = choosed_df["이용 브랜드"].unique()
for brand in choosed_brand_list:
filtered_brand_data = brand_esg_grade_df[brand_esg_grade_df["브랜드 이름"] == brand]
if not filtered_brand_data.empty:
e_idx = filtered_brand_data["환경 지수"].iloc[0]
s_idx = filtered_brand_data["사회 지수"].iloc[0]
g_idx = filtered_brand_data["지배구조 지수"].iloc[0]
else:
e_idx = "D" # 예외 처리
s_idx = "D" # 예외 처리
g_idx = "D" # 예외 처리
# 가중치 계산
e_weight = idx_grade_dict[e_idx]
s_weight = idx_grade_dict[s_idx]
g_weight = idx_grade_dict[g_idx]
# 특정 브랜드에 해당하는 행들 조회
filtered_rows = choosed_df.loc[choosed_df["이용 브랜드"] == brand]
# "환경 소비" 칼럼에 새로운 값으로 업데이트
for index in filtered_rows.index:
e_spending = choosed_df.loc[index, "국내이용금액 (원)"] * e_weight
s_spending = choosed_df.loc[index, "국내이용금액 (원)"] * s_weight
g_spending = choosed_df.loc[index, "국내이용금액 (원)"] * g_weight
choosed_df.loc[index, "환경(E) 소비"] = e_spending
choosed_df.loc[index, "사회(S) 소비"] = s_spending
choosed_df.loc[index, "지배구조(G) 소비"] = g_spending
choosed_df[["환경(E) 소비", "사회(S) 소비", "지배구조(G) 소비"]] = choosed_df[["환경(E) 소비", "사회(S) 소비", "지배구조(G) 소비"]].fillna(0)
return choosed_df
# 유저 esg 소비액 계산
def cal_esg_spending(choosed_df):
# 소비액 계산
esg_spending_dict = {
"환경(E) 소비": 0,
"사회(S) 소비": 0,
"지배구조(G) 소비": 0
}
spending_total = choosed_df["국내이용금액 (원)"].sum()
esg_spending_dict["환경(E) 소비"] = choosed_df["환경(E) 소비"].sum()
esg_spending_dict["사회(S) 소비"] = choosed_df["사회(S) 소비"].sum()
esg_spending_dict["지배구조(G) 소비"] = choosed_df["지배구조(G) 소비"].sum()
e_spending_per = round((esg_spending_dict["환경(E) 소비"] * 100) / spending_total, 2)
s_spending_per = round((esg_spending_dict["사회(S) 소비"] * 100) / spending_total, 2)
g_spending_per = round((esg_spending_dict["지배구조(G) 소비"] * 100) / spending_total, 2)
return spending_total, esg_spending_dict, e_spending_per, s_spending_per, g_spending_per
# ESG 지표중 최고 지표 기준의 결제 df 생성
def make_max_esg_spending_df(spending_df):
max_key = max(esg_spending_dict, key=esg_spending_dict.get) # 최고 소비지표 찾기
# 최고 소비 지표 기준 신규 df 생성
max_esg_df = spending_df.loc[spending_df[max_key] != 0.0][["카테고리", max_key]]
max_esg_df = max_esg_df.groupby("카테고리").sum(max_key).sort_values(by=max_key, ascending=False)
# "사회(S) 소비" 기준으로 상위 k개 카테고리 선택
top_k = 3
top_categories = max_esg_df.nlargest(top_k, max_key)
# 나머지 합을 계산하여 "기타" 카테고리로 추가
other_category_sum = max_esg_df[max_key].sum() - top_categories[max_key].sum()
other_category = pd.DataFrame({max_key: [other_category_sum]}, index=["기타"])
# 상위 3개와 "기타" 카테고리 합쳐서 새로운 데이터프레임 생성
max_esg_spending_df = pd.concat([top_categories, other_category])
return max_key, max_esg_spending_df
# brand_esg_grade_df, brand_df에서 필요한칼럼만 추출
def merged_df(brand_esg_grade_df):
merged_df = brand_esg_grade_df.merge(brand_df[['대분류', '중분류', '브랜드명']], left_on='브랜드 이름', right_on='브랜드명', how='left')
# 필요 없는 열 "브랜드명"를 삭제합니다.
merged_df.drop(columns='브랜드명', inplace=True)
filtered_df = merged_df[merged_df["중분류"].notna()]
return filtered_df
# 환경, 사회, 지배구조 딕셔너리 만들기
def top_esg_brand(filtered_df):
esg_idx_mapping = {"D": 1, "C": 2, "B": 3, "A": 4, "S": 5}
# 중분류 기준으로 그룹화하고 환경 지수가 가장 높은 행 추출
filtered_df['환경 지수 등급'] = filtered_df['환경 지수'].map(esg_idx_mapping)
highest_e_idx_rows = filtered_df.groupby('중분류').apply(lambda group: group[group['환경 지수 등급'] == group['환경 지수 등급'].max()])
# 중분류 기준으로 그룹화하고 사회 지수가 가장 높은 행 추출
filtered_df['사회 지수 등급'] = filtered_df['사회 지수'].map(esg_idx_mapping)
highest_s_idx_rows = filtered_df.groupby('중분류').apply(lambda group: group[group['사회 지수 등급'] == group['사회 지수 등급'].max()])
# 중분류 기준으로 그룹화하고 지배구조 지수가 가장 높은 행 추출
filtered_df['지배구조 지수 등급'] = filtered_df['지배구조 지수'].map(esg_idx_mapping)
highest_g_idx_rows = filtered_df.groupby('중분류').apply(lambda group: group[group['지배구조 지수 등급'] == group['지배구조 지수 등급'].max()])
e_top_dict = {}
s_top_dict = {}
g_top_dict = {}
for idx, row in highest_e_idx_rows.iterrows():
category = row['중분류']
brand = row['브랜드 이름']
e_idx = row['환경 지수']
e_top_dict[category] = {'브랜드 이름': brand, '환경 지수': e_idx}
for idx, row in highest_s_idx_rows.iterrows():
category = row['중분류']
brand = row['브랜드 이름']
s_idx = row['사회 지수']
s_top_dict[category] = {'브랜드 이름': brand, '사회 지수': s_idx}
for idx, row in highest_g_idx_rows.iterrows():
category = row['중분류']
brand = row['브랜드 이름']
g_idx = row['지배구조 지수']
g_top_dict[category] = {'브랜드 이름': brand, '지배구조 지수': g_idx}
return e_top_dict, s_top_dict, g_top_dict
# 이용 고객님의 esg 소비 비중 그래프
def plot_esg_spending():
fig, ax = plt.subplots(figsize=(10, 3))
categories=["ESG 소비 비중"]
# 그래프 그리기
bars1 = plt.barh(categories, e_spending_per, color=color_palette[4], label='환경 소비')
bars2 = plt.barh(categories, s_spending_per, left=e_spending_per, color=color_palette[3], label='사회 소비')
bars3 = plt.barh(categories, g_spending_per, left=e_spending_per + s_spending_per, color=color_palette[2], label='지배구조 소비')
plt.barh(categories, 100 - (e_spending_per + s_spending_per + g_spending_per),
left=e_spending_per + s_spending_per + g_spending_per, color=color_palette[0], label='전체 소비')
# print(e_spending_per, s_spending_per, g_spending_per)
# 바 위에 값 표시하기
e_label = [f"{e_spending_per}%"]
s_label = [f"{s_spending_per}%"]
g_label = [f"{g_spending_per}%"]
plt.bar_label(bars1, label_type='center', labels=e_label)
plt.bar_label(bars2, label_type='center', labels=s_label)
plt.bar_label(bars3, label_type='center', labels=g_label)
# 축 레이블, 범례 등 설정
plt.title(f'{selected_name}님의 ESG 소비 비중')
plt.yticks([])
# plt.legend(bbox_to_anchor=(1.01, 1))
# plt.legend(bbox_to_anchor=(-1, 0.1))
plt.legend(loc='upper right')
# 그래프 표시
st.pyplot(fig)
#최고 esg 카테고리 막대 그래프
def plot_max_esg_ctg():
# 막대그래프 그리기
fig, ax = plt.subplots(figsize=(10, 4))
plt.bar(max_esg_spending_df.index, max_esg_spending_df[max_key], color=color_palette)
# 축 레이블, 그래프 제목 등 설정
plt.title(f"{selected_name}님의 {max_key} TOP3 업종")
# 그래프 표시
plt.tight_layout()
st.pyplot(fig)
# 그림 출력
def get_openai_image(place):
response = openai.Image.create(
prompt=f"a cute {place} interior illustration",
n=1,
size="1024x1024"
)
image_url = response["data"][0]["url"]
response = requests.get(image_url)
openai_image = Image.open(BytesIO(response.content))
image_dir = "./data/image"
# 디렉토리 내의 모든 이미지 파일 리스트를 얻습니다.
image_files = [f for f in os.listdir(image_dir) if f.endswith(".jpg") or f.endswith(".png")]
# 이미지 파일 중에서 랜덤하게 하나를 선택합니다.
random_image_filename = random.choice(image_files)
# 선택된 이미지 파일의 전체 경로를 구성합니다.
random_image_path = os.path.join(image_dir, random_image_filename)
# 랜덤 이미지를 로드합니다.
random_image = Image.open(random_image_path)
random_image = random_image.resize(openai_image.size)
# 이미지 합치기
combined = Image.alpha_composite(openai_image.convert('RGBA'), random_image.convert('RGBA'))
return combined, random_image_filename
# 유저 데이터 프레임 필터링
def filtered_spending_df(name):
user_spending_df = spending_df[spending_df["이용 고객명"] == name]
user_spending_df = user_spending_df.reset_index(drop=True)
return user_spending_df
def generate_prompt(character, name, place, esg_code):
prompt = ""
if "bears" in character:
prompt = f"""
300자 정도 작성해줘.
{name} 고객님으로 시작할 것.
고객님은 기업의 ESG 중 {esg_code}의 소비를 가장 많이 했어.
친근한 느낌의 반말로 작성해줘.
주어진 정보 외에 절대 말을 만들어내지마.
---
고객이름: {name}
최대소비장소: {place}
ESG 설명: E는 기업의 친환경 경영, S은 기업의 사회적 책임, G는 기업의 투명한 지배구조
예시: 안녕 김국민님! 최대소비 장소가 음식점이라니, 정말 맛있는 것들을 좋아하는구나! 😊✨
---
"""
elif "brocoli" in character:
prompt = f"""
300자 정도 작성해줘.
{name} 고객님으로 시작할 것.
고객님은 기업의 ESG 중 {esg_code}의 소비를 가장 많이 했어.
친근한 느낌의 반말로 작성해줘.
주어진 정보 외에 절대 말을 만들어내지마.
---
고객이름: {name}
최대소비장소: {place}
ESG 설명: E는 기업의 친환경 경영, S은 기업의 사회적 책임, G는 기업의 투명한 지배구조
예시: 안녕 김국민님! 최대소비 장소가 음식점이라니, 정말 맛있는 것들을 좋아하는구나! 😊✨
---
"""
elif "ducks" in character:
prompt = f"""
300자 정도 작성해줘.
{name} 고객님으로 시작할 것.
고객님은 기업의 ESG 중 {esg_code}의 소비를 가장 많이 했어.
친근한 느낌의 반말로 작성해줘.
주어진 정보 외에 절대 말을 만들어내지마.
---
고객이름: {name}
최대소비장소: {place}
ESG 설명: E는 기업의 친환경 경영, S은 기업의 사회적 책임, G는 기업의 투명한 지배구조
예시: 안녕 김국민님! 최대소비 장소가 음식점이라니, 정말 맛있는 것들을 좋아하는구나! 😊✨
---
"""
elif "lamas" in character:
prompt = f"""
300자 정도 작성해줘.
{name} 고객님으로 시작할 것.
고객님은 기업의 ESG 중 {esg_code}의 소비를 가장 많이 했어.
친근한 느낌으로 작성해줘.
주어진 정보 외에 절대 말을 만들어내지마.
---
고객이름: {name}
최대소비장소: {place}
ESG 설명: E는 기업의 친환경 경영, S은 기업의 사회적 책임, G는 기업의 투명한 지배구조
예시: 안녕 김국민님! 최대소비 장소가 음식점이라니, 정말 맛있는 것들을 좋아하는구나! 😊✨
---
"""
else:
prompt = f"""
300자 정도 작성해줘.
{name} 고객님으로 시작할 것.
고객님은 기업의 ESG 중 {esg_code}의 소비를 가장 많이 했어.
친근한 느낌의 반말로 작성해줘.
주어진 정보 외에 절대 말을 만들어내지마.
---
고객이름: {name}
최대소비장소: {place}
ESG 설명: E는 기업의 친환경 경영, S은 기업의 사회적 책임, G는 기업의 투명한 지배구조
예시: 안녕 김국민님! 최대소비 장소가 음식점이라니, 정말 맛있는 것들을 좋아하는구나! 😊✨
---
"""
return prompt.strip()
@st.cache_resource
def request_chat_completion(character, prompt):
if "bears" in character:
ch_name = "심쿵비비"
per = personality_dict[ch_name]
elif "brocoli" in character:
ch_name = "멜랑콜리"
per = personality_dict[ch_name]
elif "ducks" in character:
ch_name = "포스아거"
per = personality_dict[ch_name]
elif "lamas" in character:
ch_name = "롤로라무"
per = personality_dict[ch_name]
else:
ch_name = "루나키키"
per = personality_dict[ch_name]
response = openai.ChatCompletion.create(
model="gpt-3.5-turbo-0613",
messages=[
{"role": "system", "content": f"당신은 {per}의 {ch_name}입니다."},
{"role": "user", "content": prompt}
],
stream=True
)
return response
# 소비 카테고리 추천
def check_top_brand(choosed_df):
idx_grade_dict = {
"S": 0.9,
"A": 0.6,
"B": 0.4,
"C": 0.2,
"D": 0.1,
}
spending_total, esg_spending_dict, e_spending_per, s_spending_per, g_spending_per = cal_esg_spending(choosed_df)
min_key = min(esg_spending_dict, key=esg_spending_dict.get)
max_category = choosed_df.groupby("카테고리")[min_key].sum().idxmax()
max_brand = choosed_df.groupby(["이용 브랜드"])[min_key].sum().idxmax()
# 현재 가장 적은 ESG 소비에서 가장 많이 소비한 카테고리의 평균 값
cat_len = choosed_df[choosed_df["카테고리"] == max_category].groupby("카테고리")[min_key].count()[0]
cat_total = choosed_df.groupby("카테고리")[min_key].sum().sort_values(ascending=False)[0]
ave_cat = cat_total / cat_len
# 현재 가장 적은 ESG 소비에서 가장 많이 소비한 카테고리의 실제 소비 평균
origin_ave = choosed_df[choosed_df["카테고리"] == max_category]["국내이용금액 (원)"].sum() / cat_len
message = ""
if "E" in min_key:
if max_category in e_top_dict:
rec_brand_info = e_top_dict[max_category]
rec_brand_name = rec_brand_info['브랜드 이름']
rec_brand_code = rec_brand_info['환경 지수']
if_rec_brand = round((origin_ave * idx_grade_dict[rec_brand_code]) / ave_cat, 4)
if rec_brand_name != max_brand:
message = f"ESG 소비 중 환경 소비가 가장 낮으시네요 🥺.\n\n가장 많이 소비를 하시는 {max_category} 분야에서 환경 지수가 제일 높은 브랜드는 '{rec_brand_name}'입니다.\n\n이 브랜드를 사용하시면 환경 소비가 최대 {if_rec_brand}배 증가합니다.\n\n이곳을 사용해보시는건 어떠세요?"
else:
message = f"이미 {max_category} 분야에서 환경 지수가 가장 높은 {rec_brand_name} 브랜드를 사용중이시군요!☺️"
else:
message = f"죄송합니다. 환경 지표 중 {max_category} 분야에서 추천 할 브랜드가 아직 없습니다."
elif "S" in min_key:
if max_category in s_top_dict:
rec_brand_info = s_top_dict[max_category]
rec_brand_name = rec_brand_info['브랜드 이름']
rec_brand_code = rec_brand_info['사회 지수']
if_rec_brand = round((origin_ave * idx_grade_dict[rec_brand_code]) / ave_cat, 4)
if rec_brand_name != max_brand:
message = f"ESG 소비 중 사회 소비가 가장 낮으시네요 🥺.\n\n가장 많이 소비를 하시는 {max_category} 분야에서 사회 지수가 제일 높은 브랜드는 '{rec_brand_name}'입니다.\n\n이 브랜드를 사용하시면 환경 소비가 최대 {if_rec_brand}배 증가합니다.\n\n이곳을 사용해보시는건 어떠세요?"
else:
message = f"이미 {max_category} 분야에서 사회 지수가 가장 높은 {rec_brand_name} 브랜드를 사용중이시군요!☺️"
else:
message = f"죄송합니다. 사회 지표 중 {max_category} 분야에서 추천 할 브랜드가 아직 없습니다."
elif "G" in min_key:
if max_category in g_top_dict:
rec_brand_info = g_top_dict[max_category]
rec_brand_name = rec_brand_info['브랜드 이름']
rec_brand_code = rec_brand_info['지배구조 지수']
if_rec_brand = round((origin_ave * idx_grade_dict[rec_brand_code]) / ave_cat, 4)
if rec_brand_name != max_brand:
message = f"ESG 소비 중 지배구조 소비가 가장 낮으시네요 🥺.\n\n가장 많이 소비를 하시는 {max_category} 분야에서 지배구조 지수가 제일 높은 브랜드는 '{rec_brand_name}'입니다.\n\n이 브랜드를 사용하시면 환경 소비가 최대 {if_rec_brand}배 증가합니다.\n\n이곳을 사용해보시는건 어떠세요?"
else:
message = f"이미 {max_category} 분야에서 지배구조 지수가 가장 높은 {rec_brand_name} 브랜드를 사용중이시군요!☺️"
else:
message = f"죄송합니다. 지배구조 지표 중 {max_category} 분야에서 추천 할 브랜드가 아직 없습니다."
else:
message = "유효하지 않은 입력입니다."
if max_category == "문화":
pass
else:
# 막대그래프 그리기
fig, ax = plt.subplots(figsize=(15, 3))
categories = ['타 브랜드 평균', rec_brand_name]
values = [ave_cat, origin_ave * idx_grade_dict[rec_brand_code]]
plt.bar(categories, values, color=color_palette, width=0.4)
# 축 레이블, 그래프 제목 등 설정
plt.title(f"{selected_name}님의 {max_category} 카테고리 {min_key} 지수 브랜드 비교")
# 그래프 표시
plt.tight_layout()
st.pyplot(fig)
return message
# ======================================================================================================================
# 각 브랜드별 ESG 성적표 df 제작
brand_esg_grade_df = make_brand_esg_grad_df(influence_df)
brand_esg_grade_df = cal_esg_grade(brand_esg_grade_df)
filtered_df = merged_df(brand_esg_grade_df)
result = top_esg_brand(filtered_df)
e_top_dict, s_top_dict, g_top_dict = result
ch_name_dict = {
"rabbits": "루나키키",
"bears":"심쿵비비",
"lamas":"롤로라무",
"brocoli":"멜랑콜리",
"ducks":"포스아거"
}
# ======================================================================================================================
# streamlit code
# ======================================================================================================================
with st.form("고객 정보 조회"):
st.title('고객 정보 조회')
customer_list = ["차국민", "라국민", "허리브", "정국민", "현국민", "강리브"]
selected_name = st.selectbox('고객 이름', customer_list)
submitted = st.form_submit_button("조회")
if submitted:
choosed_df = filtered_spending_df(name=selected_name)
choosed_df.set_index("이용일", inplace=True)
if not choosed_df.empty:
choosed_df_show = choosed_df.drop(["년", "월", "일", "국내이용금액 (원)", "이용 브랜드"], axis=1)
# dataframe 출력
st.dataframe(choosed_df_show, height=200, width=2000)
# choosed_df에 esg 소비액 추가
choosed_df = add_spending_esg_col(choosed_df)
# 유저 esg 소비액 계산
spending_total, esg_spending_dict, e_spending_per, s_spending_per, g_spending_per = cal_esg_spending(choosed_df)
# ESG 지표중 최고 지표 기준의 결제 df 생성
max_key, max_esg_spending_df = make_max_esg_spending_df(choosed_df)
col1, col2 = st.columns(2)
with col1:
# 이용 고객 ESG 소비 비중 그래프
plot_esg_spending()
with col2:
# 이용 고객 최고 ESG 소비 비중 TOP3 업종 그래프
plot_max_esg_ctg()
if max_esg_spending_df.iloc[0].name in eng_cat_dict:
eng_place = eng_cat_dict[max_esg_spending_df.iloc[0].name]
st.subheader(f"{selected_name} 님의 9월 ESG 소비 내역입니다.")
st.write(f"총 소비액: {spending_total}원")
st.write(f"환경(E) 소비액: {round(esg_spending_dict['환경(E) 소비'], 0)}원 (전체 소비 대비 {e_spending_per}%)")
st.write(f"사회(S) 소비액: {round(esg_spending_dict['사회(S) 소비'], 0)}원 (전체 소비 대비 {s_spending_per}%)")
st.write(f"지배구조(G) 소비액: {round(esg_spending_dict['지배구조(G) 소비'], 0)}원 (전체 소비 대비: {g_spending_per}%)")
st.markdown("---")
place = eng_place
ans = check_top_brand(choosed_df)
st.write(ans)
st.markdown("---")
col1, col2, col3 = st.columns(3)
with col2:
with st.spinner("스타프렌즈가 오고 있어요 ⭐"):
img, character = get_openai_image(place)
st.image(img)
ch_name = character.split("_")[0]
with st.spinner(f"{ch_name_dict[ch_name]}가 인사를 하려고 준비중 이에요"):
# prompt
prompt = generate_prompt(character, selected_name, place, max_key)
st.write(f"{ch_name_dict[ch_name]}의 한마디...💬")
chatgpt_response = request_chat_completion(character, prompt)
message_placeholder = st.empty()
response = ""
for chunk in chatgpt_response:
delta = chunk.choices[0]["delta"]
if "content" in delta:
response += delta["content"]
message_placeholder.markdown(response + "▌")
else:
break
message_placeholder.markdown(response)
else:
st.write(f"{selected_name}에 대한 정보가 없습니다.")