주제 1. "와이스"의 라이브 방송 환경에 적합한 추천 시스템 구성
“와이스(WYYYES)” 어플의 주요 과제인 신규 판매자-구매자 쌍 생성을 촉진하기 위해, “유저가 최근 관심 있었던 콘텐츠 정보” 를 빠르게 반영하여 실시간 추천 순위를 정렬하는 알고리즘을 설계한다.
주제 1-1. 유저의 최근 관심사를 반영한 시청 예측 모델 (GRU4Rec)
- 추천 대상인 라이브 방송이 단기간(1-2시간) 동안만 존재하는 특수한 환경, 상호작용 정보를 바탕으로 상품 id 자체에 임베딩을 부여하는 보편적인 CF 방법론을 사용할 수 없다고 판단.
- 따라서 방송이 가진 메타 데이터(셀러, 카테고리, 서브카테고리, 제목) 각각의 임베딩을 합친 것을 방송의 임베딩으로 삼는 방식을 채택. 즉, 방송이 가진 콘텐츠적 성격에 따라 임베딩을 부여받게 됨.
- 시퀀셜 모델인 GRU4Rec을 채택하여, 유저의 최근 관심사를 빠르게 반영하여 유저가 흥미있게 시청할 가능성이 높다고 판단되는 방송들을 상위에 추천.
주제 1-2. 온라인 A/B 테스트 및 사후 분석
- 기존 사측 알고리즘 vs GRU4Rec 이 적용되는 유저 군을 50:50으로 분리하여 A/B 테스트 진행
- WYYES 어플의 각 지면별로 새로운 추천 시스템의 효과를 비교 분석 (알고리즘이 높은 순위로 추천해준 방송을 유저가 실제로 클릭했는지, 이후 방송에 장시간 체류했는지)
- 이 과정에서 유저들의 방송 진입 경로에 관한 로그를 새롭게 적재하였으며, 사후 분석을 통해 유저들이 주로 어떤 지면을 많이 사용하는지 파악.
주제 2. 어플의 주요 지면에 최적화된 추천 알고리즘 설계
지난 진입 경로 로그 분석 결과, Feed 지면을 통해 방송에 진입하는 유저들의 비율이 예상했던 것보다 훨씬 높은 것으로 확인되었다. 따라서 Feed 지면, 그 중에서도 유저들의 이용이 가장 많은 “C” 카테고리 탭에 특화된 추천 알고리즘 설계를 기획한다. “C” 카테고리의 방송끼리만 경쟁하는 환경이므로, 모델의 목표는 유저의 특정 캐릭터(IP) 선호를 파악하여 추천에 반영한다.
주제 2-1. 상품의 IP 정보를 확보하기 위한 subcategory 라벨링 (LLM Prompting)
- 좀 더 정확한 유저의 IP선호 정보를 얻기 위해 유저들의 상품 구매 기록을 이용하기로 결정했지만, 판매된 상품 정보에는 subcategory가 별도로 기록되어 있지 않은 상황.
- 이를 타파하기 위해 LLM 프롬프팅을 통해 판매된 상품의 이미지를 보고 어떤 IP의 상품인지 라벨링하는 작업을 진행함. (Pydantic을 활용한 Structured Output 기반의 프롬프트 설계)
주제 2-2. 시청/입찰 확률 예측 모델 (2-track DIN)
- 상품 구매 기록을 이용할 수 있는 만큼, 이번에는 시청에 더해 “입찰” 자체를 직접적으로 예측하고자 함.
- 고객의 시청 시퀀스/ 구매 상품 시퀀스를 함께 고려하여 현재 라이브 방송 각각에 대해 “시청 확률/ 입찰 시도 확률”을 내뱉는 모델 구조.
- “유저가 방송을 시청할 확률 A” 과 “유저가 방송을 시청한다면(조건부), 입찰 시도까지 할 확률 B” 을 각각 계산 - > 입찰 확률 = A*B