삼육오엠씨 | 365mc


STT 상담 데이터 분석을 통한 고객 맞춤형 상담 전략 수립

프로젝트 소개

365mc는 상담 데이터를 기반으로 365mc만의 상담 성공 방정식을 도출하고 시스템화한 DA+DS 프로젝트입니다. 기존 상담 성과가 개별 상담사의 상담 노하우에 좌우되던 기존 방식을 탈피하여, 고성능 STT 기술과 데이터 분석을 통해 우수 상담의 패턴을 정량화하고 이를 표준 가이드라인으로 정립하였습니다. 이를 통해 고객에게는 더 나은 상담 경험을, 병원에는 안정적인 성과 창출 기반을 마련하였습니다.

세부 목표:
1. 상담 데이터 분석을 위한 고성능 STT 모델 개발
2. 고객 맞춤형 내원 제안(Outbound) 전략 도출
3. 고객의 합리적 판단을 돕는 최적 시술 제안(Inbound) 전략 도출

로드맵
스크린샷_2025-12-24_오전_9.56_.58_(1)_.png
진행 프로세스
​​
주제 1. 상담 데이터 분석을 위한 고성능 STT 모델 개발
기존 상용 STT 활용 환경의 한계를 보완하고, 365mc의 상담 특수성이 반영된 고정밀 화자 분리 및 텍스트 변환 파이프라인을 구축함으로써 상담 데이터 분석에 적합한 기반을 마련한다.

주제 1-1. 기존 STT 활용 환경의 한계 진단
  1. 상용 STT 도구(Clova Note 등) 사용 시 질문-답변 단일 화자 병합 및 짧은 겹침(Overlap) 구간에서의 화자 분리 오류 빈발 확인.
  2. '무한람스' 등 도메인 특화 용어의 오인식 및 표기 일관성 부족 문제 식별.
  3. IB 데이터 내 긴 공백, 잡담, 비상담성 노이즈 혼입으로 인한 분석 난이도 확인.
스크린샷_2025-12-26_오후_4.47_.43_(1)_.png
주제 1-2. 한국어 겹침 음성 합성 데이터 생성
  1. 데이터 부족 문제 해결을 위해 SparseKMix 알고리즘 기반의 한국어 겹침 음성 합성 데이터 자체 생성.
  2. Clean 음성 데이터(KSponSpeech)와 Noise 데이터(WHAM!)를 합성하고 인위적 겹침 구간을 생성하여 모델 학습용 고품질 데이터셋 확보.
주제 1-3. 화자분리 + STT 통합 파이프라인 구축
  1. 화자 분리(Speaker Diarization): MossFormer2 모델에 LoRA 튜닝을 적용하여 화자 분리 성능 고도화.
  2. STT 모델: Whisper large-v3 모델을 도입하여 고정밀 음성-텍스트 변환 구현
  3. LLM 후처리: GPT-4o-mini를 활용해 도메인 전문 용어를 교정하고, 대화 맥락을 고려하여 상담사와 고객 간 턴테이킹(Turn-taking) 정교화




주제 2. OB 상담 전환율 상승 전략 도출
OB(Outbound) 단계의 고객 메타데이터와 상담 음성/텍스트 데이터를 다각도로 분석하여, 고객의 니즈를 정확히 파악하고 내원(예약)으로 연결되는 핵심 소통 방식을 발굴한다.

주제 2-1. OB 고객 메타데이터 분석
  1. 기초 통계 및 전환율 Baseline을 수립하고, 고객 신체 정보 및 생활 습관과 전환율 간의 상관관계를 Chi-square test로 검증.
  2. 상담 신청 회차별 차이를 Mann-Whitney U test로 분석하여 고관여 고객 특성 정의.
  3. 변수 간 상호작용을 고려한 교호작용 로지스틱 회귀분석 수행.
주제 2-2. OB 상담사 음성 피처 분석
  1. 상담사의 음성적 특징(Tone, Speed, Silence ratio 등)이 전환 성패에 미치는 영향 분석.
  2. 전환 여부에 따른 피처별 유의미한 차이를 t-test 및 Mann-Whitney U test로 검증.
  3. 로지스틱 회귀분석을 통해 각 음성 피처가 전환 성공률에 미치는 영향력 정량화.
  4. ML 기반 전환 예측 모델 설계 및 SHAP 분석을 통한 변수의 비선형적 기여도 해석.
스크린샷_2025-12-26_오후_4.44_.14_(1)_.png
주제 2-3. OB 상담 STT 데이터 분석
  1. 상담 내용을 Topic(주제), Intent(의도), Flag(시그널) 단위로 태깅하여 데이터 구조화.
  2. Intent 분포 및 Flag별 상담사 대응 전략, 내원 제안 시점을 분석하여 Flag 기반의 고도화된 상담 전략 수립.
주제 2-4. OB 고객 메타데이터 + 상담 STT 연계 분석
  1. 고객 메타데이터와 부정 신호(Negative Flag) 발생 비중을 연계 분석하여 전환율 패턴 도출.
스크린샷_2025-12-26_오후_4.54_.02_(2)_.png


주제 3. IB 상담 전환율 상승 전략 도출
IB(Inbound) 단계에서 고객의 상태, 관심사, 질문 유형에 따라 고객이 보다 합리적인 시술/수술 판단을 내릴 수 있도록 지원하는 상담 전략 요소를 도출하고, 상담 품질과 고객 만족도를 함께 향상시킬 수 있는 방향을 제언한다.

주제 3-1. IB 고객 메타데이터 분석
  1. 고객에게 추가적인 가치를 제공할 수 있는 최적 시술 제안(Upselling)의 조작적 정의 수립.
  2. 병원 선택 요인 등 메타데이터 분석을 통해 맞춤형 제안이 가능한 타겟 고객군 식별.
주제 3-2. IB 상담 STT 데이터 분석
  1. SBERT 문장 임베딩 및 키워드 분석을 통해 고객 부정 시그널과 상담사 대응 유형을 분류하고, 로지스틱 회귀로 통계적 검증 수행.
  2. 향후 분석 정합성 제고를 위한 데이터 적재 프로세스 개선(잡담 제거, 녹음 구간 준수 등) 제언.

성과 및 인사이트

1. 상담 데이터 분석을 위한 고성능 STT 모델 개발
  1. SparseKMix 알고리즘을 활용한 한국어 겹침 음성 합성 파이프라인을 구축하여, 고품질 학습 데이터 부족 문제를 기술적으로 해결.
  2. 기존 솔루션 대비 획기적으로 개선된 STT 인식률(WER 감소) 및 고정밀 화자 분리 정확도(DER 감소) 확보.스크린샷_2025-12-26_오후_4.39_.15_(1)_.png
  3. 도메인 전문 용어 인식률을 극대화하고, 실제 상담의 맥락을 반영하여 자연스럽고 정확한 턴테이킹 복원 성공.


2. OB 상담 전환율 상승 전략 도출
  1. 관심 부위, 생활 습관 등 주요 변수가 전환율에 통계적으로 유의미한 영향을 미침을 검증하여 타겟팅 근거 마련.
  2. 상담 성공/실패를 결정짓는 핵심 음성 피처를 규명하고, ML 모델 검증을 통해 데이터 기반의 상담 품질 관리 포인트 발굴.
스크린샷_2025-12-26_오후_4.43_.38_(1)_.png
  1. 상담 중 예약 권유를 n회 이상 수행할 경우, 전환율이 약 00% 상승함을 데이터로 입증.
  2. 특정 주제(00) 언급 직후 예약을 제안할 경우 성공률이 통계적으로 00배 급감하는 패턴을 발견하여, 리스크 회피 시나리오 설계.
  3. 각 부정 Flag(거절 신호)별 심리적 장벽을 낮추는 Killer Keyword를 도출하고, 적용 시 전환율이 약 00%p 개선됨을 확인.

3. IB 상담 전환율 상승 전략 도출
  1. 시술 희망 부위, BMI, 직업군, 내원 결정 요인 등에 따라 고객 특성에 따른 차별화된 접근 전략 수립.
  2. 가격 저항, 부작용 우려 등 주요 거절 사유에 대해 맞춤형 대응 전략 적용 시 전환 성공률이 00배 증대됨을 확인.
  3. 차기 모델 고도화 및 지속적인 모니터링을 위한 IB 상담 녹음 표준 및 데이터 적재 가이드라인 수립.


PM 소회

 365mc와 프로젝트를 진행하며 좋았던 점은 무엇인가요?

  1. 의료 도메인은 보안과 개인정보 문제로 인해 외부 협업이나 학회 프로젝트가 제한적인 경우가 많은데, 그럼에도 불구하고 실제 현업 데이터를 기반으로 프로젝트를 진행할 수 있었다는 점이 매우 인상 깊었습니다. 단순히 실습이나 가상의 문제를 다루는 것이 아니라, 기업이 실제로 고민하고 있던 문제를 함께 정의하고 해결하는 과정에 참여할 수 있었던 점에서 큰 의미가 있었습니다.
  2. 또한, 대표이사님께서 데이터 기반 의사결정과 정량적 인사이트의 필요성에 대해 깊이 공감하고 계셨고, 프로젝트 전반에 걸쳐 방향성과 조언을 아끼지 않으신 덕분에, 분석 결과가 실무적으로 어떤 가치를 가질 수 있는지에 대해 더 넓은 시각을 가질 수 있었습니다.
  3. LLM과 GPU 활용이 핵심이었던 프로젝트 특성상 비용과 인프라가 중요한 요소였는데, 사측에서 이를 적극적으로 지원해 주신 덕분에 기술적으로 필요한 시도를 제약 없이 해볼 수 있었습니다. 그 결과 모델 개선과 데이터 생성 및 분석 과정을 빠르게 반복할 수 있었고, 실제 산업 환경에서 데이터 기반 의사결정이 어떻게 이루어지는지를 직접 체감할 수 있었습니다.

 프로젝트 진행 중 겪었던 가장 큰 어려움은 무엇이었나요? 이를 어떻게 해결했나요?
  1. 초기 데이터에서 키 값이 일관되지 않거나, 각 컬럼의 정의가 명확하지 않은 문제가 있었습니다. 이로 인해 데이터 구조를 이해하고 정리하는 데 예상보다 많은 시간이 소요되었고, 정합성을 확보하는 과정 자체가 하나의 중요한 작업이 되었습니다. 가능한 데이터 내에서 최대한 정합성을 확보하는 방향으로 협의하여 진행하였습니다.
  2. 프로젝트는 DA로 시작했지만, 실제로는 화자 분리와 STT 품질 개선 등 DS 영역에 가까운 선행 작업이 필수적이었습니다. 이 과정에 예상보다 많은 시간이 소요되며 분석 일정이 촉박해졌지만, 분석 파이프라인을 미리 구축하고 작업 범위의 우선순위를 조정하며 대응하고자 했습니다. 이를 통해 프로젝트 초기에 DA와 DS의 경계를 명확히 정의하고, 일정 관리를 체계적으로 하는 것이 중요하다는 점을 크게 느꼈습니다.

 이번 경험을 통해 어떤 인사이트나 역량을 얻으셨나요?

  1. 프로젝트를 시작할 당시에는 음성 데이터나 화자 분리와 같은 분야에 대한 지식이 거의 없는 상태였지만, 프로젝트를 진행하며 관련 개념과 모델 구조를 하나씩 학습할 수 있는 기회가 되었습니다. 단순히 결과를 사용하는 데 그치지 않고, 음성 데이터에서 어떤 특성이 중요한지, 화자 분리 모델이 어떤 한계를 가지는지를 이해하려 노력하면서 새로운 도메인에 접근하는 방식 자체를 배울 수 있었습니다. 이를 통해 낯선 분야에서도 문제를 단계적으로 분해하고 학습해 나가는 역량을 기를 수 있었다고 생각합니다.
  2. 이번 프로젝트를 통해 모델 성능 개선보다 더 중요한 것이, 분석이 가능한 상태의 데이터를 만드는 과정이라는 점을 깨달았습니다. 정답 데이터가 없는 상황에서 성능 기준을 어떻게 정의할지, 어디까지를 개선 목표로 삼을지는 기술적 문제이면서 동시에 PM의 판단이 필요한 영역이었습니다. 이를 통해 기술적 이해를 바탕으로 현실적인 제약과 분석 목표 사이에서 균형을 잡는 역량을 기를 수 있었습니다.

향후 유사한 프로젝트를 진행할 학회원들에게 전하고 싶은 조언이 있나요?
  1. 새로운 도메인을 다루는 프로젝트의 경우, 초기에는 낯설고 부담스럽게 느껴질 수 있습니다. 이때 프로젝트 매니저를 중심으로 도메인에 대한 기본적인 이해를 충분히 공유하고, 프로젝트를 본격적으로 시작하기 전에 관련 배경지식을 함께 학습하는 과정이 중요하다고 생각합니다. 이러한 준비 과정이 이후 의사결정을 훨씬 수월하게 만들고, 팀 전체의 몰입도 또한 높여준다는 점을 이번 프로젝트를 통해 느낄 수 있었습니다.
  2. 프로젝트 시작 단계에서 DA인지, DS인지, 혹은 그 중간인지 성격을 명확히 정의하는 것이 중요합니다. 또한 처음부터 완벽한 방법론을 찾기보다는, 실제 데이터의 상태를 빠르게 파악하고 그에 맞춰 전략을 유연하게 조정하는 태도가 필요하다고 느꼈습니다. 현실의 데이터는 교과서적인 가정과 다르게 움직이는 경우가 많기 때문에, 그 불완전함을 받아들이는 것이 프로젝트를 끝까지 완수하는 데 도움이 됩니다.