제품 품질 계층적 카테고리 구조를 고려한 고객 클레임 분류 알고리즘 개발
페이지 정보

조회 711회 작성일 24-01-31 17:04
본문
| 지원기관 | 신성 E&G(신성-성균관대학교 AI 솔루션 연구센터) |
|---|---|
| 역할 | 세부과제 연구책임자 |
| 주제구분 | Production |
연구기간: 2022.09 - 2023.08
1. 연구배경
고객의 소리(VOC)를 체계적으로 수집하고 분석하는 것은 서비스 품질 향상과 사후 품질보증 전략 수립의 핵심 수단이다. 특히 제조·서비스 기업에서는 수집된 고객 클레임을 활용해 결함을 조기에 식별하고, 개선 우선 순위를 설정하며, 자원을 효율적으로 배분할 수 있다. 그러나 고객 클레임은 데이터가 비교적 적고, 표현 방식이 비정형적이며, 세부 유형이 다양하다는 특성을 갖는다. 이를 정확히 분류하지 못하면 문제 진단 및 해결 과정이 지연될 뿐 아니라 품질 개선을 위한 투자가 비효율적으로 이루어질 수 있다는 위험이 존재한다.
다양한 기업에서는 여전히 작업자 중심의 주관적 분류 방식이 사용되고 있다. 문제는 같은 내용의 고객 클레임이라도 고객 또는 접수자의 자유로운 서술로 인해 서로 다른 언어로 표현되거나, 엔지니어의 경험적 판단에 의존하기 때문에 개인적 해석에 따라 상이한 유형으로 기록되는 사례가 많이 발생한다는 것이다. 이러한 한계를 극복하고자, 본 연구에서는 계층적 카테고리 구조를 고려한 자동화된 고객 클레임 분류 알고리즘을 개발하는 것을 목표로 한다.
2. 연구내용
본 연구에서는 두 계층으로 이루어진 고객 클레임 유형을 분류하기 위해 세 가지 과정을 거친다.
첫 번째 단계는 전처리와 증강 단계이다. 고객 클레임은 그 표현이 모호하거나 같은 내용도 다르게 표현된 경우가 많아 데이터 품질이 낮기 때문에, 일관된 기준을 수립해 각 데이터에 대한 전처리를 진행하였다. 이후 유형별 표본 수가 극히 적은 경우를 완화하기 위해 같은 내용 또는 데이터 내의 몇 단어를 제거·수정한 내용으로 증강하였다. 이렇게 수집된 데이터셋에 분류 모델을 적용하기 위해 DTM과 TF-IDF를 활용해 텍스트의 벡터화를 진행하였다.
두 번째 단계에서는 상위 계층의 유형인 supercategory를 분류했으며, 그 방법으로 머신러닝과 딥러닝의 대표 모델을 적용해 성능을 비교하였다.
마지막으로, 세 번째 단계에서는 하위 계층의 유형인 subcategory를 분류하였다. Supercategory가 확정된 데이터 집합 내부에서 텍스트 유사도 기반 최근접 이웃 방식으로 subcategory를 결정하였다.
본 연구의 분류 전략은 단계별로 적합한 분류 모델 적용을 통한 높은 분류 성능을 도출하고, 희소 데이터 환경에서도 일관된 분류를 가능하게 하였으며, 엔지니어 교체 또는 경험 편차에 따른 오분류를 줄일 수 있다는 데에 의의가 있다.
- 이전글OHT 감지 및 진단 모델 개발 24.01.31
- 다음글H형강 압연시 기계학습 기반의 스톡 단면 형상 및 변형 거동 예측 모델 개발 24.01.31