Mentos

1. 프로젝트 배경 및 목표

배경

현대 사회에서 스트레스와 정신적 고민은 누구나 겪을 수 있는 일상적인 문제가 되었습니다.

이러한 문제를 해결하기 위해 많은 사람들이 심리 상담을 찾지만, 시간과 비용, 접근성 문제, 사회적 편견 등으로 인해 실제 상담을 받는 게 쉽지 않은 경우가 많습니다.

위 문제들을 해결하기 위해 심리상담 챗봇 서비스가 시행되고 있습니다.

그러나 사람들 개성과 상황에 따라 선호하는 소통 방식이 다르기 때문에 다소 말투가 차갑게 느껴질 수 있고, 사용자는 상담 말투에 따라 만족도나 개선 효과가 달라질 수 있습니다.

실제 심리 상담에서도 이러한 개인의 선호를 반영하여 상담을 진행함에 따라 만족도나 개선 효과가 달라지는 것처럼 말이죠

목표

위와 같은 문제를 해결하고자 저희 Mentos는 다양한 말투를 사용하여 사용자에게 맞춤형 상담을 제공하는 심리상담 챗봇 을 주제로 프로젝트를 진행하였습니다.

2. 서비스 Flow & ERD

user (사용자 정보 테이블)

user_id : 아이디
password : 비밀번호
name : 유저 이름
dt_birth : 유저 생년월일
gender : 유저 성별
language : 유저 사용 언어

dialog (사용자 사용내역 저장 테이블)

dialog_id : 대화 아이디
counsel_id : counsel 테이블 id
dt_dialog : 대화 날짜
u_message : 입력값
ai_message : 모델 출력값
dialog_emotion : 대화 문장 감성분석 모델 출력 값
past_dialog : 과거 대화
change_dialog : 어투 적용된 대화 내역

counsel (사용자 채팅방 단위 정보 테이블)

counsel_id : 채팅 아이디
character_id : character 테이블 id
user_id : user 테이블 id
dt_start : 채팅 시작 날짜
dt_end : 채팅 종료 날짜

emotion_log (채팅방 전체 감정 흐름분석 테이블)

emotion_id : 감정분석 아이디
counsel_id : counsel 테이블 id
counsel_emotion : 채팅방 감정분석 값
dt_emotion_log : 감정 log 값

character (어투 캐릭터 정보 테이블)

character_id : 어투 캐릭터 아이디
character_name : 어투 캐릭터 이름
character_model : 어투 캐릭터 모델

3. 프로젝트 일정

4. 프로젝트 구성 및 담당자

홍성균

개발 환경 설정
- GCP, AWS 등 GPU사용 환경 설정
모델 선정 및 분석
- meta-llama/Meta-Llama-3-8B-Instruct
- microsoft/Phi-3-mini-4k-instruct
- yanolja/EEVE-Korean-Instruct-10.8B-v1.0
huggingface trl 라이브러리 활용하여 SFT, DPO 진행
- 하이퍼 파라미터를 다양하게 설정하여 모델 출력 비교 분석
- DPO 관련 데이터셋 준비 (naver-clovaX활용) 후 DPO 실시

박태은

데이터분석 및 시각화
- Pandas 라이브러리를 활용하여 데이터 전처리 및 분석
- matplotlib, seaborn, plotly를 활용한 데이터 시각화 작업 수행
모델에 입력 데이터 문장에 대한 감성분석 수행
- Hugging Face - nlp04/korean_sentiment_analysis_kcelectra를 활용하여 입력 문장에 대한 감정 레이블링
데이터베이스 설계
- 사용자 입력 문장 및 시스템 출력 문장에 대한 대화 데이터 저장 및 관리를 위해 MySQL을 활용하여 테이블 설계

이희성

모델 학습 데이터 선정 및 Alpaca format으로 변환
- Smoked-Salmon-s/empathetic_dialogues_ko
- uine/single-practice-dataset
모델 선정 및 분석
- nlpai-lab/KULLM3
- yanolja/EEVE-Korean-Instruct-10.8B-v1.0
모델 학습(SFT, DPO)파이프라인 구축
- 추론 및 학습 코드 작성
전체 모델 연결 및 추론 파이프라인 구축
- kcelectra, kobart, LLM
백엔드 구축 및 Gradio 구현
- FastAPI 코드 작성

이현지

데이터베이스 설계 및 구현
- AWS RDS를 활용한 MySQL 데이터베이스 설계 및 구현.
- pymysql 라이브러리를 사용하여 데이터베이스 연결 및 데이터 흐름 검증.
데이터 수집
- selenium을 이용하여 웹 사이트 데이터 정보 크롤링 및 스크랩핑.
데이터 분석 및 시각화
- pandas를 이용한 데이터 전처리 및 분석, matplotlib 및 seaborn을 사용한 통계적 데이터 시각화, plotly를 활용한 인터랙티브 데이터 시각화 작업 수행.

5. 사용 툴

Category	Techs
🖥️ 개발
☁️ 환경
📋 협업

6. 데이터 셋

uine/single-practice-dataset

원본 데이터인 Smoked-Salmon-s/empathetic_dialogues_ko에서 single turn 데이터만 정제
약 8천개 학습 데이터 셋 사용

7. 모델학습 및 기능구현 flow

1. project에 사용할 모델 분석 및 선정

meta-llama/Meta-Llama-3-8B-Instruct
microsoft/Phi-3-mini-4k-instruct
yanolja/EEVE-Korean-Instruct-10.8B-v1.0
=>세 모델 중에서 실용적 측면 및 이미 한국어 단어장이 추가 된 EEVE 모델을 프로젝트 모델로 선정

2. HuggingFace의 trl 라이브러리를 활용한 SFT 진행

Smoked-Salmon-s/empathetic_dialogues_ko 데이터 활용하여 singgleturn으로 SFT 학습 진행
진행시 다양한 하이퍼 파라미터를 선정하여 출력을 비교

3. HuggingFace의 trl 라이브러리를 활용한 DPO 진행

Naver ClovaX를 활용하여 DPO의 chosen과 rejected 칼럼을 생성(약 1만개)
해당 chosen, rejected 데이터를 활용하여 DPO 진행

4. LangChain을 활용하여 RAG 구현

허깅페이스의 HuggingFaceEmbeddings, 랭체인의 VectorStore, FAISS 등등 활용하여
RAG를 구현하고 해당 RAG를 프로젝트 모델에 적용시켜 멀티턴을 구현

5. 최종 모델 평가 및 실제 인퍼런스용 모델 선정

G-eval 및 실제 사용 후기를 통한 성능 평가 진행

6. inference

FastAPI 및 Gradio를 활용하여 모듈화 및 실제 시연 준비
구체적인 UI 및 유저 편의성 고려하여 조정

8. 결과

1. huggingface를 통해 SFTtrainer로 파인튜닝 실시

실제 input으로 들어가는 데이터가 fine-tuning format에 맞춰 변환된 모습
실제 Fine-tuning 학습곡선

2. 여러 하이퍼 파라미터로 fine-tuning 후에 실제 변화된 출력 예시

기존 임의로 설정한 값 보다 하이퍼 파라미터 튜닝을 통해 얻은 출력이 더 양호하다고 판단됨.

3. 팀원 투표를 거쳐 여러 하이퍼 파라미터 튜닝 모델 후보군 중에서 최종 모델 선정

peft_config의 r, training_argumnets의 epoch, batch_size, optim, weight_decay, lr_scheduler_type 등을 하나씩 수정하여
결과 값에 긍정적인 영향을 주는 파라미터에 관한 분석을 마친 후 여러 조합으로 얻어낸 하이퍼 파라미터 튜닝 모델 5개중
하나의 모델을 프로젝트에서 사용할 모델로 선정

4. 최종 선정 모델에 관한 huggingface 라이브러리를 통한 DPO 진행

DPO에 사용되는 데이터셋
실제 학습이 진행되는 모습 (rejected와 chosen에 대한 reward값의 차이)

5. DPO 결과에 대한 분석 및 실제 적용되는 말투에 추가(전문가 말투)

'자존감'에 관한 질문에 단순히 단어를 반복하는 것이 아닌 관계된 매우 유의미한 단어인 '자기효능감'까지 출력

6. 실제 gradio를 통해 시연되는 모습

7. 프로젝트를 마치며(feedback)

Name		Name	Last commit message	Last commit date
Latest commit History 44 Commits
backend		backend
finetuning		finetuning
frontend		frontend
.gitignore		.gitignore
README.md		README.md
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Mentos

1. 프로젝트 배경 및 목표

배경

목표