Skip to content

Latest commit

 

History

History
264 lines (160 loc) · 11.2 KB

README.md

File metadata and controls

264 lines (160 loc) · 11.2 KB

Mentos

1. 프로젝트 배경 및 목표

배경

​ 현대 사회에서 스트레스와 정신적 고민은 누구나 겪을 수 있는 일상적인 문제가 되었습니다.

​ 이러한 문제를 해결하기 위해 많은 사람들이 심리 상담을 찾지만, 시간과 비용, 접근성 문제, 사회적 편견 등으로 인해 실제 상담을 받는 게 쉽지 않은 경우가 많습니다.

​ 위 문제들을 해결하기 위해 심리상담 챗봇 서비스가 시행되고 있습니다.

​ 그러나 사람들 개성과 상황에 따라 선호하는 소통 방식이 다르기 때문에 다소 말투가 차갑게 느껴질 수 있고, 사용자는 상담 말투에 따라 만족도나 개선 효과가 달라질 수 있습니다.

​ 실제 심리 상담에서도 이러한 개인의 선호를 반영하여 상담을 진행함에 따라 만족도나 개선 효과가 달라지는 것처럼 말이죠

목표

​ 위와 같은 문제를 해결하고자 저희 Mentos는 다양한 말투를 사용하여 사용자에게 맞춤형 상담을 제공하는 심리상담 챗봇 을 주제로 프로젝트를 진행하였습니다.

2. 서비스 Flow & ERD

mentos-flow-1

mentalcare-erd-6

user (사용자 정보 테이블)

  • user_id : 아이디
  • password : 비밀번호
  • name : 유저 이름
  • dt_birth : 유저 생년월일
  • gender : 유저 성별
  • language : 유저 사용 언어

dialog (사용자 사용내역 저장 테이블)

  • dialog_id : 대화 아이디
  • counsel_id : counsel 테이블 id
  • dt_dialog : 대화 날짜
  • u_message : 입력값
  • ai_message : 모델 출력값
  • dialog_emotion : 대화 문장 감성분석 모델 출력 값
  • past_dialog : 과거 대화
  • change_dialog : 어투 적용된 대화 내역

counsel (사용자 채팅방 단위 정보 테이블)

  • counsel_id : 채팅 아이디
  • character_id : character 테이블 id
  • user_id : user 테이블 id
  • dt_start : 채팅 시작 날짜
  • dt_end : 채팅 종료 날짜

emotion_log (채팅방 전체 감정 흐름분석 테이블)

  • emotion_id : 감정분석 아이디
  • counsel_id : counsel 테이블 id
  • counsel_emotion : 채팅방 감정분석 값
  • dt_emotion_log : 감정 log 값

character (어투 캐릭터 정보 테이블)

  • character_id : 어투 캐릭터 아이디
  • character_name : 어투 캐릭터 이름
  • character_model : 어투 캐릭터 모델

3. 프로젝트 일정

4. 프로젝트 구성 및 담당자

홍성균

Kakao-Talk-20240510-182343911

  1. 개발 환경 설정

    • GCP, AWS 등 GPU사용 환경 설정
  2. 모델 선정 및 분석

    • meta-llama/Meta-Llama-3-8B-Instruct
    • microsoft/Phi-3-mini-4k-instruct
    • yanolja/EEVE-Korean-Instruct-10.8B-v1.0
  3. huggingface trl 라이브러리 활용하여 SFT, DPO 진행

    • 하이퍼 파라미터를 다양하게 설정하여 모델 출력 비교 분석
    • DPO 관련 데이터셋 준비 (naver-clovaX활용) 후 DPO 실시

박태은

  1. 데이터분석 및 시각화

    • Pandas 라이브러리를 활용하여 데이터 전처리 및 분석
    • matplotlib, seaborn, plotly를 활용한 데이터 시각화 작업 수행
  2. 모델에 입력 데이터 문장에 대한 감성분석 수행

    • Hugging Face - nlp04/korean_sentiment_analysis_kcelectra를 활용하여 입력 문장에 대한 감정 레이블링
  3. 데이터베이스 설계

    • 사용자 입력 문장 및 시스템 출력 문장에 대한 대화 데이터 저장 및 관리를 위해 MySQL을 활용하여 테이블 설계

이희성

image

  1. 모델 학습 데이터 선정 및 Alpaca format으로 변환

    • Smoked-Salmon-s/empathetic_dialogues_ko
    • uine/single-practice-dataset
  2. 모델 선정 및 분석

    • nlpai-lab/KULLM3
    • yanolja/EEVE-Korean-Instruct-10.8B-v1.0
  3. 모델 학습(SFT, DPO)파이프라인 구축

    • 추론 및 학습 코드 작성
  4. 전체 모델 연결 및 추론 파이프라인 구축

    • kcelectra, kobart, LLM
  5. 백엔드 구축 및 Gradio 구현

    • FastAPI 코드 작성

이현지

image

  1. 데이터베이스 설계 및 구현
    • AWS RDS를 활용한 MySQL 데이터베이스 설계 및 구현.
    • pymysql 라이브러리를 사용하여 데이터베이스 연결 및 데이터 흐름 검증.
  2. 데이터 수집
    • selenium을 이용하여 웹 사이트 데이터 정보 크롤링 및 스크랩핑.
  3. 데이터 분석 및 시각화
    • pandas를 이용한 데이터 전처리 및 분석, matplotlib 및 seaborn을 사용한 통계적 데이터 시각화, plotly를 활용한 인터랙티브 데이터 시각화 작업 수행.

5. 사용 툴

Category Techs
🖥️ 개발 Python PyTorch Jupyter Notebook OpenAI FastAPI VisualStudioCode MYSQL
☁️ 환경 nVIDIA Anaconda Ubuntu AWS
📋 협업 Notion Git GitHub GitHub

6. 데이터 셋

uine/single-practice-dataset

uine/single-practice-dataset

  • 원본 데이터인 Smoked-Salmon-s/empathetic_dialogues_ko에서 single turn 데이터만 정제
  • 약 8천개 학습 데이터 셋 사용

7. 모델학습 및 기능구현 flow

1. project에 사용할 모델 분석 및 선정

  1. meta-llama/Meta-Llama-3-8B-Instruct
  2. microsoft/Phi-3-mini-4k-instruct
  3. yanolja/EEVE-Korean-Instruct-10.8B-v1.0
    =>세 모델 중에서 실용적 측면 및 이미 한국어 단어장이 추가 된 EEVE 모델을 프로젝트 모델로 선정

2. HuggingFace의 trl 라이브러리를 활용한 SFT 진행

  • Smoked-Salmon-s/empathetic_dialogues_ko 데이터 활용하여 singgleturn으로 SFT 학습 진행
  • 진행시 다양한 하이퍼 파라미터를 선정하여 출력을 비교

3. HuggingFace의 trl 라이브러리를 활용한 DPO 진행

  • Naver ClovaX를 활용하여 DPO의 chosen과 rejected 칼럼을 생성(약 1만개)
  • 해당 chosen, rejected 데이터를 활용하여 DPO 진행

4. LangChain을 활용하여 RAG 구현

  • 허깅페이스의 HuggingFaceEmbeddings, 랭체인의 VectorStore, FAISS 등등 활용하여
  • RAG를 구현하고 해당 RAG를 프로젝트 모델에 적용시켜 멀티턴을 구현

5. 최종 모델 평가 및 실제 인퍼런스용 모델 선정

  • G-eval 및 실제 사용 후기를 통한 성능 평가 진행

6. inference

  • FastAPI 및 Gradio를 활용하여 모듈화 및 실제 시연 준비
  • 구체적인 UI 및 유저 편의성 고려하여 조정

8. 결과

1. huggingface를 통해 SFTtrainer로 파인튜닝 실시

  • 실제 input으로 들어가는 데이터가 fine-tuning format에 맞춰 변환된 모습 1

  • 실제 Fine-tuning 학습곡선 2



2. 여러 하이퍼 파라미터로 fine-tuning 후에 실제 변화된 출력 예시

  • 기존 임의로 설정한 값 보다 하이퍼 파라미터 튜닝을 통해 얻은 출력이 더 양호하다고 판단됨. 3



3. 팀원 투표를 거쳐 여러 하이퍼 파라미터 튜닝 모델 후보군 중에서 최종 모델 선정

  • peft_config의 r, training_argumnets의 epoch, batch_size, optim, weight_decay, lr_scheduler_type 등을 하나씩 수정하여
  • 결과 값에 긍정적인 영향을 주는 파라미터에 관한 분석을 마친 후 여러 조합으로 얻어낸 하이퍼 파라미터 튜닝 모델 5개중
  • 하나의 모델을 프로젝트에서 사용할 모델로 선정 4



4. 최종 선정 모델에 관한 huggingface 라이브러리를 통한 DPO 진행

  • DPO에 사용되는 데이터셋 5

  • 실제 학습이 진행되는 모습 (rejected와 chosen에 대한 reward값의 차이) 6



5. DPO 결과에 대한 분석 및 실제 적용되는 말투에 추가(전문가 말투)

  • '자존감'에 관한 질문에 단순히 단어를 반복하는 것이 아닌 관계된 매우 유의미한 단어인 '자기효능감'까지 출력 7



6. 실제 gradio를 통해 시연되는 모습
8



7. 프로젝트를 마치며(feedback)
9