1. 데이터셋 수집

1-1 데이터셋 형태

1-2 데이터셋 양: 위와 같은 데이터를 총 10시간 이상 수집 (음성 기준)

1-3 필수 사안

2. TTS 모델 구축

2-1 TTS 모델 학습

2-2 제공할 인공지능 모델형태