- 대다수의 모델은 영어만을 다루고 있고, 만약 한국어를 지원하더라도 단독 모델이 아니라 다국어 버전을 통해 지원하는 경우가 많습니다.
- 그렇기에 한국어만을 위한 모델을 학습하였습니다.
- 모델은 주로 jax/flax를 이용하여 구현 및 학습되었으며, 그 후 pytorch로 변환되었습니다.
- 2023-02-27: whisper, t5 모델 추가
Model | Size | Link |
---|---|---|
whisper-tiny | 39 M | link |
whisper-small | 244 M | link |
t5 v1.1 small | 77 M | link |
t5 v1.1 base | 250 M | link |
from transformers import WhisperProcessor, WhisperForConditionalGeneration
processor = WhisperProcessor.from_pretrained("hyunwoo3235/whisper-tiny.ko")
model = WhisperForConditionalGeneration.from_pretrained("hyunwoo3235/whisper-tiny.ko")
from transformers import T5Tokenizer, T5ForConditionalGeneration
tokenizer = T5Tokenizer.from_pretrained("hyunwoo3235/t5-v1_1-base-ko")
model = T5ForConditionalGeneration.from_pretrained("hyunwoo3235/t5-v1_1-base-ko")
- Research supported with Cloud TPUs from Google's TPU Research Cloud (TRC)