Natural Language Processing

NHN Cloud AI의 자연어처리 분야에서는 한국어처리를 위한 AI 모델들을 만드는 연구를 진행합니다. 

 

첫 번째로 시작한 연구는 Pretrained Language Model (PLM)을 만드는 일입니다. 

 

정답이 없는 대량의 한국어 데이터를 이용하여 한국어를 잘표현하는 PLM 모델을 만들면,

이후 PLM 모델을 이용하여 적은 양의 데이터로 다양한 테스크를 수행하는 모델을 만들 수 있습니다. 

 

 

두 번째는 General Chatbot 연구입니다 .

 

Genenral Chatbot 연구는 단순한 일상대화 뿐 아니라 아래와 같은 다양한 기능이 필요합니다. 

 

- Multi-Turn & History :  답변 생성시 이전 대화내용을 기억하고 반영하여 답변

- Knowledge Base: "대한 민국의 수도는 어디니?" 와 같이 지식이 필요한 질문에 대한 답변

- Persona : 일관성있는 어투로 답변 (반말/존댓말, 나이/성별/성격 등)

- Safety & Security : 비속어, 혐오발언, 개인정보 노출이 되지 않도록 답변

 

이밖에 자연어 처리가 필요한  문서요약, category 분류, 비속어 문장 구분등 다양한 응용에 대한 연구들을 진행하고 있습니다.