[AI 말평 대회] 참여기 #1: 1주차(1) - 대회 소개와 목표
AI 말평 대회 참여기 #1: 대회 소개와 목표
드디어 AI 말평 대회 참여기를 시작한다!
이번 포스트에서는 대회 소개와 내가 참여하게 된 계기, 목표와 진행 계획을 정리해본다.
1. 대회 소개
- 대회명: 2025 한국어 어문 규범 기반 생성(RAG) (가 유형)
- 주최: 국립국어원
- 대회 링크: 공식 홈페이지
이번 대회는 한국어 어문 규범을 기반으로 한 자연어 생성 모델의 성능을 평가하는 대회다.
- Task: 문장 교정, RAG 기반 QA, 규범 준수 문장 생성 등
- 목표: 한국어 생성 AI 모델의 품질을 측정하고 발전시키는 것
🔹 과제 개요
‘한국어 어문 규범 기반 생성(RAG)’ 과제는
한국어 어문 규범 관련 질문에 대해 국어 지식을 참조하여 답변을 생성하는 것이 목표다.
- 활용 데이터:
- 국립국어원의 「글쓰기 첨삭 지원을 위한 기초 자료」
- 검색 증강 생성(RAG)을 위한 국어 지식 자료 별도 제공
- 입력: 문제(문장 선택형 또는 교정형)
- 출력:
- 어문 규범에 맞는 정답 문장
- 정답 선택/교정 이유
예시 ① 선택형
문제
“가축을 기를 때에는 {먹이량/먹이양}을 조절해 주어야 한다.” 가운데 올바른 것을 선택하고, 그 이유를 설명하세요.정답
“가축을 기를 때에는 먹이양을 조절해 주어야 한다.”가 옳다.
한 음절의 한자어는 앞말이 고유어나 외래어일 때는 독립적인 한 단어로 인식하여 두음 법칙을 적용하고, 앞말이 한자어일 때는 하나의 단어로 인정하지 않아 두음 법칙을 적용하지 않는다.
‘먹이’는 고유어이므로 ‘먹이양’이 맞는 말이다.
예시 ② 교정형
문제
“어서 쾌차하시길 바래요.”정답
“어서 쾌차하시길 바라요.”가 옳다.
동사 ‘바라다’에 어미 ‘-아요’가 결합한 형태이므로 ‘바라요’로 표기해야 한다.
‘바램’, ‘바래요’, ‘바랬다’는 모두 비표준형이고 ‘바람’, ‘바라요’, ‘바랐다’가 표준형이다.
🔹 과제 정의
- 목표:
- 어문 규범에 맞는 표현 선택
- 문장 교정 후 이유 설명
- 참조 규범:
- 한글 맞춤법
- 표준어 사정 원칙
- 문장 부호 규정
- 외래어 표기법
- 출력 형식:
1
{선택·교정 문장}이/가 옳다. {이유}
2. 참여 계기
ISNLP 오픈 튜토리얼을 수강하며
- RNN, LSTM, Attention, Transformer, Pre-trained Model까지 실습
- Hugging Face를 활용해 번역, 요약, 감정분류 모델 구현
하면서 “이제 실전에서 한번 써보고 싶다!”라는 생각이 강하게 들었다.
운 좋게도, 강의를 진행하는 분들이 좋게 봐주셔서
가천대학교 ISNLP Lab에서 튜토리얼 수강생 중 일부를 선발해
이번 대회(가 유형)에 참가하는 것에 팀원으로 함께할 기회를 얻게 되었다.
3. 이번 대회에서의 목표
이번 대회에서 내가 세운 목표는 크게 세 가지다. 아직 부족한 실력이지만 열심히 진행해보고자 한다.
- 실전 경험 쌓기
- 튜토리얼에서 배운 지식을 실전 환경에 적용
- 실제 평가 지표, 제출 프로세스 경험
- RAG 구조와 구현 공부
- 기본적인 RAG에 대한 지식
- 한국어 QA / 문법 교정형 RAG 파이프라인의 실제 구현
- 기본적인 Hugging Face 사용법
- 포트폴리오 & 블로그 기록
- 학습 과정과 문제 해결 과정을 블로그 시리즈로 기록
- 추후 포트폴리오/면접에서 활용 가능하도록 정리
4. 진행 계획
일단 팀장님이 당분간은 추론 테스트를 통해 좋은 모델을 탐색하는 일을 하게 될거라고 하셨다. 그리고 기본적인 대회 평가 지표에 대한 이해가 필요하기에
- EM
- BLEURT
- BERTScore
- ROUGE-1
다음과 같은 평가 지표에 대한 개념과 실제 대회 채점 코드를 공부해야 한다고 말씀하셨다.
이 내용을 공부한 후 블로그에 정리할 예정이다.
다음 포스트에서는 말평 1주차: 평가 지표 공부 과정을 다룰 예정이다.