포스트

[AI 말평 대회] 참여기 #1: 1주차(1) - 대회 소개와 목표

[AI 말평 대회] 참여기 #1: 1주차(1) - 대회 소개와 목표

AI 말평 대회 참여기 #1: 대회 소개와 목표

드디어 AI 말평 대회 참여기를 시작한다!
이번 포스트에서는 대회 소개와 내가 참여하게 된 계기, 목표와 진행 계획을 정리해본다.


1. 대회 소개

  • 대회명: 2025 한국어 어문 규범 기반 생성(RAG) (가 유형)
  • 주최: 국립국어원
  • 대회 링크: 공식 홈페이지

이번 대회는 한국어 어문 규범을 기반으로 한 자연어 생성 모델의 성능을 평가하는 대회다.

  • Task: 문장 교정, RAG 기반 QA, 규범 준수 문장 생성 등
  • 목표: 한국어 생성 AI 모델의 품질을 측정하고 발전시키는 것

🔹 과제 개요

‘한국어 어문 규범 기반 생성(RAG)’ 과제는
한국어 어문 규범 관련 질문에 대해 국어 지식을 참조하여 답변을 생성하는 것이 목표다.

  • 활용 데이터:
    • 국립국어원의 「글쓰기 첨삭 지원을 위한 기초 자료」
    • 검색 증강 생성(RAG)을 위한 국어 지식 자료 별도 제공
  • 입력: 문제(문장 선택형 또는 교정형)
  • 출력:
    1. 어문 규범에 맞는 정답 문장
    2. 정답 선택/교정 이유

예시 ① 선택형

문제
“가축을 기를 때에는 {먹이량/먹이양}을 조절해 주어야 한다.” 가운데 올바른 것을 선택하고, 그 이유를 설명하세요.

정답
“가축을 기를 때에는 먹이양을 조절해 주어야 한다.”가 옳다.
한 음절의 한자어는 앞말이 고유어나 외래어일 때는 독립적인 한 단어로 인식하여 두음 법칙을 적용하고, 앞말이 한자어일 때는 하나의 단어로 인정하지 않아 두음 법칙을 적용하지 않는다.
‘먹이’는 고유어이므로 ‘먹이양’이 맞는 말이다.


예시 ② 교정형

문제
“어서 쾌차하시길 바래요.”

정답
“어서 쾌차하시길 바라요.”가 옳다.
동사 ‘바라다’에 어미 ‘-아요’가 결합한 형태이므로 ‘바라요’로 표기해야 한다.
‘바램’, ‘바래요’, ‘바랬다’는 모두 비표준형이고 ‘바람’, ‘바라요’, ‘바랐다’가 표준형이다.


🔹 과제 정의

  • 목표:
    1. 어문 규범에 맞는 표현 선택
    2. 문장 교정 후 이유 설명
  • 참조 규범:
    • 한글 맞춤법
    • 표준어 사정 원칙
    • 문장 부호 규정
    • 외래어 표기법
  • 출력 형식:
    1
    
    {선택·교정 문장}이/가 옳다. {이유}
    

2. 참여 계기

ISNLP 오픈 튜토리얼을 수강하며

  • RNN, LSTM, Attention, Transformer, Pre-trained Model까지 실습
  • Hugging Face를 활용해 번역, 요약, 감정분류 모델 구현

하면서 “이제 실전에서 한번 써보고 싶다!”라는 생각이 강하게 들었다.

운 좋게도, 강의를 진행하는 분들이 좋게 봐주셔서
가천대학교 ISNLP Lab에서 튜토리얼 수강생 중 일부를 선발해
이번 대회(가 유형)에 참가하는 것에 팀원으로 함께할 기회를 얻게 되었다.


3. 이번 대회에서의 목표

이번 대회에서 내가 세운 목표는 크게 세 가지다. 아직 부족한 실력이지만 열심히 진행해보고자 한다.

  1. 실전 경험 쌓기
    • 튜토리얼에서 배운 지식을 실전 환경에 적용
    • 실제 평가 지표, 제출 프로세스 경험
  2. RAG 구조와 구현 공부
    • 기본적인 RAG에 대한 지식
    • 한국어 QA / 문법 교정형 RAG 파이프라인의 실제 구현
    • 기본적인 Hugging Face 사용법
  3. 포트폴리오 & 블로그 기록
    • 학습 과정과 문제 해결 과정을 블로그 시리즈로 기록
    • 추후 포트폴리오/면접에서 활용 가능하도록 정리

4. 진행 계획

일단 팀장님이 당분간은 추론 테스트를 통해 좋은 모델을 탐색하는 일을 하게 될거라고 하셨다. 그리고 기본적인 대회 평가 지표에 대한 이해가 필요하기에

  • EM
  • BLEURT
  • BERTScore
  • ROUGE-1

다음과 같은 평가 지표에 대한 개념과 실제 대회 채점 코드를 공부해야 한다고 말씀하셨다.

공식 평가 코드 참고

이 내용을 공부한 후 블로그에 정리할 예정이다.


다음 포스트에서는 말평 1주차: 평가 지표 공부 과정을 다룰 예정이다.

이 기사는 저작권자의 CC BY 4.0 라이센스를 따릅니다.