Study Notes

홈
카테고리
태그
아카이브
정보

홈 태그 Reinforcement-Learning

태그

Reinforcement-Learning 2

[AI 말평 대회] 참여기 #10: 3주차(2) - GRPO 기반 강화학습과 DeepSeek의 사례 2025/07/23
[AI 말평 대회] 참여기 #9: 3주차(1) - 커스텀 듀얼 인코더 파인튜닝과 전략 전환 2025/07/21

최근 업데이트

[동아리 강의 후기] 1편, 선형회귀: 개념과 실습
[Poke-LLM] 1편: LLM 포켓몬 트레이너 만들기 프로젝트 시작과 첫번째 테스트
[한국 전통주 RAG] 3편: 데이터 전처리와 정리
[한국 전통주 RAG] 5편: 후기와 데모 시연
[한국 전통주 RAG] 2편: 데이터 크롤링과 파싱

인기 태그

RAG NLP 말평대회 HuggingFace KoreanLiquor AI Dataset GRPO LLM PyTorch

© 2025 한재욱. 일부 권리 보유

Powered by Jekyll with Chirpy theme

인기 태그

RAG NLP 말평대회 HuggingFace KoreanLiquor AI Dataset GRPO LLM PyTorch

새 버전의 콘텐츠를 사용할 수 있습니다.