오류신고
해당 데이터에 오류가 발견되면 오류신고해주세요.
오류신고
- 데이터 정보
-
오류신고를 진행 하실 데이터 정보를 담은 표입니다. 제목(Main) 사전학습을 활용한 논문 QA (2022년 경진대회 우수상) 제목(Sub) 저자 이현제; 제공처 KISTI 기계학습 데이터 공유 활용 서비스 리포지터리 한국과학기술정보연구원
- 접수 정보
-
오류신고 접수 정보를 담은 표이며, 메일주소, 오류내용을 입력합니다. 아이디 오류신고 접수 정보를 담은 표이며, 메일주소, 오류내용을 입력합니다.오류 구분 - 개인정보 노출방지를 위해 개인정보 내용은 가급적 자제하여 주시기 바랍니다.
- 일방적인 욕설 및 부정적인 내용 작성시 원작자의 판단에 따라 신고자에게 피해가 발생할 수 있습니다. 깨끗하고 청렴한 서비스 문화를 위해 필요한 정보만 기재해주시면 감사하겠습니다.
-
2023
국내
공개
CC-BY-NC
Korean
사전학습을 활용한 논문 QA (2022년 경진대회 우수상)
이현제;
데이터 개요 : * 논문과 같은 고도의 전문 지식을 담고 있는 텍스트를 기계 독해하는 경우, 일반 텍스트에 비해 향상된 “이해”와 “추론” 능력이 필요함
* 따라서 위 능력을 향상시키기 위한 사전학습 방법을 제안하고, 이를 통해 과학기술분야 언어모델 KorSciBERT의 논문 QA Task에 대한 최대 성능을 도출하고자 함
1. TASK 1. SentenceOrder Prediction(SOP)
* 뒤바뀐 문장을 예측함으로써 지문의 문맥을 파악하는 능력을 학습
* 전체문장의 45~50%의 순서만 변경하도록 처리
2. TASK 2. Sentence Coherence Prediction(SCP)
* 문맥에 맞지 않는 문장을 예측함으로써 지문의 맥락을 파악하는 능력을 학습
3. TASK 3. Keyword Prediction
* 국내논문 QA 데이터셋에 주어진 Keyword를 예측하도록 하여 지문 이해도를 높임
* 경진대회 발표영상
※ 이 모델을 개발한 유나성팀은 2022 과학기술・공공 AI 데이터 분석활용 경진대회에서 국내 논문 QA 모델 개발에 참여하여 우수상(대전광역시 시장상)을 수상했습니다.
데이터 설명 : Sentence Order Prediction, Sentence Coherence Prediction, Keyword Prediction의 사전학습방법을 활용한 논문 QA 모델
* 따라서 위 능력을 향상시키기 위한 사전학습 방법을 제안하고, 이를 통해 과학기술분야 언어모델 KorSciBERT의 논문 QA Task에 대한 최대 성능을 도출하고자 함
1. TASK 1. SentenceOrder Prediction(SOP)
* 뒤바뀐 문장을 예측함으로써 지문의 문맥을 파악하는 능력을 학습
* 전체문장의 45~50%의 순서만 변경하도록 처리
2. TASK 2. Sentence Coherence Prediction(SCP)
* 문맥에 맞지 않는 문장을 예측함으로써 지문의 맥락을 파악하는 능력을 학습
3. TASK 3. Keyword Prediction
* 국내논문 QA 데이터셋에 주어진 Keyword를 예측하도록 하여 지문 이해도를 높임
* 경진대회 발표영상
※ 이 모델을 개발한 유나성팀은 2022 과학기술・공공 AI 데이터 분석활용 경진대회에서 국내 논문 QA 모델 개발에 참여하여 우수상(대전광역시 시장상)을 수상했습니다.
데이터 설명 : Sentence Order Prediction, Sentence Coherence Prediction, Keyword Prediction의 사전학습방법을 활용한 논문 QA 모델
데이터 생성 이력정보
특성 정보
- 주제분류 = 없음
특성정보는 제공처로부터 수집된 데이터이며, DataON에서 제공하는 이외의 정보를 담고 있습니다.
관련 과제/논문 정보
관련 과제/논문 정보는 데이터 등록자 또는 이용자가 추천한 정보가 제공됩니다.
- 유발연구데이터가 유발된 과제/논문 정보입니다.
- 관련연구데이터 생산에 참고된 관련 과제/논문 정보입니다.
원문정보
데이터를 소유한 기관으로 연결되며, 로그인이 필요할 수도 있습니다.