메인

오류신고

해당 데이터에 오류가 발견되면 오류신고해주세요.

오류신고

데이터 정보

오류신고를 진행 하실 데이터 정보를 담은 표입니다.
제목(Main)	사전학습을 활용한 논문 QA (2022년 경진대회 우수상)
제목(Sub)
저자	이현제;
제공처	KISTI 기계학습 데이터 공유 활용 서비스
리포지터리	한국과학기술정보연구원

접수 정보

오류신고 접수 정보를 담은 표이며, 메일주소, 오류내용을 입력합니다.
아이디
메일주소	오류신고 접수 정보를 담은 표이며, 메일주소, 오류내용을 입력합니다.
오류 구분
오류내용	개인정보 노출방지를 위해 개인정보 내용은 가급적 자제하여 주시기 바랍니다. 일방적인 욕설 및 부정적인 내용 작성시 원작자의 판단에 따라 신고자에게 피해가 발생할 수 있습니다. 깨끗하고 청렴한 서비스 문화를 위해 필요한 정보만 기재해주시면 감사하겠습니다.

접수하기

추천합니다 관심데이터

2023

국내

공개

CC-BY-NC

Korean

사전학습을 활용한 논문 QA (2022년 경진대회 우수상)

이현제;

데이터 개요 : * 논문과 같은 고도의 전문 지식을 담고 있는 텍스트를 기계 독해하는 경우, 일반 텍스트에 비해 향상된 “이해”와 “추론” 능력이 필요함
* 따라서 위 능력을 향상시키기 위한 사전학습 방법을 제안하고, 이를 통해 과학기술분야 언어모델 KorSciBERT의 논문 QA Task에 대한 최대 성능을 도출하고자 함

1. TASK 1. SentenceOrder Prediction(SOP)
* 뒤바뀐 문장을 예측함으로써 지문의 문맥을 파악하는 능력을 학습
* 전체문장의 45~50%의 순서만 변경하도록 처리
2. TASK 2. Sentence Coherence Prediction(SCP)
* 문맥에 맞지 않는 문장을 예측함으로써 지문의 맥락을 파악하는 능력을 학습
3. TASK 3. Keyword Prediction
* 국내논문 QA 데이터셋에 주어진 Keyword를 예측하도록 하여 지문 이해도를 높임

* 경진대회 발표영상

※ 이 모델을 개발한 유나성팀은 2022 과학기술・공공 AI 데이터 분석활용 경진대회에서 국내 논문 QA 모델 개발에 참여하여 우수상(대전광역시 시장상)을 수상했습니다.
데이터 설명 : Sentence Order Prediction, Sentence Coherence Prediction, Keyword Prediction의 사전학습방법을 활용한 논문 QA 모델

데이터 생성 이력정보

데이터등록일 : 2023-03-27

특성 정보

주제분류 = 없음

특성정보는 제공처로부터 수집된 데이터이며, DataON에서 제공하는 이외의 정보를 담고 있습니다.

데이터셋 의미 관계 정보

Reset

의미관계가 형성된 정보를 클릭하면 통합검색 결과로 이동합니다.

본 서비스는 크로미움(Chromium)기반의 브라우저에서만 제공됩니다.

원문정보

https://aida.kisti.re.kr/data/99b2ffe8-43e3-4a11-b889-e2cbb299acd9

데이터를 소유한 기관으로 연결되며, 로그인이 필요할 수도 있습니다.

92 조회수
12 다운로드수
추천수 0
공유수 0
인용횟수 0

제공처

리포지터리: 한국과학기술정보연구원

DOI: 10.23057/58

인용정보생성

자세히 보기 복사

라이센스: CC-BY-NC

공유하기

검색 연산자	기능	검색시 예
공백	두 개의 검색어(식)을 모두 포함하고 있는 문서 검색	(데이터 기술)
()	우선순위가 가장 높은 연산자	(정확 (데이터\|data))
\|	두 개의 검색어(식) 중 하나 이상 포함하고 있는문서 검색	(항공 \| 토양)
!	NOT 이후에 있는 검색어가 포함된 문서는 제외	(데이터 !연구)
*	검색어의 *란에 0개 이상의 임의의 문자가 포함된 문서 검색	data*
" "	따옴표 내의 구문과 완전히 일치하는 문서만 검색	"Transform"

사전학습을 활용한 논문 QA (2022년 경진대회 우수상)

데이터 생성 이력정보

특성 정보

데이터셋 의미 관계 정보

관련 과제/논문 정보

원문정보