오류신고
해당 데이터에 오류가 발견되면 오류신고해주세요.
오류신고
- 데이터 정보
-
오류신고를 진행 하실 데이터 정보를 담은 표입니다. 제목(Main) 계층적 표현 및 손실함수와 레이블 임베딩을 활용한 논문 문장 의미 분류 모델 (2022년 경진대회 장려상) 제목(Sub) 저자 윤세휘; 제공처 KISTI 기계학습 데이터 공유 활용 서비스 리포지터리 한국과학기술정보연구원
- 접수 정보
-
오류신고 접수 정보를 담은 표이며, 메일주소, 오류내용을 입력합니다. 아이디 오류신고 접수 정보를 담은 표이며, 메일주소, 오류내용을 입력합니다.오류 구분 - 개인정보 노출방지를 위해 개인정보 내용은 가급적 자제하여 주시기 바랍니다.
- 일방적인 욕설 및 부정적인 내용 작성시 원작자의 판단에 따라 신고자에게 피해가 발생할 수 있습니다. 깨끗하고 청렴한 서비스 문화를 위해 필요한 정보만 기재해주시면 감사하겠습니다.
-
2023
국내
공개
CC-BY-NC
Korean
계층적 표현 및 손실함수와 레이블 임베딩을 활용한 논문 문장 의미 분류 모델 (2022년 경진대회 장려상)
윤세휘;
데이터 개요 : * 실세계의 데이터는 대부분 계층형 분류 체계를 가지며 카테고리간 데이터 불균형이 존재함
* 하위 카테고리만 고려하는 플랫 분류에 대한 연구는 많이 이루어지고 있지만 불균형 데이터에 대해 낮은 정확도를 보이는 경향이 있음
* 반면 데이터 불균형 문제를 완화할 수 있는 계층적 분류 연구는 활발하지 않음
* 따라서 본 연구에서는 논문 문장 의미 분류 문제를 해결하기 위해 계층 정보를 명시적으로 활용하기 위한 계층적 표현 및 손실함수를 사용한 기존 연구를 응용하며, 특징 기반 기법을 적용한 계층적 레이블 임베딩을 사용한 국내 논문 문장 의미 분류 모델을 제안함
* 추가적으로 문장이 포함되는 논문의 섹션명을 위치 정보 임베딩으로 사용함
* KISTI의 국내 논문 문장 의미 태깅 데이터셋에 대한 실험을 통해 계층 구조를 반영한 손실 함수를 사용했을 경우와 위치 정보를 사용했을 경우 모두 F1 점수 기준 성능이 모두 향상되었음.
* 경진대회 발표영상
※ 이 모델을 개발한 INU_DILAB팀은 2022 과학기술・공공 AI 데이터 분석활용 경진대회에서 국내 논문 문장 의미 태깅 모델 개발에 참여하여 장려상(국회도서관 관장상)을 수상했습니다.
데이터 설명 : 논문에서 문장 위치 정보와 계층적 손실함수를 사용하여 모델 성능 개선
* 하위 카테고리만 고려하는 플랫 분류에 대한 연구는 많이 이루어지고 있지만 불균형 데이터에 대해 낮은 정확도를 보이는 경향이 있음
* 반면 데이터 불균형 문제를 완화할 수 있는 계층적 분류 연구는 활발하지 않음
* 따라서 본 연구에서는 논문 문장 의미 분류 문제를 해결하기 위해 계층 정보를 명시적으로 활용하기 위한 계층적 표현 및 손실함수를 사용한 기존 연구를 응용하며, 특징 기반 기법을 적용한 계층적 레이블 임베딩을 사용한 국내 논문 문장 의미 분류 모델을 제안함
* 추가적으로 문장이 포함되는 논문의 섹션명을 위치 정보 임베딩으로 사용함
* KISTI의 국내 논문 문장 의미 태깅 데이터셋에 대한 실험을 통해 계층 구조를 반영한 손실 함수를 사용했을 경우와 위치 정보를 사용했을 경우 모두 F1 점수 기준 성능이 모두 향상되었음.
* 경진대회 발표영상
※ 이 모델을 개발한 INU_DILAB팀은 2022 과학기술・공공 AI 데이터 분석활용 경진대회에서 국내 논문 문장 의미 태깅 모델 개발에 참여하여 장려상(국회도서관 관장상)을 수상했습니다.
데이터 설명 : 논문에서 문장 위치 정보와 계층적 손실함수를 사용하여 모델 성능 개선
데이터 생성 이력정보
특성 정보
- 주제분류 = 없음
특성정보는 제공처로부터 수집된 데이터이며, DataON에서 제공하는 이외의 정보를 담고 있습니다.
관련 과제/논문 정보
관련 과제/논문 정보는 데이터 등록자 또는 이용자가 추천한 정보가 제공됩니다.
- 유발연구데이터가 유발된 과제/논문 정보입니다.
- 관련연구데이터 생산에 참고된 관련 과제/논문 정보입니다.
원문정보
데이터를 소유한 기관으로 연결되며, 로그인이 필요할 수도 있습니다.