메인

오류신고

해당 데이터에 오류가 발견되면 오류신고해주세요.

오류신고

데이터 정보

오류신고를 진행 하실 데이터 정보를 담은 표입니다.
제목(Main)	계층적 표현 및 손실함수와 레이블 임베딩을 활용한 논문 문장 의미 분류 모델 (2022년 경진대회 장려상)
제목(Sub)
저자	윤세휘;
제공처	KISTI 기계학습 데이터 공유 활용 서비스
리포지터리	한국과학기술정보연구원

접수 정보

오류신고 접수 정보를 담은 표이며, 메일주소, 오류내용을 입력합니다.
아이디
메일주소	오류신고 접수 정보를 담은 표이며, 메일주소, 오류내용을 입력합니다.
오류 구분
오류내용	개인정보 노출방지를 위해 개인정보 내용은 가급적 자제하여 주시기 바랍니다. 일방적인 욕설 및 부정적인 내용 작성시 원작자의 판단에 따라 신고자에게 피해가 발생할 수 있습니다. 깨끗하고 청렴한 서비스 문화를 위해 필요한 정보만 기재해주시면 감사하겠습니다.

접수하기

추천합니다 관심데이터

2023

국내

공개

CC-BY-NC

Korean

계층적 표현 및 손실함수와 레이블 임베딩을 활용한 논문 문장 의미 분류 모델 (2022년 경진대회 장려상)

윤세휘;

데이터 개요 : * 실세계의 데이터는 대부분 계층형 분류 체계를 가지며 카테고리간 데이터 불균형이 존재함
* 하위 카테고리만 고려하는 플랫 분류에 대한 연구는 많이 이루어지고 있지만 불균형 데이터에 대해 낮은 정확도를 보이는 경향이 있음
* 반면 데이터 불균형 문제를 완화할 수 있는 계층적 분류 연구는 활발하지 않음
* 따라서 본 연구에서는 논문 문장 의미 분류 문제를 해결하기 위해 계층 정보를 명시적으로 활용하기 위한 계층적 표현 및 손실함수를 사용한 기존 연구를 응용하며, 특징 기반 기법을 적용한 계층적 레이블 임베딩을 사용한 국내 논문 문장 의미 분류 모델을 제안함
* 추가적으로 문장이 포함되는 논문의 섹션명을 위치 정보 임베딩으로 사용함
* KISTI의 국내 논문 문장 의미 태깅 데이터셋에 대한 실험을 통해 계층 구조를 반영한 손실 함수를 사용했을 경우와 위치 정보를 사용했을 경우 모두 F1 점수 기준 성능이 모두 향상되었음.
* 경진대회 발표영상

※ 이 모델을 개발한 INU_DILAB팀은 2022 과학기술・공공 AI 데이터 분석활용 경진대회에서 국내 논문 문장 의미 태깅 모델 개발에 참여하여 장려상(국회도서관 관장상)을 수상했습니다.
데이터 설명 : 논문에서 문장 위치 정보와 계층적 손실함수를 사용하여 모델 성능 개선

데이터 생성 이력정보

데이터등록일 : 2023-03-27

특성 정보

주제분류 = 없음

특성정보는 제공처로부터 수집된 데이터이며, DataON에서 제공하는 이외의 정보를 담고 있습니다.

데이터셋 의미 관계 정보

Reset

의미관계가 형성된 정보를 클릭하면 통합검색 결과로 이동합니다.

본 서비스는 크로미움(Chromium)기반의 브라우저에서만 제공됩니다.

원문정보

https://aida.kisti.re.kr/data/aaf9a2a7-7944-4886-971b-eb13398545b4

데이터를 소유한 기관으로 연결되며, 로그인이 필요할 수도 있습니다.

133 조회수
8 다운로드수
추천수 0
공유수 0
인용횟수 0

제공처

리포지터리: 한국과학기술정보연구원

DOI: 10.23057/59

인용정보생성

자세히 보기 복사

라이센스: CC-BY-NC

공유하기

검색 연산자	기능	검색시 예
공백	두 개의 검색어(식)을 모두 포함하고 있는 문서 검색	(데이터 기술)
()	우선순위가 가장 높은 연산자	(정확 (데이터\|data))
\|	두 개의 검색어(식) 중 하나 이상 포함하고 있는문서 검색	(항공 \| 토양)
!	NOT 이후에 있는 검색어가 포함된 문서는 제외	(데이터 !연구)
*	검색어의 *란에 0개 이상의 임의의 문자가 포함된 문서 검색	data*
" "	따옴표 내의 구문과 완전히 일치하는 문서만 검색	"Transform"

계층적 표현 및 손실함수와 레이블 임베딩을 활용한 논문 문장 의미 분류 모델 (2022년 경진대회 장려상)

데이터 생성 이력정보

특성 정보

데이터셋 의미 관계 정보

관련 과제/논문 정보

원문정보