세션만료알림

후 자동 로그아웃됩니다.
세션을 초기화하시겠습니까?

본문으로 바로가기 본문으로 바로가기 주메뉴 바로가기

오류신고
해당 데이터에 오류가 발견되면 오류신고해주세요.
오류신고
데이터 정보
오류신고를 진행 하실 데이터 정보를 담은 표입니다.
제목(Main) 계층적 표현 및 손실함수와 레이블 임베딩을 활용한 논문 문장 의미 분류 모델 (2022년 경진대회 장려상)
제목(Sub)
저자 윤세휘;
제공처 KISTI 기계학습 데이터 공유 활용 서비스 
리포지터리 한국과학기술정보연구원 
접수 정보
오류신고 접수 정보를 담은 표이며, 메일주소, 오류내용을 입력합니다.
아이디
오류신고 접수 정보를 담은 표이며, 메일주소, 오류내용을 입력합니다.
오류 구분
  • 개인정보 노출방지를 위해 개인정보 내용은 가급적 자제하여 주시기 바랍니다.
  • 일방적인 욕설 및 부정적인 내용 작성시 원작자의 판단에 따라 신고자에게 피해가 발생할 수 있습니다. 깨끗하고 청렴한 서비스 문화를 위해 필요한 정보만 기재해주시면 감사하겠습니다.
 
접수하기
    2023 국내 공개 CC-BY-NC Korean

계층적 표현 및 손실함수와 레이블 임베딩을 활용한 논문 문장 의미 분류 모델 (2022년 경진대회 장려상)

윤세휘;
데이터 개요 : * 실세계의 데이터는 대부분 계층형 분류 체계를 가지며 카테고리간 데이터 불균형이 존재함
* 하위 카테고리만 고려하는 플랫 분류에 대한 연구는 많이 이루어지고 있지만 불균형 데이터에 대해 낮은 정확도를 보이는 경향이 있음
* 반면 데이터 불균형 문제를 완화할 수 있는 계층적 분류 연구는 활발하지 않음
* 따라서 본 연구에서는 논문 문장 의미 분류 문제를 해결하기 위해 계층 정보를 명시적으로 활용하기 위한 계층적 표현 및 손실함수를 사용한 기존 연구를 응용하며, 특징 기반 기법을 적용한 계층적 레이블 임베딩을 사용한 국내 논문 문장 의미 분류 모델을 제안함
* 추가적으로 문장이 포함되는 논문의 섹션명을 위치 정보 임베딩으로 사용함
* KISTI의 국내 논문 문장 의미 태깅 데이터셋에 대한 실험을 통해 계층 구조를 반영한 손실 함수를 사용했을 경우와 위치 정보를 사용했을 경우 모두 F1 점수 기준 성능이 모두 향상되었음.
* 경진대회 발표영상



※ 이 모델을 개발한 INU_DILAB팀은 2022 과학기술・공공 AI 데이터 분석활용 경진대회에서 국내 논문 문장 의미 태깅 모델 개발에 참여하여 장려상(국회도서관 관장상)을 수상했습니다.
데이터 설명 : 논문에서 문장 위치 정보와 계층적 손실함수를 사용하여 모델 성능 개선

데이터 생성 이력정보

  • 데이터등록일 : 2023-03-27

특성 정보

  • 주제분류 = 없음
특성정보는 제공처로부터 수집된 데이터이며, DataON에서 제공하는 이외의 정보를 담고 있습니다.

데이터셋 의미 관계 정보

의미관계가 형성된 정보를 클릭하면 통합검색 결과로 이동합니다.
본 서비스는 크로미움(Chromium)기반의 브라우저에서만 제공됩니다.

관련 과제/논문 정보

관련 과제/논문 정보는 데이터 등록자 또는 이용자가 추천한 정보가 제공됩니다.
  • 유발연구데이터가 유발된 과제/논문 정보입니다.
  • 관련연구데이터 생산에 참고된 관련 과제/논문 정보입니다.
과제명, 논문명을 클릭하면 해당 과제와 논문의 상세정보를 확인할 수 있습니다.

원문정보

데이터를 소유한 기관으로 연결되며, 로그인이 필요할 수도 있습니다.
  • 133 조회수
  • 8 다운로드수
  • 추천수 0
  • 공유수 0
  • 인용횟수 0
제공처
리포지터리
한국과학기술정보연구원
DOI
10.23057/59
인용정보생성
            
  자세히 보기 복사
라이센스
CC-BY-NC
공유하기