세션만료알림

후 자동 로그아웃됩니다.
세션을 초기화하시겠습니까?

본문으로 바로가기 본문으로 바로가기 주메뉴 바로가기

오류신고
해당 데이터에 오류가 발견되면 오류신고해주세요.
오류신고
데이터 정보
오류신고를 진행 하실 데이터 정보를 담은 표입니다.
제목(Main) FAD: A Chinese Dataset for Fake Audio Detection
제목(Sub)
저자 Haoxin Ma;Jiangyan Yi;
제공처 OpenAIRE 
리포지터리 OpenAIRE 
접수 정보
오류신고 접수 정보를 담은 표이며, 메일주소, 오류내용을 입력합니다.
아이디
오류신고 접수 정보를 담은 표이며, 메일주소, 오류내용을 입력합니다.
오류 구분
  • 개인정보 노출방지를 위해 개인정보 내용은 가급적 자제하여 주시기 바랍니다.
  • 일방적인 욕설 및 부정적인 내용 작성시 원작자의 판단에 따라 신고자에게 피해가 발생할 수 있습니다. 깨끗하고 청렴한 서비스 문화를 위해 필요한 정보만 기재해주시면 감사하겠습니다.
 
접수하기
    2022 해외 공개 CC-BY-4.0 English

FAD: A Chinese Dataset for Fake Audio Detection

FAD: A Chinese Dataset for Fake Audio Detection Haoxin Ma;Jiangyan Yi;
<p>Fake audio detection is a growing concern and some relevant datasets have been designed for research. But there is no standard public Chinese dataset under additive noise conditions. In this paper, we aim to fill in the gap and design a<br> Chinese fake audio detection dataset (FAD) for studying more generalized detection methods. Twelve mainstream speech generation techniques are used to generate fake audios. To simulate the real-life scenarios, three noise datasets are selected for<br> noisy adding at five different signal noise ratios. FAD dataset can be used not only for fake audio detection, but also for detecting the algorithms of fake utterances for<br> audio forensics. Baseline results are presented with analysis. The results that show fake audio detection methods with generalization remain challenging.&nbsp;<br> The FAD dataset is publicly available. The source code of baselines is available on GitHub&nbsp;<a href=https://github.com/ADDchallenge/FAD>https://github.com/ADDchallenge/FAD</a></p> <p><br> The FAD dataset is designed to evaluate the methods of fake audio detection and fake algorithms recognition and other relevant studies. To better study the robustness of the methods under noisy<br> conditions when applied in real life, we construct the corresponding noisy dataset. The total FAD dataset consists of two versions: clean version and noisy version. Both versions are divided into<br> disjoint training, development and test sets in the same way. There is no speaker overlap across these three subsets. Each test sets is further divided into seen and unseen test sets. Unseen test sets can<br> evaluate the generalization of the methods to unknown types. It is worth mentioning that both real audios and fake audios in the unseen test set are unknown to the model.<br> For the noisy speech part, we select three noise database for simulation. Additive noises are added to each audio in the clean dataset at 5 different SNRs. The additive noises of the unseen test set and the<br> remaining subsets come from different noise databases. In each version of FAD dataset, there are 138400 utterances in training set, 14400 utterances in development set, 42000 utterances in seen test set, and 21000 utterances in unseen test set. More detailed statistics are demonstrated in the Tabel 2.</p> <p>Clean Real Audios Collection<br> From the point of eliminating the interference of irrelevant factors, we collect clean real audios from<br> two aspects: 5 open resources from OpenSLR platform (http://www.openslr.org/12/) and one self-recording dataset.&nbsp;</p> <p>Clean Fake Audios Generation<br> We select 11 representative speech synthesis methods to generate the fake audios and one partially fake audios.</p> <p>Noisy Audios Simulation<br> Noisy audios aim to quantify the robustness of the methods under noisy conditions. To simulate the real-life scenarios, we artificially sample the noise signals and add them to clean audios at 5 different<br> SNRs, which are 0dB, 5dB, 10dB, 15dB and 20dB. Additive noises are selected from three noise databases: PNL 100 Nonspeech Sounds, NOISEX-92, and TAU Urban Acoustic Scenes.</p> <p>This data set is licensed with a CC BY-NC-ND 4.0 license.<br> You can cite the data using the following BibTeX entry:<br> @inproceedings{ma2022fad,<br> &nbsp; title={FAD: A Chinese Dataset for Fake Audio Detection},<br> &nbsp; author={Haoxin Ma, Jiangyan Yi, Chenglong Wang, Xunrui Yan, Jianhua Tao, Tao Wang, Shiming Wang, Le Xu, Ruibo Fu},<br> &nbsp; booktitle={Submitted to the 36th Conference on Neural Information Processing Systems (NeurIPS 2022) Track on Datasets and Benchmarks },<br> &nbsp; year={2022},<br> }</p>
  • #Deepfake
  • #Fake Audio
  • #Fake Audio Detection
  • #Dataset
  • #Fake Audio

데이터 생성 이력정보

  • 데이터등록일 : 2022-06-09

데이터셋 의미 관계 정보

의미관계가 형성된 정보를 클릭하면 통합검색 결과로 이동합니다.
본 서비스는 크로미움(Chromium)기반의 브라우저에서만 제공됩니다.

관련 과제/논문 정보

관련 과제/논문 정보는 데이터 등록자 또는 이용자가 추천한 정보가 제공됩니다.
  • 유발연구데이터가 유발된 과제/논문 정보입니다.
  • 관련연구데이터 생산에 참고된 관련 과제/논문 정보입니다.
과제명, 논문명을 클릭하면 해당 과제와 논문의 상세정보를 확인할 수 있습니다.

원문정보

데이터를 소유한 기관으로 연결되며, 로그인이 필요할 수도 있습니다.
  • 23 조회수
  • 0 다운로드수
  • 추천수 0
  • 공유수 0
  • 인용횟수 0
제공처
리포지터리
OpenAIRE
DOI
10.5281/zenodo.6641573
인용정보생성
            
  자세히 보기 복사
라이센스
CC-BY-4.0
공유하기