• 설명 :

GAP는 8,908개의 상호 참조 레이블이 지정된 쌍(모호한 대명사, 선행 이름)을 포함하는 성별 균형 데이터 세트로, Wikipedia에서 샘플링하고 실제 응용 프로그램에서 상호 참조 해상도를 평가하기 위해 Google AI Language에서 출시했습니다.

나뉘다
'test' 2,000
'train' 2,000
'validation' 454
  • 기능 구조 :
FeaturesDict({
    'A': Text(shape=(), dtype=tf.string),
    'A-coref': tf.bool,
    'A-offset': tf.int32,
    'B': Text(shape=(), dtype=tf.string),
    'B-coref': tf.bool,
    'B-offset': tf.int32,
    'ID': Text(shape=(), dtype=tf.string),
    'Pronoun': Text(shape=(), dtype=tf.string),
    'Pronoun-offset': tf.int32,
    'Text': Text(shape=(), dtype=tf.string),
    'URL': Text(shape=(), dtype=tf.string),
})
  • 기능 문서 :
특징 수업 모양 디타입 설명
기능사전
텍스트 tf.string
A-코어 텐서 tf.bool
A-오프셋 텐서 tf.int32
텍스트 tf.string
B-코어 텐서 tf.bool
B 오프셋 텐서 tf.int32
ID 텍스트 tf.string
대명사 텍스트 tf.string
대명사 오프셋 텐서 tf.int32
텍스트 텍스트 tf.string
URL 텍스트 tf.string
  • 인용 :
@article{DBLP:journals/corr/abs-1810-05201,
  author    = {Kellie Webster and
               Marta Recasens and
               Vera Axelrod and
               Jason Baldridge},
  title     = {Mind the {GAP:} {A} Balanced Corpus of Gendered Ambiguous Pronouns},
  journal   = {CoRR},
  volume    = {abs/1810.05201},
  year      = {2018},
  url       = {http://arxiv.org/abs/1810.05201},
  archivePrefix = {arXiv},
  eprint    = {1810.05201},
  timestamp = {Tue, 30 Oct 2018 20:39:56 +0100},
  biburl    = {https://dblp.org/rec/bib/journals/corr/abs-1810-05201},
  bibsource = {dblp computer science bibliography, https://dblp.org}
}