싸이사이트

  • 설명 :

학술 논문의 인용 의도를 분류하기 위한 데이터 세트입니다. 각 Json 객체의 주요 인용 의도 레이블은 레이블 키로 지정되는 반면 인용 컨텍스트는 컨텍스트 키로 지정됩니다. 예: { 'string': 'chacma baboons에서 남성-유아 관계는 우정 형성과 친자 관계 성공과 연결될 수 있습니다[30,31].' 'sectionName': 'Introduction', 'label': 'background', 'citingPaperId': '7a6b2d4b405439', 'citedPaperId': '9d1abadc55b5e0', ... } 제공된 논문 ID를 사용하여 논문에 대한 전체 정보를 얻을 수 있습니다 Semantic Scholar API( https://api.semanticscholar.org/ ). 레이블: 방법, 배경, 결과

나뉘다
'test' 1,859
'train' 8,194
'validation' 916
  • 기능 구조 :
FeaturesDict({
    'citeEnd': tf.int64,
    'citeStart': tf.int64,
    'citedPaperId': Text(shape=(), dtype=tf.string),
    'citingPaperId': Text(shape=(), dtype=tf.string),
    'excerpt_index': tf.int32,
    'id': Text(shape=(), dtype=tf.string),
    'isKeyCitation': tf.bool,
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
    'label2': ClassLabel(shape=(), dtype=tf.int64, num_classes=4),
    'label2_confidence': tf.float32,
    'label_confidence': tf.float32,
    'sectionName': Text(shape=(), dtype=tf.string),
    'source': ClassLabel(shape=(), dtype=tf.int64, num_classes=7),
    'string': Text(shape=(), dtype=tf.string),
})
  • 기능 문서 :
특징 수업 모양 디타입 설명
기능사전
인용종료 텐서 tf.int64
citStart 텐서 tf.int64
인용된 종이 ID 텍스트 tf.string
citingPaperId 텍스트 tf.string
발췌 색인 텐서 tf.int32
ID 텍스트 tf.string
isKey인용 텐서 tf.bool
상표 클래스 레이블 tf.int64
라벨2 클래스 레이블 tf.int64
label2_자신감 텐서 tf.float32
레이블_자신감 텐서 tf.float32
섹션 이름 텍스트 tf.string
원천 클래스 레이블 tf.int64
텍스트 tf.string
  • 인용 :
@InProceedings{Cohan2019Structural,
  author={Arman Cohan and Waleed Ammar and Madeleine Van Zuylen and Field Cady},
  title={Structural Scaffolds for Citation Intent Classification in Scientific Publications},
  booktitle="NAACL",
  year="2019"
}