싸이사이트

  • 설명 :

학술 논문의 인용 의도를 분류하기 위한 데이터셋입니다. 각 Json 개체의 기본 인용 의도 레이블은 레이블 키로 지정되고 인용 컨텍스트는 컨텍스트 키로 지정됩니다. 예시:

{
 
'string': 'In chacma baboons, male-infant relationships can be linked to both
    formation of friendships and paternity success
[30,31].'
 
'sectionName': 'Introduction',
 
'label': 'background',
 
'citingPaperId': '7a6b2d4b405439',
 
'citedPaperId': '9d1abadc55b5e0',
 
...
 
}

Semantic Scholar API( https://api.semanticscholar.org/ )와 함께 제공된 논문 ID를 사용하여 논문에 대한 전체 정보를 얻을 수 있습니다.

레이블은 메서드, 배경, 결과입니다.

나뉘다
'test' 1,859
'train' 8,194
'validation' 916
  • 기능 구조 :
FeaturesDict({
   
'citeEnd': int64,
   
'citeStart': int64,
   
'citedPaperId': Text(shape=(), dtype=string),
   
'citingPaperId': Text(shape=(), dtype=string),
   
'excerpt_index': int32,
   
'id': Text(shape=(), dtype=string),
   
'isKeyCitation': bool,
   
'label': ClassLabel(shape=(), dtype=int64, num_classes=3),
   
'label2': ClassLabel(shape=(), dtype=int64, num_classes=4),
   
'label2_confidence': float32,
   
'label_confidence': float32,
   
'sectionName': Text(shape=(), dtype=string),
   
'source': ClassLabel(shape=(), dtype=int64, num_classes=7),
   
'string': Text(shape=(), dtype=string),
})
  • 기능 문서 :
특징 수업 모양 D타입 설명
풍모Dict
인용종료 텐서 int64
인용시작 텐서 int64
인용용지 ID 텍스트
인용용지 ID 텍스트
발췌_색인 텐서 int32
ID 텍스트
isKeyCitation 텐서 부울
상표 클래스 레이블 int64
라벨2 클래스 레이블 int64
label2_confidence 텐서 float32
label_confidence 텐서 float32
섹션 이름 텍스트
원천 클래스 레이블 int64
텍스트
  • 인용 :
@InProceedings{Cohan2019Structural,
  author
={Arman Cohan and Waleed Ammar and Madeleine Van Zuylen and Field Cady},
  title
={Structural Scaffolds for Citation Intent Classification in Scientific Publications},
  booktitle
="NAACL",
  year
="2019"
}