scicite

  • 説明

これは、学術論文の引用意図を分類するためのデータセットです。各Jsonオブジェクトの主な引用インテントラベルはラベルキーで指定され、引用コンテキストはコンテキストキーで指定されます。例:{'文字列': 'チャクマヒヒでは、男性と乳児の関係は、友情の形成と父親の成功の両方に関連している可能性があります[30,31]。 'sectionName': 'はじめに'、 'label': 'background'、 'citingPaperId': '7a6b2d4b405439'、 'citedPaperId': '9d1abadc55b5e0'、...}提供された紙のIDを使用して紙に関する完全な情報を取得できますSemantic Sc​​holar API( https://api.semanticscholar.org/ )を使用します。ラベルは次のとおりです。メソッド、背景、結果

  • ホームページhttps ://github.com/allenai/scicite

  • ソースコードtfds.text.Scicite

  • バージョン

    • 1.0.0 (デフォルト):リリースノートなし。
  • ダウンロードサイズ22.12 MiB

  • データセットサイズUnknown size

  • 自動キャッシュドキュメント):不明

  • 分割

スプリット
'test' 1,859
'train' 8,194
'validation' 916
  • 素性構造
FeaturesDict({
    'citeEnd': tf.int64,
    'citeStart': tf.int64,
    'citedPaperId': Text(shape=(), dtype=tf.string),
    'citingPaperId': Text(shape=(), dtype=tf.string),
    'excerpt_index': tf.int32,
    'id': Text(shape=(), dtype=tf.string),
    'isKeyCitation': tf.bool,
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
    'label2': ClassLabel(shape=(), dtype=tf.int64, num_classes=4),
    'label2_confidence': tf.float32,
    'label_confidence': tf.float32,
    'sectionName': Text(shape=(), dtype=tf.string),
    'source': ClassLabel(shape=(), dtype=tf.int64, num_classes=7),
    'string': Text(shape=(), dtype=tf.string),
})
  • 機能ドキュメント
特徴クラスDtype説明
FeaturesDict
citeEndテンソルtf.int64
citeStartテンソルtf.int64
quotedPaperId文章tf.string
citingPaperId文章tf.string
excerpt_indexテンソルtf.int32
id文章tf.string
isKeyCitationテンソルtf.bool
ラベルClassLabel tf.int64
label2 ClassLabel tf.int64
label2_confidenceテンソルtf.float32
label_confidenceテンソルtf.float32
sectionName文章tf.string
ソースClassLabel tf.int64
ストリング文章tf.string
  • 引用
@InProceedings{Cohan2019Structural,
  author={Arman Cohan and Waleed Ammar and Madeleine Van Zuylen and Field Cady},
  title={Structural Scaffolds for Citation Intent Classification in Scientific Publications},
  booktitle="NAACL",
  year="2019"
}