- Opis :
Jest to zbiór danych do klasyfikowania intencji cytowania w artykułach akademickich. Główna etykieta intencji cytowania dla każdego obiektu Json jest określana za pomocą klucza etykiety, podczas gdy kontekst cytowania jest określany za pomocą klucza kontekstu. Przykład: { 'string': 'U pawianów chacma relacje męskie-niemowlęce mogą być powiązane zarówno z nawiązywaniem przyjaźni, jak i sukcesem ojcostwa [30, 31].' 'sectionName': 'Introduction', 'label': 'background', 'citingPaperId': '7a6b2d4b405439', 'citedPaperId': '9d1abadc55b5e0', ... } Możesz uzyskać pełne informacje o pracy korzystając z podanych identyfikatorów papieru z interfejsem API Semantic Scholar ( https://api.semanticscholar.org/ ). Etykiety to: Metoda, Tło, Wynik
Strona główna : https://github.com/allenai/scicite
Kod źródłowy :
tfds.text.Scicite
Wersje :
-
1.0.0
(domyślnie): Brak informacji o wersji.
-
Rozmiar pliku do pobrania :
22.12 MiB
Rozmiar zbioru danych :
Unknown size
Automatyczne buforowanie ( dokumentacja ): Nieznane
Dzieli :
Rozdzielać | Przykłady |
---|---|
'test' | 1859 |
'train' | 8194 |
'validation' | 916 |
- Struktura funkcji :
FeaturesDict({
'citeEnd': tf.int64,
'citeStart': tf.int64,
'citedPaperId': Text(shape=(), dtype=tf.string),
'citingPaperId': Text(shape=(), dtype=tf.string),
'excerpt_index': tf.int32,
'id': Text(shape=(), dtype=tf.string),
'isKeyCitation': tf.bool,
'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=3),
'label2': ClassLabel(shape=(), dtype=tf.int64, num_classes=4),
'label2_confidence': tf.float32,
'label_confidence': tf.float32,
'sectionName': Text(shape=(), dtype=tf.string),
'source': ClassLabel(shape=(), dtype=tf.int64, num_classes=7),
'string': Text(shape=(), dtype=tf.string),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
cytujKoniec | Napinacz | tf.int64 | ||
cytujStart | Napinacz | tf.int64 | ||
cytowany identyfikator papieru | Tekst | tf.string | ||
powołując się na identyfikator papieru | Tekst | tf.string | ||
fragment_indeksu | Napinacz | tf.int32 | ||
ID | Tekst | tf.string | ||
isKeyCitation | Napinacz | tf.bool | ||
etykieta | Etykieta klasy | tf.int64 | ||
etykieta2 | Etykieta klasy | tf.int64 | ||
label2_confidence | Napinacz | tf.float32 | ||
label_confidence | Napinacz | tf.float32 | ||
nazwa sekcji | Tekst | tf.string | ||
źródło | Etykieta klasy | tf.int64 | ||
strunowy | Tekst | tf.string |
Nadzorowane klucze (patrz
as_supervised
doc ):('string', 'label')
Rysunek ( tfds.show_examples ): Nieobsługiwane.
Przykłady ( tfds.as_dataframe ):
- Cytat :
@InProceedings{Cohan2019Structural,
author={Arman Cohan and Waleed Ammar and Madeleine Van Zuylen and Field Cady},
title={Structural Scaffolds for Citation Intent Classification in Scientific Publications},
booktitle="NAACL",
year="2019"
}