- Opis :
Wstępnie przeszkolone wektory globalne do osadzania reprezentacji słów (GloVe) w celu przybliżonego wyszukiwania najbliższego sąsiada. Ten zbiór danych składa się z dwóch podziałów:
- „baza danych”: składa się z 1 183 514 punktów danych, każdy ma funkcje: „osadzanie” (100 zmiennych), „indeks” (int64), „sąsiedzi” (pusta lista).
- „test”: składa się z 10 000 punktów danych, każdy ma funkcje: „osadzanie” (100 floatów), „indeks” (int64), „sąsiedzi” (lista „indeksu” i „odległości” najbliższych sąsiadów w bazie danych. )
Strona główna : https://nlp.stanford.edu/projects/glove/
Kod źródłowy :
tfds.nearest_neighbors.glove_100_angular.Glove100Angular
Wersje :
-
1.0.0
(domyślnie): Wersja pierwsza.
-
Rozmiar pobierania :
462.93 MiB
Rozmiar zbioru danych :
567.90 MiB
Automatyczne buforowanie ( dokumentacja ): Nie
Podziały :
Podział | Przykłady |
---|---|
'database' | 1 183 514 |
'test' | 10 000 |
- Struktura funkcji :
FeaturesDict({
'embedding': Tensor(shape=(100,), dtype=float32),
'index': Scalar(shape=(), dtype=int64, description=Index within the split.),
'neighbors': Sequence({
'distance': Scalar(shape=(), dtype=float32, description=Neighbor distance.),
'index': Scalar(shape=(), dtype=int64, description=Neighbor index.),
}),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
FunkcjeDykt | ||||
osadzanie | Napinacz | (100,) | pływak32 | |
indeks | Skalarny | int64 | Indeks w ramach podziału. | |
sąsiedzi | Sekwencja | Obliczeni sąsiedzi, którzy są dostępni tylko w przypadku podziału testowego. | ||
sąsiedzi/odległość | Skalarny | pływak32 | Odległość sąsiada. | |
sąsiedzi/indeks | Skalarny | int64 | Indeks sąsiada. |
Klucze nadzorowane (zobacz dokument
as_supervised
):None
Rysunek ( tfds.show_examples ): Nieobsługiwany.
Przykłady ( tfds.as_dataframe ):
- Cytat :
@inproceedings{pennington2014glove,
author = {Jeffrey Pennington and Richard Socher and Christopher D. Manning},
booktitle = {Empirical Methods in Natural Language Processing (EMNLP)},
title = {GloVe: Global Vectors for Word Representation},
year = {2014},
pages = {1532--1543},
url = {http://www.aclweb.org/anthology/D14-1162},
}