gant100_angulaire

Description :

Intégrations de vecteurs globaux pré-entraînés pour la représentation de mots (GloVe) pour une recherche approximative du voisin le plus proche. Cet ensemble de données se compose de deux divisions :

« base de données » : se compose de 1 183 514 points de données, chacun ayant des fonctionnalités : « intégration » (100 flottants), « index » (int64), « voisins » (liste vide).
'test' : se compose de 10 000 points de données, chacun ayant des fonctionnalités : 'intégration' (100 flottants), 'index' (int64), 'voisins' (liste des 'index' et 'distance' des voisins les plus proches dans la base de données. )

Page d'accueil : https://nlp.stanford.edu/projects/glove/
Code source : tfds.nearest_neighbors.glove_100_angular.Glove100Angular
Versions :
- 1.0.0 (par défaut) : version initiale.
Taille du téléchargement : 462.93 MiB
Taille de l'ensemble de données : 567.90 MiB
Mise en cache automatique ( documentation ) : Non
Divisions :

Diviser	Exemples
`'database'`	1 183 514
`'test'`	10 000

Structure des fonctionnalités :

FeaturesDict({
    'embedding': Tensor(shape=(100,), dtype=float32),
    'index': Scalar(shape=(), dtype=int64, description=Index within the split.),
    'neighbors': Sequence({
        'distance': Scalar(shape=(), dtype=float32, description=Neighbor distance.),
        'index': Scalar(shape=(), dtype=int64, description=Neighbor index.),
    }),
})

Documentation des fonctionnalités :

Fonctionnalité	Classe	Forme	Type D	Description
	FonctionnalitésDict
intégration	Tenseur	(100,)	flotteur32
indice	Scalaire		int64	Index dans la division.
voisins	Séquence			Les voisins calculés, disponibles uniquement pour la division de test.
voisins/distance	Scalaire		flotteur32	Distance du voisin.
voisins/index	Scalaire		int64	Indice de voisin.

Clés supervisées (Voir doc as_supervised ) : None
Figure ( tfds.show_examples ) : non pris en charge.
Exemples ( tfds.as_dataframe ) :

Citation :

@inproceedings{pennington2014glove,
  author = {Jeffrey Pennington and Richard Socher and Christopher D. Manning},
  booktitle = {Empirical Methods in Natural Language Processing (EMNLP)},
  title = {GloVe: Global Vectors for Word Representation},
  year = {2014},
  pages = {1532--1543},
  url = {http://www.aclweb.org/anthology/D14-1162},
}

gant100_angulaire Restez organisé à l'aide des collections Enregistrez et classez les contenus selon vos préférences.

gant100_angulaire