- Keterangan :
Penyematan Vektor Global untuk Representasi Kata (GloVe) yang telah dilatih sebelumnya untuk perkiraan pencarian tetangga terdekat. Kumpulan data ini terdiri dari dua bagian:
- 'database': terdiri dari 1.183.514 titik data, masing-masing memiliki fitur: 'embedding' (100 float), 'index' (int64), 'neighbours' (daftar kosong).
- 'test': terdiri dari 10.000 titik data, masing-masing memiliki fitur: 'embedding' (100 float), 'index' (int64), 'neighbors' (daftar 'index' dan 'jarak' tetangga terdekat dalam database. )
Beranda : https://nlp.stanford.edu/projects/glove/
Kode sumber :
tfds.nearest_neighbors.glove_100_angular.Glove100Angular
Versi :
-
1.0.0
(default): Rilis awal.
-
Ukuran unduhan :
462.93 MiB
Ukuran kumpulan data :
567.90 MiB
Cache otomatis ( dokumentasi ): Tidak
Perpecahan :
Membelah | Contoh |
---|---|
'database' | 1.183.514 |
'test' | 10.000 |
- Struktur fitur :
FeaturesDict({
'embedding': Tensor(shape=(100,), dtype=float32),
'index': Scalar(shape=(), dtype=int64, description=Index within the split.),
'neighbors': Sequence({
'distance': Scalar(shape=(), dtype=float32, description=Neighbor distance.),
'index': Scalar(shape=(), dtype=int64, description=Neighbor index.),
}),
})
- Dokumentasi fitur :
Fitur | Kelas | Membentuk | Tipe D | Keterangan |
---|---|---|---|---|
FiturDict | ||||
penyematan | Tensor | (100,) | float32 | |
indeks | Skalar | int64 | Indeks dalam pemisahan. | |
tetangga | Urutan | Tetangga yang dihitung, yang hanya tersedia untuk pemisahan pengujian. | ||
tetangga/jarak | Skalar | float32 | Jarak tetangga. | |
tetangga/indeks | Skalar | int64 | Indeks tetangga. |
Kunci yang diawasi (Lihat dokumen
as_supervised
):None
Gambar ( tfds.show_examples ): Tidak didukung.
Contoh ( tfds.as_dataframe ):
- Kutipan :
@inproceedings{pennington2014glove,
author = {Jeffrey Pennington and Richard Socher and Christopher D. Manning},
booktitle = {Empirical Methods in Natural Language Processing (EMNLP)},
title = {GloVe: Global Vectors for Word Representation},
year = {2014},
pages = {1532--1543},
url = {http://www.aclweb.org/anthology/D14-1162},
}