ふるい1m

説明：

ユークリッド距離を使用した近似最近傍検索用の事前トレーニングされた埋め込み。このデータセットは 2 つの分割で構成されています。

「データベース」: 1,000,000 個のデータポイントで構成され、それぞれに「埋め込み」 (128 浮動小数点)、「インデックス」 (int64)、「近傍」 (空のリスト) の機能があります。
「テスト」: 10,000 個のデータポイントで構成され、それぞれに次の機能があります。「埋め込み」(128 浮動小数点)、「インデックス」(int64)、「近傍」(データベース内の最も近い近傍の「インデックス」と「距離」のリスト)。 )

ホームページ: http://corpus-texmex.irisa.fr/
ソースコード: tfds.datasets.sift1m.Builder
バージョン:
- 1.0.0 (デフォルト): 初期リリース。
ダウンロードサイズ: 500.80 MiB
データセットのサイズ: 589.49 MiB
自動キャッシュ(ドキュメント): いいえ
分割:

スプリット	例
`'database'`	1,000,000
`'test'`	10,000

機能の構造:

FeaturesDict({
    'embedding': Tensor(shape=(128,), dtype=float32),
    'index': Scalar(shape=(), dtype=int64, description=Index within the split.),
    'neighbors': Sequence({
        'distance': Scalar(shape=(), dtype=float32, description=Neighbor distance.),
        'index': Scalar(shape=(), dtype=int64, description=Neighbor index.),
    }),
})

機能ドキュメント:

特徴	クラス	形	Dタイプ	説明
	特徴辞書
埋め込み	テンソル	(128,)	float32
索引	スカラー		int64	スプリット内のインデックス。
隣人	順序			計算された近傍。テスト分割でのみ使用できます。
隣人/距離	スカラー		float32	隣人の距離。
近隣/インデックス	スカラー		int64	近隣インデックス。

監視キー( as_supervised docを参照): None
図( tfds.show_examples ): サポートされていません。
例( tfds.as_dataframe ):

引用：

@article{jegou2010product,
  title={Product quantization for nearest neighbor search},
  author={Jegou, Herve and Douze, Matthijs and Schmid, Cordelia},
  journal={IEEE transactions on pattern analysis and machine intelligence},
  volume={33},
  number={1},
  pages={117--128},
  year={2010},
  publisher={IEEE}
}

ふるい1m コレクションでコンテンツを整理 必要に応じて、コンテンツの保存と分類を行います。

ふるい1m