- 説明:
QM9 は、C、H、O、N、F で構成される 134,000 個の安定した小さな有機分子の計算された幾何学的、エネルギー的、電子的、熱力学的特性で構成されています。いつものように、特徴付けられていない分子を削除し、残りの 130,831 個を提供します。
ソースコード:
tfds.datasets.qm9.Builder
バージョン:
-
1.0.0
(デフォルト): 初期リリース。
-
ダウンロードサイズ:
82.62 MiB
データセットのサイズ:
177.16 MiB
機能の構造:
FeaturesDict({
'A': float32,
'B': float32,
'C': float32,
'Cv': float32,
'G': float32,
'G_atomization': float32,
'H': float32,
'H_atomization': float32,
'InChI': string,
'InChI_relaxed': string,
'Mulliken_charges': Tensor(shape=(29,), dtype=float32),
'SMILES': string,
'SMILES_relaxed': string,
'U': float32,
'U0': float32,
'U0_atomization': float32,
'U_atomization': float32,
'alpha': float32,
'charges': Tensor(shape=(29,), dtype=int64),
'frequencies': Tensor(shape=(None,), dtype=float32),
'gap': float32,
'homo': float32,
'index': int64,
'lumo': float32,
'mu': float32,
'num_atoms': int64,
'positions': Tensor(shape=(29, 3), dtype=float32),
'r2': float32,
'tag': string,
'zpve': float32,
})
- 機能ドキュメント:
特徴 | クラス | 形 | Dタイプ | 説明 |
---|---|---|---|---|
特徴辞書 | ||||
あ | テンソル | float32 | ||
B | テンソル | float32 | ||
C | テンソル | float32 | ||
履歴書 | テンソル | float32 | ||
G | テンソル | float32 | ||
G_原子化 | テンソル | float32 | ||
H | テンソル | float32 | ||
H_原子化 | テンソル | float32 | ||
インチチ | テンソル | 弦 | ||
InChI_relaxed | テンソル | 弦 | ||
Mulliken_charges | テンソル | (29,) | float32 | |
笑顔 | テンソル | 弦 | ||
SMILES_リラックス | テンソル | 弦 | ||
U | テンソル | float32 | ||
U0 | テンソル | float32 | ||
U0_原子化 | テンソル | float32 | ||
U_原子化 | テンソル | float32 | ||
アルファ | テンソル | float32 | ||
料金 | テンソル | (29,) | int64 | |
周波数 | テンソル | (なし、) | float32 | |
ギャップ | テンソル | float32 | ||
ホモ | テンソル | float32 | ||
索引 | テンソル | int64 | ||
ルモ | テンソル | float32 | ||
む | テンソル | float32 | ||
原子数 | テンソル | int64 | ||
ポジション | テンソル | (29, 3) | float32 | |
r2 | テンソル | float32 | ||
タグ | テンソル | 弦 | ||
ズプヴェ | テンソル | float32 |
監視キー(
as_supervised
doc を参照):None
図( tfds.show_examples ): サポートされていません。
引用:
@article{ramakrishnan2014quantum,
title={Quantum chemistry structures and properties of 134 kilo molecules},
author={Ramakrishnan, Raghunathan and Dral, Pavlo O and Rupp, Matthias and von Lilienfeld, O Anatole},
journal={Scientific Data},
volume={1},
year={2014},
publisher={Nature Publishing Group}
}
qm9/オリジナル (デフォルト設定)
構成の説明: QM9 では分割が定義されていません。したがって、このバリアントは、完全な QM9 データセットを元の順序 (シャッフルなし) でトレイン分割に配置します。
自動キャッシュ(ドキュメント):
shuffle_files=False
(トレイン) の場合のみ分割:
スプリット | 例 |
---|---|
'train' | 130,831 |
- 例( tfds.as_dataframe ):
qm9/鵜
構成の説明: Cormorant によって使用されるデータセット分割。 100,000 のトレーニング、17,748 の検証、13,083 のテスト サンプル。分割はシード 0 でシャッフルした後に行われます。 論文: https://arxiv.org/abs/1906.04015分割: https://github.com/risilab/cormorant/blob/master/src/cormorant/data/prepare/qm9.py
自動キャッシュ(ドキュメント): はい (テスト、検証)、
shuffle_files=False
の場合のみ (トレーニング)分割:
スプリット | 例 |
---|---|
'test' | 13,083 |
'train' | 100,000 |
'validation' | 17,748 |
- 例( tfds.as_dataframe ):
qm9/ディメネット
構成の説明: DimeNet によって使用されるデータセット分割。 110,000 のトレーニング、10,000 の検証、10,831 のテスト サンプル。分割はシード 42 でシャッフルした後に行われます。 論文: https://arxiv.org/abs/2003.03123分割: https://github.com/gastigerjo/dimenet/blob/master/dimenet/training/data_provider.py
自動キャッシュ(ドキュメント): はい (テスト、検証)、
shuffle_files=False
の場合のみ (トレーニング)分割:
スプリット | 例 |
---|---|
'test' | 10,831 |
'train' | 110,000 |
'validation' | 10,000 |
- 例( tfds.as_dataframe ):