qm9

説明：

QM9 は、C、H、O、N、F で構成される 134,000 個の安定した小さな有機分子の計算された幾何学的、エネルギー的、電子的、熱力学的特性で構成されています。いつものように、特徴付けられていない分子を削除し、残りの 130,831 個を提供します。

ホームページ: https://doi.org/10.6084/m9.figshare.c.978904.v5
ソースコード: tfds.datasets.qm9.Builder
バージョン:
- 1.0.0 (デフォルト): 初期リリース。
ダウンロードサイズ: 82.62 MiB
データセットのサイズ: 177.16 MiB
機能の構造:

FeaturesDict({
    'A': float32,
    'B': float32,
    'C': float32,
    'Cv': float32,
    'G': float32,
    'G_atomization': float32,
    'H': float32,
    'H_atomization': float32,
    'InChI': string,
    'InChI_relaxed': string,
    'Mulliken_charges': Tensor(shape=(29,), dtype=float32),
    'SMILES': string,
    'SMILES_relaxed': string,
    'U': float32,
    'U0': float32,
    'U0_atomization': float32,
    'U_atomization': float32,
    'alpha': float32,
    'charges': Tensor(shape=(29,), dtype=int64),
    'frequencies': Tensor(shape=(None,), dtype=float32),
    'gap': float32,
    'homo': float32,
    'index': int64,
    'lumo': float32,
    'mu': float32,
    'num_atoms': int64,
    'positions': Tensor(shape=(29, 3), dtype=float32),
    'r2': float32,
    'tag': string,
    'zpve': float32,
})

機能ドキュメント:

特徴	クラス	形	Dタイプ
	特徴辞書
あ	テンソル		float32
B	テンソル		float32
C	テンソル		float32
履歴書	テンソル		float32
G	テンソル		float32
G_原子化	テンソル		float32
H	テンソル		float32
H_原子化	テンソル		float32
インチチ	テンソル		弦
InChI_relaxed	テンソル		弦
Mulliken_charges	テンソル	(29,)	float32
笑顔	テンソル		弦
SMILES_リラックス	テンソル		弦
U	テンソル		float32
U0	テンソル		float32
U0_原子化	テンソル		float32
U_原子化	テンソル		float32
アルファ	テンソル		float32
料金	テンソル	(29,)	int64
周波数	テンソル	（なし、）	float32
ギャップ	テンソル		float32
ホモ	テンソル		float32
索引	テンソル		int64
ルモ	テンソル		float32
む	テンソル		float32
原子数	テンソル		int64
ポジション	テンソル	(29, 3)	float32
r2	テンソル		float32
タグ	テンソル		弦
ズプヴェ	テンソル		float32

監視キー( as_supervised doc を参照): None
図( tfds.show_examples ): サポートされていません。
引用：

@article{ramakrishnan2014quantum,
  title={Quantum chemistry structures and properties of 134 kilo molecules},
  author={Ramakrishnan, Raghunathan and Dral, Pavlo O and Rupp, Matthias and von Lilienfeld, O Anatole},
  journal={Scientific Data},
  volume={1},
  year={2014},
  publisher={Nature Publishing Group}
}

qm9/オリジナル (デフォルト設定)

構成の説明: QM9 では分割が定義されていません。したがって、このバリアントは、完全な QM9 データセットを元の順序 (シャッフルなし) でトレイン分割に配置します。
自動キャッシュ(ドキュメント): shuffle_files=False (トレイン) の場合のみ
分割:

スプリット	例
`'train'`	130,831

例( tfds.as_dataframe ):

qm9/鵜

構成の説明: Cormorant によって使用されるデータセット分割。 100,000 のトレーニング、17,748 の検証、13,083 のテストサンプル。分割はシード 0 でシャッフルした後に行われます。論文: https://arxiv.org/abs/1906.04015分割: https://github.com/risilab/cormorant/blob/master/src/cormorant/data/prepare/qm9.py
自動キャッシュ(ドキュメント): はい (テスト、検証)、 shuffle_files=Falseの場合のみ (トレーニング)
分割:

スプリット	例
`'test'`	13,083
`'train'`	100,000
`'validation'`	17,748

例( tfds.as_dataframe ):

qm9/ディメネット

構成の説明: DimeNet によって使用されるデータセット分割。 110,000 のトレーニング、10,000 の検証、10,831 のテストサンプル。分割はシード 42 でシャッフルした後に行われます。論文: https://arxiv.org/abs/2003.03123分割: https://github.com/gastigerjo/dimenet/blob/master/dimenet/training/data_provider.py
自動キャッシュ(ドキュメント): はい (テスト、検証)、 shuffle_files=Falseの場合のみ (トレーニング)
分割:

スプリット	例
`'test'`	10,831
`'train'`	110,000
`'validation'`	10,000

例( tfds.as_dataframe ):

qm9 コレクションでコンテンツを整理 必要に応じて、コンテンツの保存と分類を行います。

qm9/オリジナル (デフォルト設定)

qm9/鵜

qm9/ディメネット

qm9