- תיאור :
QM9 מורכב מתכונות גיאומטריות, אנרגטיות, אלקטרוניות ותרמודינמיות מחושבות עבור מולקולות אורגניות קטנות יציבות של 134k המורכבות מ-C, H, O, N ו-F. כרגיל, אנו מסירים את המולקולות הלא מאופיינות ומספקים את 130,831 הנותרים.
קוד מקור :
tfds.datasets.qm9.Builder
גרסאות :
-
1.0.0
(ברירת מחדל): שחרור ראשוני.
-
גודל הורדה :
82.62 MiB
גודל מערך נתונים :
177.16 MiB
מבנה תכונה :
FeaturesDict({
'A': float32,
'B': float32,
'C': float32,
'Cv': float32,
'G': float32,
'G_atomization': float32,
'H': float32,
'H_atomization': float32,
'InChI': string,
'InChI_relaxed': string,
'Mulliken_charges': Tensor(shape=(29,), dtype=float32),
'SMILES': string,
'SMILES_relaxed': string,
'U': float32,
'U0': float32,
'U0_atomization': float32,
'U_atomization': float32,
'alpha': float32,
'charges': Tensor(shape=(29,), dtype=int64),
'frequencies': Tensor(shape=(None,), dtype=float32),
'gap': float32,
'homo': float32,
'index': int64,
'lumo': float32,
'mu': float32,
'num_atoms': int64,
'positions': Tensor(shape=(29, 3), dtype=float32),
'r2': float32,
'tag': string,
'zpve': float32,
})
- תיעוד תכונה :
תכונה | מַחלָקָה | צוּרָה | Dtype | תֵאוּר |
---|---|---|---|---|
FeaturesDict | ||||
א | מוֹתֵחַ | לצוף32 | ||
ב | מוֹתֵחַ | לצוף32 | ||
ג | מוֹתֵחַ | לצוף32 | ||
קורות חיים | מוֹתֵחַ | לצוף32 | ||
G | מוֹתֵחַ | לצוף32 | ||
G_אטומיזציה | מוֹתֵחַ | לצוף32 | ||
ח | מוֹתֵחַ | לצוף32 | ||
H_atomization | מוֹתֵחַ | לצוף32 | ||
InChI | מוֹתֵחַ | חוּט | ||
InChI_רגוע | מוֹתֵחַ | חוּט | ||
Mulliken_charges | מוֹתֵחַ | (29,) | לצוף32 | |
חיוכים | מוֹתֵחַ | חוּט | ||
SMILES_רגוע | מוֹתֵחַ | חוּט | ||
U | מוֹתֵחַ | לצוף32 | ||
U0 | מוֹתֵחַ | לצוף32 | ||
U0_אטומיזציה | מוֹתֵחַ | לצוף32 | ||
U_atomization | מוֹתֵחַ | לצוף32 | ||
אלפא | מוֹתֵחַ | לצוף32 | ||
חיובים | מוֹתֵחַ | (29,) | int64 | |
תדרים | מוֹתֵחַ | (אַף לֹא אֶחָד,) | לצוף32 | |
פַּעַר | מוֹתֵחַ | לצוף32 | ||
הומו | מוֹתֵחַ | לצוף32 | ||
מַדָד | מוֹתֵחַ | int64 | ||
לומו | מוֹתֵחַ | לצוף32 | ||
מו | מוֹתֵחַ | לצוף32 | ||
מספר_אטומים | מוֹתֵחַ | int64 | ||
עמדות | מוֹתֵחַ | (29, 3) | לצוף32 | |
r2 | מוֹתֵחַ | לצוף32 | ||
תָג | מוֹתֵחַ | חוּט | ||
zpve | מוֹתֵחַ | לצוף32 |
מפתחות בפיקוח (ראה
as_supervised
doc ):None
איור ( tfds.show_examples ): לא נתמך.
ציטוט :
@article{ramakrishnan2014quantum,
title={Quantum chemistry structures and properties of 134 kilo molecules},
author={Ramakrishnan, Raghunathan and Dral, Pavlo O and Rupp, Matthias and von Lilienfeld, O Anatole},
journal={Scientific Data},
volume={1},
year={2014},
publisher={Nature Publishing Group}
}
qm9/original (תצורת ברירת המחדל)
תיאור תצורה : QM9 אינו מגדיר פיצולים. אז גרסה זו מכניסה את מערך הנתונים המלא של QM9 לפיצול הרכבת, בסדר המקורי (ללא דשדוש).
שמור אוטומטי במטמון ( תיעוד ): רק כאשר
shuffle_files=False
(רכבת)פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'train' | 130,831 |
- דוגמאות ( tfds.as_dataframe ):
qm9/קורמורן
תיאור תצורה : פיצול מערך הנתונים בשימוש על ידי קורמורנט. 100,000 רכבות, 17,748 אימות ו-13,083 דגימות בדיקה. פיצול מתרחש לאחר ערבוב עם זרע 0. נייר: https://arxiv.org/abs/1906.04015 פיצול: https://github.com/risilab/cormorant/blob/master/src/cormorant/data/prepare/qm9.py
שמור אוטומטי במטמון ( תיעוד ): כן (בדיקה, אימות), רק כאשר
shuffle_files=False
(רכבת)פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'test' | 13,083 |
'train' | 100,000 |
'validation' | 17,748 |
- דוגמאות ( tfds.as_dataframe ):
qm9/dimenet
תיאור תצורה : פיצול מערך נתונים בשימוש על ידי DimeNet. 110,000 רכבות, 10,000 אימות ו-10,831 דגימות בדיקה. פיצול מתרחש לאחר ערבוב עם זרע 42. נייר: https://arxiv.org/abs/2003.03123 פיצול: https://github.com/gasteigerjo/dimenet/blob/master/dimenet/training/data_provider.py
שמור אוטומטי במטמון ( תיעוד ): כן (בדיקה, אימות), רק כאשר
shuffle_files=False
(רכבת)פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'test' | 10,831 |
'train' | 110,000 |
'validation' | 10,000 |
- דוגמאות ( tfds.as_dataframe ):