- Описание :
QM9 состоит из рассчитанных геометрических, энергетических, электронных и термодинамических свойств 134 тыс. стабильных небольших органических молекул, состоящих из C, H, O, N и F. Как обычно, мы удаляем нехарактерные молекулы и предоставляем оставшиеся 130 831.
Домашняя страница : https://doi.org/10.6084/m9.figshare.c.978904.v5 .
Исходный код :
tfds.datasets.qm9.Builder
Версии :
-
1.0.0
(по умолчанию): первоначальный выпуск.
-
Размер загрузки :
82.62 MiB
Размер набора данных :
177.16 MiB
Структура функции :
FeaturesDict({
'A': float32,
'B': float32,
'C': float32,
'Cv': float32,
'G': float32,
'G_atomization': float32,
'H': float32,
'H_atomization': float32,
'InChI': string,
'InChI_relaxed': string,
'Mulliken_charges': Tensor(shape=(29,), dtype=float32),
'SMILES': string,
'SMILES_relaxed': string,
'U': float32,
'U0': float32,
'U0_atomization': float32,
'U_atomization': float32,
'alpha': float32,
'charges': Tensor(shape=(29,), dtype=int64),
'frequencies': Tensor(shape=(None,), dtype=float32),
'gap': float32,
'homo': float32,
'index': int64,
'lumo': float32,
'mu': float32,
'num_atoms': int64,
'positions': Tensor(shape=(29, 3), dtype=float32),
'r2': float32,
'tag': string,
'zpve': float32,
})
- Функциональная документация :
Особенность | Сорт | Форма | Дтип | Описание |
---|---|---|---|---|
ВозможностиDict | ||||
А | Тензор | float32 | ||
Б | Тензор | float32 | ||
С | Тензор | float32 | ||
Резюме | Тензор | float32 | ||
г | Тензор | float32 | ||
G_атомизация | Тензор | float32 | ||
ЧАС | Тензор | float32 | ||
H_атомизация | Тензор | float32 | ||
ИнЧИ | Тензор | нить | ||
ИнЧИ_расслабленный | Тензор | нить | ||
Малликен_заряды | Тензор | (29,) | float32 | |
УЛЫБКИ | Тензор | нить | ||
УЛЫБКИ_расслаблены | Тензор | нить | ||
ты | Тензор | float32 | ||
U0 | Тензор | float32 | ||
U0_атомизация | Тензор | float32 | ||
U_атомизация | Тензор | float32 | ||
альфа | Тензор | float32 | ||
сборы | Тензор | (29,) | int64 | |
частоты | Тензор | (Никто,) | float32 | |
зазор | Тензор | float32 | ||
гомо | Тензор | float32 | ||
индекс | Тензор | int64 | ||
люмо | Тензор | float32 | ||
му | Тензор | float32 | ||
число_атомов | Тензор | int64 | ||
позиции | Тензор | (29, 3) | float32 | |
р2 | Тензор | float32 | ||
ярлык | Тензор | нить | ||
зпве | Тензор | float32 |
Контролируемые ключи (см. документ
as_supervised
):None
Рисунок ( tfds.show_examples ): не поддерживается.
Примеры ( tfds.as_dataframe ): Отсутствуют.
Цитата :
@article{ramakrishnan2014quantum,
title={Quantum chemistry structures and properties of 134 kilo molecules},
author={Ramakrishnan, Raghunathan and Dral, Pavlo O and Rupp, Matthias and von Lilienfeld, O Anatole},
journal={Scientific Data},
volume={1},
year={2014},
publisher={Nature Publishing Group}
}
qm9/оригинал (конфигурация по умолчанию)
Описание конфигурации : QM9 не определяет никаких разделений. Таким образом, этот вариант помещает полный набор данных QM9 в разделение поездов в исходном порядке (без перетасовки).
Автоматическое кэширование ( документация ): только если
shuffle_files=False
(поезд)Расколы :
Расколоть | Примеры |
---|---|
'train' | 130 831 |
qm9/баклан
Описание конфигурации : разделение набора данных, используемое Cormorant. 100 000 поездов, 17 748 проверочных и 13 083 тестовых образца. Разделение происходит после перетасовки с начальным числом 0. Документ: https://arxiv.org/abs/1906.04015 Разделение: https://github.com/risilab/cormorant/blob/master/src/cormorant/data/prepare/qm9.py
Автоматическое кэширование ( документация ): Да (тест, проверка), только если
shuffle_files=False
(поезд)Расколы :
Расколоть | Примеры |
---|---|
'test' | 13 083 |
'train' | 100 000 |
'validation' | 17 748 |
qm9/дименет
Описание конфигурации : разделение набора данных, используемое DimeNet. 110 000 поездов, 10 000 проверочных и 10 831 тестовых образцов. Разделение происходит после перетасовки с начальным числом 42. Документ: https://arxiv.org/abs/2003.03123 Разделение: https://github.com/gasteigerjo/dimenet/blob/master/dimenet/training/data_provider.py
Автоматическое кэширование ( документация ): Да (тест, проверка), только если
shuffle_files=False
(поезд)Расколы :
Расколоть | Примеры |
---|---|
'test' | 10 831 |
'train' | 110 000 |
'validation' | 10 000 |