qm9

Описание :

QM9 состоит из рассчитанных геометрических, энергетических, электронных и термодинамических свойств 134 тыс. стабильных небольших органических молекул, состоящих из C, H, O, N и F. Как обычно, мы удаляем нехарактерные молекулы и предоставляем оставшиеся 130 831.

Домашняя страница : https://doi.org/10.6084/m9.figshare.c.978904.v5.
Исходный код : tfds.datasets.qm9.Builder .
Версии :
- 1.0.0 (по умолчанию): первоначальный выпуск.
Размер загрузки : 82.62 MiB
Размер набора данных : 177.16 MiB
Структура функции :

FeaturesDict({
    'A': float32,
    'B': float32,
    'C': float32,
    'Cv': float32,
    'G': float32,
    'G_atomization': float32,
    'H': float32,
    'H_atomization': float32,
    'InChI': string,
    'InChI_relaxed': string,
    'Mulliken_charges': Tensor(shape=(29,), dtype=float32),
    'SMILES': string,
    'SMILES_relaxed': string,
    'U': float32,
    'U0': float32,
    'U0_atomization': float32,
    'U_atomization': float32,
    'alpha': float32,
    'charges': Tensor(shape=(29,), dtype=int64),
    'frequencies': Tensor(shape=(None,), dtype=float32),
    'gap': float32,
    'homo': float32,
    'index': int64,
    'lumo': float32,
    'mu': float32,
    'num_atoms': int64,
    'positions': Tensor(shape=(29, 3), dtype=float32),
    'r2': float32,
    'tag': string,
    'zpve': float32,
})

Функциональная документация :

Особенность	Сорт	Форма	Дтип
	ВозможностиDict
А	Тензор		float32
Б	Тензор		float32
С	Тензор		float32
Резюме	Тензор		float32
Г	Тензор		float32
G_атомизация	Тензор		float32
ЧАС	Тензор		float32
H_атомизация	Тензор		float32
ИнЧИ	Тензор		нить
ИнЧИ_расслабленный	Тензор		нить
Малликен_заряды	Тензор	(29,)	float32
УЛЫБКИ	Тензор		нить
УЛЫБКИ_расслаблены	Тензор		нить
ты	Тензор		float32
U0	Тензор		float32
U0_атомизация	Тензор		float32
U_атомизация	Тензор		float32
альфа	Тензор		float32
сборы	Тензор	(29,)	int64
частоты	Тензор	(Никто,)	float32
зазор	Тензор		float32
гомо	Тензор		float32
индекс	Тензор		int64
люмо	Тензор		float32
му	Тензор		float32
число_атомов	Тензор		int64
позиции	Тензор	(29, 3)	float32
р2	Тензор		float32
ярлык	Тензор		нить
зпве	Тензор		float32

Контролируемые ключи (см. документ as_supervised ): None
Рисунок ( tfds.show_examples ): не поддерживается.
Цитата :

@article{ramakrishnan2014quantum,
  title={Quantum chemistry structures and properties of 134 kilo molecules},
  author={Ramakrishnan, Raghunathan and Dral, Pavlo O and Rupp, Matthias and von Lilienfeld, O Anatole},
  journal={Scientific Data},
  volume={1},
  year={2014},
  publisher={Nature Publishing Group}
}

qm9/оригинал (конфигурация по умолчанию)

Описание конфигурации : QM9 не определяет никаких разделений. Таким образом, этот вариант помещает полный набор данных QM9 в разделение поездов в исходном порядке (без перетасовки).
Автоматическое кэширование ( документация ): только если shuffle_files=False (поезд)
Расколы :

Расколоть	Примеры
`'train'`	130 831

Примеры ( tfds.as_dataframe ):

qm9/баклан

Описание конфигурации : разделение набора данных, используемое Cormorant. 100 000 поездов, 17 748 проверочных и 13 083 тестовых образца. Разделение происходит после перетасовки с начальным числом 0. Документ: https://arxiv.org/abs/1906.04015 Разделение: https://github.com/risilab/cormorant/blob/master/src/cormorant/data/prepare/qm9.py
Автоматическое кэширование ( документация ): Да (тест, проверка), только если shuffle_files=False (поезд)
Расколы :

Расколоть	Примеры
`'test'`	13 083
`'train'`	100 000
`'validation'`	17 748

Примеры ( tfds.as_dataframe ):

qm9/дименет

Описание конфигурации : разделение набора данных, используемое DimeNet. 110 000 поездов, 10 000 проверочных и 10 831 тестовых образцов. Разделение происходит после перетасовки начального числа 42. Документ: https://arxiv.org/abs/2003.03123 Разделение: https://github.com/gasteigerjo/dimenet/blob/master/dimenet/training/data_provider.py
Автоматическое кэширование ( документация ): Да (тест, проверка), только если shuffle_files=False (поезд)
Расколы :

Расколоть	Примеры
`'test'`	10 831
`'train'`	110 000
`'validation'`	10 000

Примеры ( tfds.as_dataframe ):

qm9 Оптимизируйте свои подборки Сохраняйте и классифицируйте контент в соответствии со своими настройками.

qm9/оригинал (конфигурация по умолчанию)

qm9/баклан

qm9/дименет

qm9