qm9

Descripción :

QM9 consta de propiedades geométricas, energéticas, electrónicas y termodinámicas calculadas para 134k moléculas orgánicas pequeñas estables compuestas de C, H, O, N y F. Como de costumbre, eliminamos las moléculas no caracterizadas y proporcionamos las 130,831 restantes.

Página de inicio : https://doi.org/10.6084/m9.figshare.c.978904.v5
Código fuente : tfds.datasets.qm9.Builder
Versiones :
- 1.0.0 (predeterminado): versión inicial.
Tamaño de descarga : 82.62 MiB
Tamaño del conjunto de datos : 177.16 MiB
Estructura de características :

FeaturesDict({
    'A': float32,
    'B': float32,
    'C': float32,
    'Cv': float32,
    'G': float32,
    'G_atomization': float32,
    'H': float32,
    'H_atomization': float32,
    'InChI': string,
    'InChI_relaxed': string,
    'Mulliken_charges': Tensor(shape=(29,), dtype=float32),
    'SMILES': string,
    'SMILES_relaxed': string,
    'U': float32,
    'U0': float32,
    'U0_atomization': float32,
    'U_atomization': float32,
    'alpha': float32,
    'charges': Tensor(shape=(29,), dtype=int64),
    'frequencies': Tensor(shape=(None,), dtype=float32),
    'gap': float32,
    'homo': float32,
    'index': int64,
    'lumo': float32,
    'mu': float32,
    'num_atoms': int64,
    'positions': Tensor(shape=(29, 3), dtype=float32),
    'r2': float32,
    'tag': string,
    'zpve': float32,
})

Documentación de funciones :

Característica	Clase	Forma	tipo D
	FuncionesDict
A	Tensor		flotador32
B	Tensor		flotador32
do	Tensor		flotador32
CV	Tensor		flotador32
GRAMO	Tensor		flotador32
G_atomización	Tensor		flotador32
h	Tensor		flotador32
H_atomización	Tensor		flotador32
InChi	Tensor		cadena
InChI_relajado	Tensor		cadena
Mulliken_charges	Tensor	(29,)	flotador32
SONRISAS	Tensor		cadena
SONRISAS_relajadas	Tensor		cadena
Ud.	Tensor		flotador32
U0	Tensor		flotador32
U0_atomización	Tensor		flotador32
U_atomización	Tensor		flotador32
alfa	Tensor		flotador32
cargos	Tensor	(29,)	int64
frecuencias	Tensor	(Ninguno,)	flotador32
brecha	Tensor		flotador32
homo	Tensor		flotador32
índice	Tensor		int64
lumo	Tensor		flotador32
mu	Tensor		flotador32
num_átomos	Tensor		int64
posiciones	Tensor	(29, 3)	flotador32
r2	Tensor		flotador32
etiqueta	Tensor		cadena
zpve	Tensor		flotador32

Claves supervisadas (ver documento as_supervised ): None
Figura ( tfds.show_examples ): no compatible.
Cita :

@article{ramakrishnan2014quantum,
  title={Quantum chemistry structures and properties of 134 kilo molecules},
  author={Ramakrishnan, Raghunathan and Dral, Pavlo O and Rupp, Matthias and von Lilienfeld, O Anatole},
  journal={Scientific Data},
  volume={1},
  year={2014},
  publisher={Nature Publishing Group}
}

qm9/original (configuración predeterminada)

Descripción de la configuración : QM9 no define ninguna división. Entonces, esta variante coloca el conjunto de datos QM9 completo en la división del tren, en el orden original (sin barajar).
Almacenamiento en caché automático ( documentación ): solo cuando shuffle_files=False (entrenamiento)
Divisiones :

Dividir	Ejemplos
`'train'`	130.831

Ejemplos ( tfds.as_dataframe ):

qm9/cormorán

Descripción de la configuración : división del conjunto de datos utilizada por Cormorant. 100.000 trenes, 17.748 validaciones y 13.083 muestras de prueba. La división ocurre después de mezclar con la semilla 0. Documento: https://arxiv.org/abs/1906.04015 División: https://github.com/risilab/cormorant/blob/master/src/cormorant/data/prepare/qm9.py
Almacenamiento en caché automático ( documentación ): Sí (prueba, validación), solo cuando shuffle_files=False (entrenamiento)
Divisiones :

Dividir	Ejemplos
`'test'`	13.083
`'train'`	100.000
`'validation'`	17.748

Ejemplos ( tfds.as_dataframe ):

qm9/dimenet

Descripción de la configuración : división del conjunto de datos utilizada por DimeNet. 110.000 trenes, 10.000 validaciones y 10.831 muestras de prueba. La división ocurre después de mezclar con la semilla 42. Documento: https://arxiv.org/abs/2003.03123 División: https://github.com/gasteigerjo/dimenet/blob/master/dimenet/training/data_provider.py
Almacenamiento en caché automático ( documentación ): Sí (prueba, validación), solo cuando shuffle_files=False (entrenamiento)
Divisiones :

Dividir	Ejemplos
`'test'`	10.831
`'train'`	110.000
`'validation'`	10.000

Ejemplos ( tfds.as_dataframe ):

qm9 Organízate con las colecciones Guarda y clasifica el contenido según tus preferencias.

qm9/original (configuración predeterminada)

qm9/cormorán

qm9/dimenet

qm9