qm9

Descrição :

QM9 consiste em propriedades geométricas, energéticas, eletrônicas e termodinâmicas computadas para 134k pequenas moléculas orgânicas estáveis compostas de C, H, O, N e F. Como de costume, removemos as moléculas não caracterizadas e fornecemos as 130.831 restantes.

Página inicial : https://doi.org/10.6084/m9.figshare.c.978904.v5
Código fonte : tfds.datasets.qm9.Builder
Versões :
- 1.0.0 (padrão): versão inicial.
Tamanho do download : 82.62 MiB
Tamanho do conjunto de dados : 177.16 MiB
Estrutura de recursos :

FeaturesDict({
    'A': float32,
    'B': float32,
    'C': float32,
    'Cv': float32,
    'G': float32,
    'G_atomization': float32,
    'H': float32,
    'H_atomization': float32,
    'InChI': string,
    'InChI_relaxed': string,
    'Mulliken_charges': Tensor(shape=(29,), dtype=float32),
    'SMILES': string,
    'SMILES_relaxed': string,
    'U': float32,
    'U0': float32,
    'U0_atomization': float32,
    'U_atomization': float32,
    'alpha': float32,
    'charges': Tensor(shape=(29,), dtype=int64),
    'frequencies': Tensor(shape=(None,), dtype=float32),
    'gap': float32,
    'homo': float32,
    'index': int64,
    'lumo': float32,
    'mu': float32,
    'num_atoms': int64,
    'positions': Tensor(shape=(29, 3), dtype=float32),
    'r2': float32,
    'tag': string,
    'zpve': float32,
})

Documentação de recursos :

Recurso	Aula	Forma	Tipo D
	RecursosDict
UM	Tensor		float32
B	Tensor		float32
C	Tensor		float32
Cv	Tensor		float32
G	Tensor		float32
G_atomização	Tensor		float32
H	Tensor		float32
H_atomização	Tensor		float32
InChI	Tensor		corda
InChI_relaxado	Tensor		corda
Mulliken_cargas	Tensor	(29,)	float32
SORRISOS	Tensor		corda
SMILES_relaxado	Tensor		corda
Você	Tensor		float32
U0	Tensor		float32
U0_atomização	Tensor		float32
U_atomização	Tensor		float32
alfa	Tensor		float32
cobranças	Tensor	(29,)	int64
frequências	Tensor	(Nenhum,)	float32
brecha	Tensor		float32
homo	Tensor		float32
índice	Tensor		int64
lumo	Tensor		float32
mu	Tensor		float32
num_atoms	Tensor		int64
posições	Tensor	(29, 3)	float32
r2	Tensor		float32
marcação	Tensor		corda
zpve	Tensor		float32

Chaves supervisionadas (consulte o documento as_supervised ): None
Figura ( tfds.show_examples ): Não suportado.
Citação :

@article{ramakrishnan2014quantum,
  title={Quantum chemistry structures and properties of 134 kilo molecules},
  author={Ramakrishnan, Raghunathan and Dral, Pavlo O and Rupp, Matthias and von Lilienfeld, O Anatole},
  journal={Scientific Data},
  volume={1},
  year={2014},
  publisher={Nature Publishing Group}
}

qm9/original (configuração padrão)

Descrição da configuração : QM9 não define nenhuma divisão. Portanto, esta variante coloca o conjunto de dados QM9 completo na divisão do trem, na ordem original (sem embaralhamento).
Armazenado em cache automaticamente ( documentação ): somente quando shuffle_files=False (train)
Divisões :

Dividir	Exemplos
`'train'`	130.831

Exemplos ( tfds.as_dataframe ):

qm9/corvo marinho

Descrição da configuração : divisão do conjunto de dados usada pelo Cormorant. 100.000 trens, 17.748 validações e 13.083 amostras de teste. A divisão acontece após embaralhar com a semente 0. Artigo: https://arxiv.org/abs/1906.04015 Divisão: https://github.com/risilab/cormorant/blob/master/src/cormorant/data/prepare/qm9.py
Armazenado em cache automaticamente ( documentação ): Sim (teste, validação), Somente quando shuffle_files=False (trem)
Divisões :

Dividir	Exemplos
`'test'`	13.083
`'train'`	100.000
`'validation'`	17.748

Exemplos ( tfds.as_dataframe ):

qm9/dimenet

Descrição da configuração : divisão do conjunto de dados usada pela DimeNet. 110.000 trens, 10.000 validações e 10.831 amostras de teste. A divisão acontece após embaralhar com a semente 42. Artigo: https://arxiv.org/abs/2003.03123 Divisão: https://github.com/gasteigerjo/dimenet/blob/master/dimenet/training/data_provider.py
Armazenado em cache automaticamente ( documentação ): Sim (teste, validação), Somente quando shuffle_files=False (trem)
Divisões :

Dividir	Exemplos
`'test'`	10.831
`'train'`	110.000
`'validation'`	10.000

Exemplos ( tfds.as_dataframe ):

qm9 Mantenha tudo organizado com as coleções Salve e categorize o conteúdo com base nas suas preferências.

qm9/original (configuração padrão)

qm9/corvo marinho

qm9/dimenet

qm9