qm9

설명 :

QM9는 C, H, O, N 및 F로 구성된 134k개의 안정적인 소형 유기 분자에 대해 계산된 기하학적, 에너지적, 전자적 및 열역학적 특성으로 구성됩니다. 평소와 같이 특성화되지 않은 분자를 제거하고 나머지 130,831개를 제공합니다.

홈페이지 : https://doi.org/10.6084/m9.figshare.c.978904.v5
소스 코드 : tfds.datasets.qm9.Builder
버전 :
- 1.0.0 (기본값): 최초 릴리스입니다.
다운로드 크기 : 82.62 MiB
데이터세트 크기 : 177.16 MiB
기능 구조 :

FeaturesDict({
    'A': float32,
    'B': float32,
    'C': float32,
    'Cv': float32,
    'G': float32,
    'G_atomization': float32,
    'H': float32,
    'H_atomization': float32,
    'InChI': string,
    'InChI_relaxed': string,
    'Mulliken_charges': Tensor(shape=(29,), dtype=float32),
    'SMILES': string,
    'SMILES_relaxed': string,
    'U': float32,
    'U0': float32,
    'U0_atomization': float32,
    'U_atomization': float32,
    'alpha': float32,
    'charges': Tensor(shape=(29,), dtype=int64),
    'frequencies': Tensor(shape=(None,), dtype=float32),
    'gap': float32,
    'homo': float32,
    'index': int64,
    'lumo': float32,
    'mu': float32,
    'num_atoms': int64,
    'positions': Tensor(shape=(29, 3), dtype=float32),
    'r2': float32,
    'tag': string,
    'zpve': float32,
})

기능 문서 :

특징	수업	모양	Dtype
	특징Dict
에이	텐서		float32
비	텐서		float32
기음	텐서		float32
이력서	텐서		float32
G	텐서		float32
G_원자화	텐서		float32
시간	텐서		float32
H_원자화	텐서		float32
인치	텐서		끈
InChI_편안한	텐서		끈
Mulliken_charges	텐서	(29,)	float32
미소	텐서		끈
SMILES_편안함	텐서		끈
유	텐서		float32
U0	텐서		float32
U0_원자화	텐서		float32
U_원자화	텐서		float32
알파	텐서		float32
요금	텐서	(29,)	정수64
주파수	텐서	(없음,)	float32
갭	텐서		float32
호모	텐서		float32
색인	텐서		정수64
루모	텐서		float32
무	텐서		float32
num_atoms	텐서		정수64
위치	텐서	(29, 3)	float32
r2	텐서		float32
꼬리표	텐서		끈
zpve	텐서		float32

감독되는 키 ( as_supervised doc 참조): None
그림 ( tfds.show_examples ): 지원되지 않습니다.
인용 :

@article{ramakrishnan2014quantum,
  title={Quantum chemistry structures and properties of 134 kilo molecules},
  author={Ramakrishnan, Raghunathan and Dral, Pavlo O and Rupp, Matthias and von Lilienfeld, O Anatole},
  journal={Scientific Data},
  volume={1},
  year={2014},
  publisher={Nature Publishing Group}
}

qm9/original (기본 구성)

구성 설명 : QM9는 분할을 정의하지 않습니다. 따라서 이 변형은 전체 QM9 데이터세트를 원래 순서(셔플링 없음)로 열차 분할에 배치합니다.
자동 캐시 ( 문서 ): shuffle_files=False 인 경우에만(학습)
분할 :

나뉘다	예
`'train'`	130,831

예 ( tfds.as_dataframe ):

qm9/가마우지

구성 설명 : Cormorant에서 사용하는 데이터 세트 분할입니다. 100,000개의 열차, 17,748개의 검증, 13,083개의 테스트 샘플. 분할은 시드 0으로 섞은 후에 발생합니다. 문서: https://arxiv.org/abs/1906.04015 분할: https://github.com/risilab/cormorant/blob/master/src/cormorant/data/prepare/qm9.py
자동 캐시 ( 문서 ): 예(테스트, 검증), shuffle_files=False 인 경우에만(학습)
분할 :

나뉘다	예
`'test'`	13,083
`'train'`	100,000
`'validation'`	17,748

예 ( tfds.as_dataframe ):

qm9/dimenet

구성 설명 : DimeNet에서 사용하는 데이터 세트 분할입니다. 학습 110,000개, 검증 10,000개, 테스트 샘플 10,831개. 분할은 시드 42로 섞은 후에 발생합니다. 문서: https://arxiv.org/abs/2003.03123 분할: https://github.com/gasteigerjo/dimenet/blob/master/dimenet/training/data_provider.py
자동 캐시 ( 문서 ): 예(테스트, 검증), shuffle_files=False 인 경우에만(학습)
분할 :

나뉘다	예
`'test'`	10,831
`'train'`	110,000
`'validation'`	10,000

예 ( tfds.as_dataframe ):

qm9 컬렉션을 사용해 정리하기 내 환경설정을 기준으로 콘텐츠를 저장하고 분류하세요.

qm9/original (기본 구성)

qm9/가마우지

qm9/dimenet

qm9