qm9

Sự miêu tả :

QM9 bao gồm các đặc tính hình học, năng lượng, điện tử và nhiệt động được tính toán cho 134k phân tử hữu cơ nhỏ ổn định được tạo thành từ C, H, O, N và F. Như thường lệ, chúng tôi loại bỏ các phân tử không bị biến đổi và cung cấp 130.831 phân tử còn lại.

Trang chủ : https://doi.org/10.6084/m9.figshare.c.978904.v5
Mã nguồn : tfds.datasets.qm9.Builder
Phiên bản :
- 1.0.0 (mặc định): Bản phát hành đầu tiên.
Kích thước tải xuống : 82.62 MiB
Kích thước tập dữ liệu : 177.16 MiB
Cấu trúc tính năng :

FeaturesDict({
    'A': float32,
    'B': float32,
    'C': float32,
    'Cv': float32,
    'G': float32,
    'G_atomization': float32,
    'H': float32,
    'H_atomization': float32,
    'InChI': string,
    'InChI_relaxed': string,
    'Mulliken_charges': Tensor(shape=(29,), dtype=float32),
    'SMILES': string,
    'SMILES_relaxed': string,
    'U': float32,
    'U0': float32,
    'U0_atomization': float32,
    'U_atomization': float32,
    'alpha': float32,
    'charges': Tensor(shape=(29,), dtype=int64),
    'frequencies': Tensor(shape=(None,), dtype=float32),
    'gap': float32,
    'homo': float32,
    'index': int64,
    'lumo': float32,
    'mu': float32,
    'num_atoms': int64,
    'positions': Tensor(shape=(29, 3), dtype=float32),
    'r2': float32,
    'tag': string,
    'zpve': float32,
})

Tài liệu tính năng :

Tính năng	Lớp học	Hình dạng	loại D
	Tính năngDict
MỘT	Tenxơ		phao32
B	Tenxơ		phao32
C	Tenxơ		phao32
CV	Tenxơ		phao32
G	Tenxơ		phao32
G_atomization	Tenxơ		phao32
H	Tenxơ		phao32
H_nguyên tử hóa	Tenxơ		phao32
InChI	Tenxơ		sợi dây
InChI_thư giãn	Tenxơ		sợi dây
Mulliken_charges	Tenxơ	(29,)	phao32
Mỉm cười	Tenxơ		sợi dây
SMILES_thư giãn	Tenxơ		sợi dây
bạn	Tenxơ		phao32
U0	Tenxơ		phao32
U0_atomization	Tenxơ		phao32
U_atomization	Tenxơ		phao32
alpha	Tenxơ		phao32
phí	Tenxơ	(29,)	int64
tần số	Tenxơ	(Không có,)	phao32
khoảng cách	Tenxơ		phao32
đồng tính	Tenxơ		phao32
chỉ số	Tenxơ		int64
ánh sáng	Tenxơ		phao32
mu	Tenxơ		phao32
số_nguyên tử	Tenxơ		int64
chức vụ	Tenxơ	(29, 3)	phao32
r2	Tenxơ		phao32
nhãn	Tenxơ		sợi dây
zpve	Tenxơ		phao32

Khóa được giám sát (Xem as_supervised doc ): None
Hình ( tfds.show_examples ): Không được hỗ trợ.
Trích dẫn :

@article{ramakrishnan2014quantum,
  title={Quantum chemistry structures and properties of 134 kilo molecules},
  author={Ramakrishnan, Raghunathan and Dral, Pavlo O and Rupp, Matthias and von Lilienfeld, O Anatole},
  journal={Scientific Data},
  volume={1},
  year={2014},
  publisher={Nature Publishing Group}
}

qm9/bản gốc (cấu hình mặc định)

Mô tả cấu hình : QM9 không xác định bất kỳ sự phân chia nào. Vì vậy, biến thể này đặt toàn bộ tập dữ liệu QM9 vào phần tách đoàn tàu, theo thứ tự ban đầu (không xáo trộn).
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Chỉ khi shuffle_files=False (train)
Chia tách :

Tách ra	Ví dụ
`'train'`	130.831

Ví dụ ( tfds.as_dataframe ):

qm9/chim cốc

Mô tả cấu hình : Phân chia tập dữ liệu được Cormorant sử dụng. 100.000 chuyến tàu, 17.748 xác nhận và 13.083 mẫu thử nghiệm. Quá trình phân tách xảy ra sau khi xáo trộn với hạt giống 0. Giấy: https://arxiv.org/abs/1906.04015 Phân tách: https://github.com/risilab/cormorant/blob/master/src/cormorant/data/prepare/qm9.py
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Có (kiểm tra, xác thực), Chỉ khi shuffle_files=False (train)
Chia tách :

Tách ra	Ví dụ
`'test'`	13.083
`'train'`	100.000
`'validation'`	17.748

Ví dụ ( tfds.as_dataframe ):

qm9/dimenet

Mô tả cấu hình : Phân chia tập dữ liệu được DimeNet sử dụng. 110.000 chuyến tàu, 10.000 xác nhận và 10.831 mẫu thử nghiệm. Quá trình phân tách xảy ra sau khi xáo trộn hạt giống 42. Giấy: https://arxiv.org/abs/2003.03123 Phân tách: https://github.com/gasteigerjo/dimenet/blob/master/dimenet/training/data_provider.py
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Có (kiểm tra, xác thực), Chỉ khi shuffle_files=False (train)
Chia tách :

Tách ra	Ví dụ
`'test'`	10,831
`'train'`	110.000
`'validation'`	10.000

Ví dụ ( tfds.as_dataframe ):

qm9 Sử dụng bộ sưu tập để sắp xếp ngăn nắp các trang Lưu và phân loại nội dung dựa trên lựa chọn ưu tiên của bạn.

qm9/bản gốc (cấu hình mặc định)

qm9/chim cốc

qm9/dimenet

qm9