- বর্ণনা :
QM9-এ C, H, O, N, এবং F দ্বারা গঠিত 134k স্থিতিশীল ছোট জৈব অণুর জন্য গণনা করা জ্যামিতিক, শক্তিবর্ধক, ইলেকট্রনিক এবং তাপগতিগত বৈশিষ্ট্য রয়েছে। যথারীতি, আমরা অচ্যুতিত অণুগুলি সরিয়ে ফেলি এবং অবশিষ্ট 130,831টি প্রদান করি।
সোর্স কোড :
tfds.datasets.qm9.Builderসংস্করণ :
-
1.0.0(ডিফল্ট): প্রাথমিক প্রকাশ।
-
ডাউনলোড সাইজ :
82.62 MiBডেটাসেটের আকার :
177.16 MiBবৈশিষ্ট্য গঠন :
FeaturesDict({
'A': float32,
'B': float32,
'C': float32,
'Cv': float32,
'G': float32,
'G_atomization': float32,
'H': float32,
'H_atomization': float32,
'InChI': string,
'InChI_relaxed': string,
'Mulliken_charges': Tensor(shape=(29,), dtype=float32),
'SMILES': string,
'SMILES_relaxed': string,
'U': float32,
'U0': float32,
'U0_atomization': float32,
'U_atomization': float32,
'alpha': float32,
'charges': Tensor(shape=(29,), dtype=int64),
'frequencies': Tensor(shape=(None,), dtype=float32),
'gap': float32,
'homo': float32,
'index': int64,
'lumo': float32,
'mu': float32,
'num_atoms': int64,
'positions': Tensor(shape=(29, 3), dtype=float32),
'r2': float32,
'tag': string,
'zpve': float32,
})
- বৈশিষ্ট্য ডকুমেন্টেশন :
| বৈশিষ্ট্য | ক্লাস | আকৃতি | ডিটাইপ | বর্ণনা |
|---|---|---|---|---|
| ফিচারসডিক্ট | ||||
| ক | টেনসর | float32 | ||
| খ | টেনসর | float32 | ||
| গ | টেনসর | float32 | ||
| সিভি | টেনসর | float32 | ||
| জি | টেনসর | float32 | ||
| G_পরমাণুকরণ | টেনসর | float32 | ||
| এইচ | টেনসর | float32 | ||
| H_পরমাণুকরণ | টেনসর | float32 | ||
| InChI | টেনসর | স্ট্রিং | ||
| InChI_আরাম | টেনসর | স্ট্রিং | ||
| মুলিকেন_চার্জ | টেনসর | (২৯,) | float32 | |
| স্মাইল | টেনসর | স্ট্রিং | ||
| SMILES_আরাম | টেনসর | স্ট্রিং | ||
| উ | টেনসর | float32 | ||
| U0 | টেনসর | float32 | ||
| U0_পরমাণুকরণ | টেনসর | float32 | ||
| U_পরমাণুকরণ | টেনসর | float32 | ||
| আলফা | টেনসর | float32 | ||
| চার্জ | টেনসর | (২৯,) | int64 | |
| ফ্রিকোয়েন্সি | টেনসর | (কোনটিই নয়,) | float32 | |
| ফাঁক | টেনসর | float32 | ||
| হোমো | টেনসর | float32 | ||
| সূচক | টেনসর | int64 | ||
| লুমো | টেনসর | float32 | ||
| mu | টেনসর | float32 | ||
| সংখ্যা_পরমাণু | টেনসর | int64 | ||
| অবস্থান | টেনসর | (২৯, ৩) | float32 | |
| r2 | টেনসর | float32 | ||
| ট্যাগ | টেনসর | স্ট্রিং | ||
| zpve | টেনসর | float32 |
তত্ত্বাবধান করা কী (দেখুন
as_superviseddoc ):Noneচিত্র ( tfds.show_examples ): সমর্থিত নয়।
উদ্ধৃতি :
@article{ramakrishnan2014quantum,
title={Quantum chemistry structures and properties of 134 kilo molecules},
author={Ramakrishnan, Raghunathan and Dral, Pavlo O and Rupp, Matthias and von Lilienfeld, O Anatole},
journal={Scientific Data},
volume={1},
year={2014},
publisher={Nature Publishing Group}
}
qm9/অরিজিনাল (ডিফল্ট কনফিগারেশন)
কনফিগার বিবরণ : QM9 কোনো বিভাজন সংজ্ঞায়িত করে না। তাই এই বৈকল্পিকটি সম্পূর্ণ QM9 ডেটাসেটটিকে ট্রেনের বিভাজনে, আসল ক্রমে (কোনও এলোমেলো করা হবে না) রাখে।
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): শুধুমাত্র যখন
shuffle_files=False(ট্রেন)বিভাজন :
| বিভক্ত | উদাহরণ |
|---|---|
'train' | 130,831 |
- উদাহরণ ( tfds.as_dataframe ):
qm9/কর্মোর্যান্ট
কনফিগারেশনের বিবরণ : Cormorant দ্বারা ব্যবহৃত ডেটাসেট বিভক্ত। 100,000 ট্রেন, 17,748টি বৈধতা এবং 13,083টি পরীক্ষার নমুনা। বীজের সাথে এলোমেলো করার পরে বিভাজন ঘটে 0। কাগজ: https://arxiv.org/abs/1906.04015 বিভক্ত: https://github.com/risilab/cormorant/blob/master/src/cormorant/data/prepare/qm9.py
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ (পরীক্ষা, বৈধতা), শুধুমাত্র যখন
shuffle_files=False(ট্রেন)বিভাজন :
| বিভক্ত | উদাহরণ |
|---|---|
'test' | ১৩,০৮৩ |
'train' | 100,000 |
'validation' | 17,748 |
- উদাহরণ ( tfds.as_dataframe ):
qm9/ডাইমেনেট
কনফিগারেশনের বিবরণ : ডাইমেনেট দ্বারা ব্যবহৃত ডেটাসেট বিভক্ত। 110,000 ট্রেন, 10,000 বৈধতা, এবং 10,831টি পরীক্ষার নমুনা। বীজের সাথে এলোমেলো করার পরে বিভক্ত হয় 42. কাগজ: https://arxiv.org/abs/2003.03123 বিভক্ত: https://github.com/gasteigerjo/dimenet/blob/master/dimenet/training/data_provider.py
স্বয়ংক্রিয় ক্যাশে ( ডকুমেন্টেশন ): হ্যাঁ (পরীক্ষা, বৈধতা), শুধুমাত্র যখন
shuffle_files=False(ট্রেন)বিভাজন :
| বিভক্ত | উদাহরণ |
|---|---|
'test' | 10,831 |
'train' | 110,000 |
'validation' | 10,000 |
- উদাহরণ ( tfds.as_dataframe ):