- विवरण :
एसएनएलआई कॉर्पस (संस्करण 1.0) 570k मानव-लिखित अंग्रेजी वाक्य जोड़े का एक संग्रह है, जिसे मैन्युअल रूप से लेबल के साथ संतुलित वर्गीकरण के लिए लेबल किया गया है, जो प्राकृतिक भाषा अनुमान (एनएलआई) के कार्य का समर्थन करता है, जिसे पाठ संबंधी प्रवेश को पहचानने के रूप में भी जाना जाता है। (आरटीई)।
अतिरिक्त दस्तावेज़ीकरण : कोड वाले पेपर्स पर एक्सप्लोर करें
स्रोत कोड :
tfds.datasets.snli.Builderसंस्करण :
-
1.1.0(डिफ़ॉल्ट): कोई रिलीज़ नोट नहीं।
-
डाउनलोड आकार :
90.17 MiBडेटासेट का आकार :
87.00 MiBऑटो-कैश्ड ( दस्तावेज़ीकरण ): हाँ
विभाजन :
| विभाजित करना | उदाहरण |
|---|---|
'test' | 10,000 |
'train' | 550,152 |
'validation' | 10,000 |
- फ़ीचर संरचना :
FeaturesDict({
'hypothesis': Text(shape=(), dtype=string),
'label': ClassLabel(shape=(), dtype=int64, num_classes=3),
'premise': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
| विशेषता | कक्षा | आकार | डीटाइप | विवरण |
|---|---|---|---|---|
| विशेषताएं डिक्ट | ||||
| परिकल्पना | लेख | डोरी | ||
| लेबल | क्लासलेबल | int64 | ||
| आधार | लेख | डोरी |
पर्यवेक्षित कुंजियाँ (
as_superviseddoc देखें):Noneचित्र ( tfds.show_examples ): समर्थित नहीं है।
उदाहरण ( tfds.as_dataframe ):
- उद्धरण :
@inproceedings{snli:emnlp2015,
Author = {Bowman, Samuel R. and Angeli, Gabor and Potts, Christopher, and Manning, Christopher D.},
Booktitle = {Proceedings of the 2015 Conference on Empirical Methods in Natural Language Processing (EMNLP)},
Publisher = {Association for Computational Linguistics},
Title = {A large annotated corpus for learning natural language inference},
Year = {2015}
}