तीव्र गति

विवरण :

DART (डेटा रिकॉर्ड टू टेक्स्ट जनरेशन) में RDF इकाई-संबंध शामिल है जो वाक्य विवरण के साथ एनोटेट किया गया है जो ट्रिपल सेट में सभी तथ्यों को कवर करता है। DART का निर्माण मौजूदा डेटासेट जैसे: WikiTableQuestions, WikiSQL, WebNLG और Cleaned E2E का उपयोग करके किया गया था। WikiTableQuestions और WikiSQL की तालिकाओं को विषय-विधेय-ऑब्जेक्ट ट्रिपल्स में बदल दिया गया था, और इसके टेक्स्ट एनोटेशन मुख्य रूप से MTurk से एकत्र किए गए थे। E2E में अर्थपूर्ण अभ्यावेदन भी त्रिगुणों में रूपांतरित किए गए और इसके विवरणों का उपयोग किया गया, कुछ जिन्हें परिवर्तित नहीं किया जा सका उन्हें हटा दिया गया।

E2E और WebNLG के डेटासेट विभाजन को रखा जाता है, और WikiTableQuestions और WikiSQL के लिए जैकार्ड समानता का उपयोग समान तालिकाओं को एक ही सेट (ट्रेन/देव/tes) में रखने के लिए किया जाता है।

यह डेटासेट एक मानकीकृत तालिका प्रारूप के बाद बनाया गया है।

अतिरिक्त दस्तावेज़ीकरण : कोड वाले पेपर्स पर एक्सप्लोर करें
होमपेज : https://github.com/Yale-LILY/dart
स्रोत कोड : tfds.structured.dart.Dart
संस्करण :
- 0.1.0 (डिफ़ॉल्ट): कोई रिलीज़ नोट नहीं।
डाउनलोड आकार : 249.71 MiB
डेटासेट का आकार : 38.83 MiB
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): हाँ
विभाजन :

विभाजित करना	उदाहरण
`'test'`	12,552
`'train'`	62,659
`'validation'`	6,980

फ़ीचर संरचना :

FeaturesDict({
    'input_text': FeaturesDict({
        'table': Sequence({
            'column_header': string,
            'content': string,
            'row_number': int16,
        }),
    }),
    'target_text': string,
})

फ़ीचर दस्तावेज़ीकरण :

विशेषता	कक्षा	डीटाइप
	विशेषताएं डिक्ट
इनपुट टेक्स्ट	विशेषताएं डिक्ट
इनपुट_टेक्स्ट/टेबल	क्रम
input_text/टेबल/column_header	टेन्सर	डोरी
input_text/तालिका/सामग्री	टेन्सर	डोरी
इनपुट_टेक्स्ट/टेबल/पंक्ति_नंबर	टेन्सर	int16
target_text	टेन्सर	डोरी

पर्यवेक्षित कुंजी ( as_supervised दस्तावेज़ देखें): ('input_text', 'target_text')
चित्र ( tfds.show_examples ): समर्थित नहीं है।
उदाहरण ( tfds.as_dataframe ):

उद्धरण :

@article{radev2020dart,
  title={DART: Open-Domain Structured Data Record to Text Generation},
  author={Dragomir Radev and Rui Zhang and Amrit Rau and Abhinand Sivaprasad and Chiachun Hsieh and Nazneen Fatema Rajani and Xiangru Tang and Aadit Vyas and Neha Verma and Pranav Krishna and Yangxiaokang Liu and Nadia Irwanto and Jessica Pan and Faiaz Rahman and Ahmad Zaidi and Murori Mutuma and Yasin Tarabar and Ankit Gupta and Tao Yu and Yi Chern Tan and Xi Victoria Lin and Caiming Xiong and Richard Socher},
  journal={arXiv preprint arXiv:2007.02871},
  year={2020}

तीव्र गति संग्रह की मदद से व्यवस्थित रहें अपनी प्राथमिकताओं के आधार पर, कॉन्टेंट को सेव करें और कैटगरी में बांटें.

तीव्र गति