
  • বর্ণনা :

এটি একাডেমিক কাগজপত্রে উদ্ধৃতি উদ্দেশ্য শ্রেণীবদ্ধ করার জন্য একটি ডেটাসেট। প্রতিটি Json অবজেক্টের জন্য প্রধান উদ্ধৃতি উদ্দেশ্য লেবেল লেবেল কী দিয়ে নির্দিষ্ট করা হয় যখন উদ্ধৃতি প্রসঙ্গে একটি প্রসঙ্গ কী দিয়ে নির্দিষ্ট করা হয়। উদাহরণ:

'string': 'In chacma baboons, male-infant relationships can be linked to both
    formation of friendships and paternity success
'sectionName': 'Introduction',
'label': 'background',
'citingPaperId': '7a6b2d4b405439',
'citedPaperId': '9d1abadc55b5e0',

আপনি সেম্যান্টিক স্কলার API ( https://api.semanticscholar.org/ ) দিয়ে প্রদত্ত পেপার আইডি ব্যবহার করে কাগজ সম্পর্কে সম্পূর্ণ তথ্য পেতে পারেন।

লেবেলগুলি হল: পদ্ধতি, পটভূমি, ফলাফল

বিভক্ত উদাহরণ
'test' 1,859
'train' 8,194
'validation' 916
  • বৈশিষ্ট্য গঠন :
'citeEnd': int64,
'citeStart': int64,
'citedPaperId': Text(shape=(), dtype=string),
'citingPaperId': Text(shape=(), dtype=string),
'excerpt_index': int32,
'id': Text(shape=(), dtype=string),
'isKeyCitation': bool,
'label': ClassLabel(shape=(), dtype=int64, num_classes=3),
'label2': ClassLabel(shape=(), dtype=int64, num_classes=4),
'label2_confidence': float32,
'label_confidence': float32,
'sectionName': Text(shape=(), dtype=string),
'source': ClassLabel(shape=(), dtype=int64, num_classes=7),
'string': Text(shape=(), dtype=string),
  • বৈশিষ্ট্য ডকুমেন্টেশন :
বৈশিষ্ট্য ক্লাস আকৃতি ডিটাইপ বর্ণনা
citeEnd টেনসর int64
সূচনা টেনসর int64
উদ্ধৃত পেপারআইডি পাঠ্য স্ট্রিং
উদ্ধৃতি পেপারআইডি পাঠ্য স্ট্রিং
excerpt_index টেনসর int32
আইডি পাঠ্য স্ট্রিং
isKeyCitation টেনসর bool
লেবেল ক্লাসলেবেল int64
লেবেল2 ক্লাসলেবেল int64
লেবেল2_আত্মবিশ্বাস টেনসর float32
লেবেল_বিশ্বাস টেনসর float32
বিভাগের নাম পাঠ্য স্ট্রিং
সূত্র ক্লাসলেবেল int64
স্ট্রিং পাঠ্য স্ট্রিং
  • উদ্ধৃতি :
={Arman Cohan and Waleed Ammar and Madeleine Van Zuylen and Field Cady},
={Structural Scaffolds for Citation Intent Classification in Scientific Publications},