- Mô tả :
Điểm chuẩn Xtreme
Tiêu chuẩn đánh giá TRansfer đa ngôn ngữ của các bộ mã hóa đa ngôn ngữ (XTREME) là một tiêu chuẩn để đánh giá khả năng tổng quát đa ngôn ngữ của các mô hình đa ngôn ngữ được đào tạo trước. Nó bao gồm 40 ngôn ngữ đa dạng về kiểu chữ (bao gồm 12 họ ngôn ngữ) và bao gồm chín nhiệm vụ đòi hỏi lý luận chung về các cấp độ khác nhau của cú pháp và ngữ nghĩa. Các ngôn ngữ trong XTREME được chọn để tối đa hóa sự đa dạng ngôn ngữ, khả năng bao phủ trong các nhiệm vụ hiện có và tính khả dụng của dữ liệu đào tạo. Trong số này có nhiều ngôn ngữ chưa được nghiên cứu, chẳng hạn như tiếng Tamil của người Dravidian (được nói ở miền nam Ấn Độ, Sri Lanka và Singapore), tiếng Telugu và Malayalam (được nói chủ yếu ở miền nam Ấn Độ), và ngôn ngữ Niger-Congo, tiếng Swahili và Yoruba, được nói ở châu Phi.
Để biết mô tả đầy đủ về điểm chuẩn, hãy xem bài báo .
- Trang chủ :
https://sites.research.google/xtreme
Các phiên bản :
-
1.0.0
(mặc định): Bản phát hành ban đầu
-
Tập dữ liệu trong phiên bản mặc định :
-
xnli
: xtreme_xnlixtreme_xnli:1.1.0
-
pawsx
:xtreme_pawsx:1.0.0
-
pos
:xtreme_pos:1.0.0
-
ner
:wikiann:1.0.0
-
xquad
:xquad:3.0.0
-
mlqa
:mlqa:1.0.0
-
tydiqa
:tydi_qa:3.0.0
-
bucc
:bucc:1.0.0
-
tatoeba
:tatoeba:1.0.0
-
Trích dẫn :