익스트림

  • 설명 :

익스트림 벤치마크

XTREME(Cross-lingual TRansfer Evaluation of Multilingual Encoders) 벤치마크는 사전 훈련된 다국어 모델의 교차 언어 일반화 능력 평가를 위한 벤치마크입니다. 여기에는 40개의 유형학적으로 다양한 언어(12개 언어군에 걸쳐 있음)가 포함되어 있으며 서로 다른 수준의 구문 및 의미 체계에 대한 추론을 집합적으로 요구하는 9개의 작업이 포함되어 있습니다. XTREME의 언어는 언어 다양성, 기존 작업의 적용 범위 및 교육 데이터의 가용성을 극대화하기 위해 선택됩니다. 이 중에는 드라비다어 타밀어(인도 남부, 스리랑카 및 싱가포르에서 사용), 텔루구어 및 말라얄람어(주로 인도 남부에서 사용), 니제르-콩고 언어인 스와힐리어 및 요루바어와 같이 많이 연구되지 않은 언어가 있습니다. 아프리카에서.

벤치마크에 대한 전체 설명은 문서 를 참조하십시오.

  • 홈페이지 :

https://sites.research.google/xtreme