ליין

הפניות:

lid_spaeng

השתמש בפקודה הבאה כדי לטעון מערך נתונים זה ב-TFDS:

ds = tfds.load('huggingface:lince/lid_spaeng')
  • תיאור :
LinCE is a centralized Linguistic Code-switching Evaluation benchmark
(https://ritual.uh.edu/lince/) that contains data for training and evaluating
NLP systems on code
-switching tasks.
  • רישיון : אין רישיון ידוע
  • גרסה : 1.0.0
  • פיצולים :
לְפַצֵל דוגמאות
'test' 8289
'train' 21030
'validation' 3332
  • תכונות :
{
   
"idx": {
       
"dtype": "int32",
       
"id": null,
       
"_type": "Value"
   
},
   
"words": {
       
"feature": {
           
"dtype": "string",
           
"id": null,
           
"_type": "Value"
       
},
       
"length": -1,
       
"id": null,
       
"_type": "Sequence"
   
},
   
"lid": {
       
"feature": {
           
"dtype": "string",
           
"id": null,
           
"_type": "Value"
       
},
       
"length": -1,
       
"id": null,
       
"_type": "Sequence"
   
}
}

lid_hineng

השתמש בפקודה הבאה כדי לטעון מערך נתונים זה ב-TFDS:

ds = tfds.load('huggingface:lince/lid_hineng')
  • תיאור :
LinCE is a centralized Linguistic Code-switching Evaluation benchmark
(https://ritual.uh.edu/lince/) that contains data for training and evaluating
NLP systems on code
-switching tasks.
  • רישיון : אין רישיון ידוע
  • גרסה : 1.0.0
  • פיצולים :
לְפַצֵל דוגמאות
'test' 1854
'train' 4823
'validation' 744
  • תכונות :
{
   
"idx": {
       
"dtype": "int32",
       
"id": null,
       
"_type": "Value"
   
},
   
"words": {
       
"feature": {
           
"dtype": "string",
           
"id": null,
           
"_type": "Value"
       
},
       
"length": -1,
       
"id": null,
       
"_type": "Sequence"
   
},
   
"lid": {
       
"feature": {
           
"dtype": "string",
           
"id": null,
           
"_type": "Value"
       
},
       
"length": -1,
       
"id": null,
       
"_type": "Sequence"
   
}
}

lid_msaea

השתמש בפקודה הבאה כדי לטעון מערך נתונים זה ב-TFDS:

ds = tfds.load('huggingface:lince/lid_msaea')
  • תיאור :
LinCE is a centralized Linguistic Code-switching Evaluation benchmark
(https://ritual.uh.edu/lince/) that contains data for training and evaluating
NLP systems on code
-switching tasks.
  • רישיון : אין רישיון ידוע
  • גרסה : 1.0.0
  • פיצולים :
לְפַצֵל דוגמאות
'test' 1663
'train' 8464
'validation' 1116
  • תכונות :
{
   
"idx": {
       
"dtype": "int32",
       
"id": null,
       
"_type": "Value"
   
},
   
"words": {
       
"feature": {
           
"dtype": "string",
           
"id": null,
           
"_type": "Value"
       
},
       
"length": -1,
       
"id": null,
       
"_type": "Sequence"
   
},
   
"lid": {
       
"feature": {
           
"dtype": "string",
           
"id": null,
           
"_type": "Value"
       
},
       
"length": -1,
       
"id": null,
       
"_type": "Sequence"
   
}
}

lid_nepeng

השתמש בפקודה הבאה כדי לטעון מערך נתונים זה ב-TFDS:

ds = tfds.load('huggingface:lince/lid_nepeng')
  • תיאור :
LinCE is a centralized Linguistic Code-switching Evaluation benchmark
(https://ritual.uh.edu/lince/) that contains data for training and evaluating
NLP systems on code
-switching tasks.
  • רישיון : אין רישיון ידוע
  • גרסה : 1.0.0
  • פיצולים :
לְפַצֵל דוגמאות
'test' 3228
'train' 8451
'validation' 1332
  • תכונות :
{
   
"idx": {
       
"dtype": "int32",
       
"id": null,
       
"_type": "Value"
   
},
   
"words": {
       
"feature": {
           
"dtype": "string",
           
"id": null,
           
"_type": "Value"
       
},
       
"length": -1,
       
"id": null,
       
"_type": "Sequence"
   
},
   
"lid": {
       
"feature": {
           
"dtype": "string",
           
"id": null,
           
"_type": "Value"
       
},
       
"length": -1,
       
"id": null,
       
"_type": "Sequence"
   
}
}

pos_spaeng

השתמש בפקודה הבאה כדי לטעון מערך נתונים זה ב-TFDS:

ds = tfds.load('huggingface:lince/pos_spaeng')
  • תיאור :
LinCE is a centralized Linguistic Code-switching Evaluation benchmark
(https://ritual.uh.edu/lince/) that contains data for training and evaluating
NLP systems on code
-switching tasks.
  • רישיון : אין רישיון ידוע
  • גרסה : 1.0.0
  • פיצולים :
לְפַצֵל דוגמאות
'test' 10720
'train' 27893
'validation' 4298
  • תכונות :
{
   
"idx": {
       
"dtype": "int32",
       
"id": null,
       
"_type": "Value"
   
},
   
"words": {
       
"feature": {
           
"dtype": "string",
           
"id": null,
           
"_type": "Value"
       
},
       
"length": -1,
       
"id": null,
       
"_type": "Sequence"
   
},
   
"lid": {
       
"feature": {
           
"dtype": "string",
           
"id": null,
           
"_type": "Value"
       
},
       
"length": -1,
       
"id": null,
       
"_type": "Sequence"
   
},
   
"pos": {
       
"feature": {
           
"dtype": "string",
           
"id": null,
           
"_type": "Value"
       
},
       
"length": -1,
       
"id": null,
       
"_type": "Sequence"
   
}
}

pos_hineng

השתמש בפקודה הבאה כדי לטעון מערך נתונים זה ב-TFDS:

ds = tfds.load('huggingface:lince/pos_hineng')
  • תיאור :
LinCE is a centralized Linguistic Code-switching Evaluation benchmark
(https://ritual.uh.edu/lince/) that contains data for training and evaluating
NLP systems on code
-switching tasks.
  • רישיון : אין רישיון ידוע
  • גרסה : 1.0.0
  • פיצולים :
לְפַצֵל דוגמאות
'test' 299
'train' 1030
'validation' 160
  • תכונות :
{
   
"idx": {
       
"dtype": "int32",
       
"id": null,
       
"_type": "Value"
   
},
   
"words": {
       
"feature": {
           
"dtype": "string",
           
"id": null,
           
"_type": "Value"
       
},
       
"length": -1,
       
"id": null,
       
"_type": "Sequence"
   
},
   
"lid": {
       
"feature": {
           
"dtype": "string",
           
"id": null,
           
"_type": "Value"
       
},
       
"length": -1,
       
"id": null,
       
"_type": "Sequence"
   
},
   
"pos": {
       
"feature": {
           
"dtype": "string",
           
"id": null,
           
"_type": "Value"
       
},
       
"length": -1,
       
"id": null,
       
"_type": "Sequence"
   
}
}

ner_spaeng

השתמש בפקודה הבאה כדי לטעון מערך נתונים זה ב-TFDS:

ds = tfds.load('huggingface:lince/ner_spaeng')
  • תיאור :
LinCE is a centralized Linguistic Code-switching Evaluation benchmark
(https://ritual.uh.edu/lince/) that contains data for training and evaluating
NLP systems on code
-switching tasks.
  • רישיון : אין רישיון ידוע
  • גרסה : 1.0.0
  • פיצולים :
לְפַצֵל דוגמאות
'test' 23527
'train' 33611
'validation' 10085
  • תכונות :
{
   
"idx": {
       
"dtype": "int32",
       
"id": null,
       
"_type": "Value"
   
},
   
"words": {
       
"feature": {
           
"dtype": "string",
           
"id": null,
           
"_type": "Value"
       
},
       
"length": -1,
       
"id": null,
       
"_type": "Sequence"
   
},
   
"lid": {
       
"feature": {
           
"dtype": "string",
           
"id": null,
           
"_type": "Value"
       
},
       
"length": -1,
       
"id": null,
       
"_type": "Sequence"
   
},
   
"ner": {
       
"feature": {
           
"dtype": "string",
           
"id": null,
           
"_type": "Value"
       
},
       
"length": -1,
       
"id": null,
       
"_type": "Sequence"
   
}
}

ner_msaea

השתמש בפקודה הבאה כדי לטעון מערך נתונים זה ב-TFDS:

ds = tfds.load('huggingface:lince/ner_msaea')
  • תיאור :
LinCE is a centralized Linguistic Code-switching Evaluation benchmark
(https://ritual.uh.edu/lince/) that contains data for training and evaluating
NLP systems on code
-switching tasks.
  • רישיון : אין רישיון ידוע
  • גרסה : 1.0.0
  • פיצולים :
לְפַצֵל דוגמאות
'test' 1110
'train' 10103
'validation' 1122
  • תכונות :
{
   
"idx": {
       
"dtype": "int32",
       
"id": null,
       
"_type": "Value"
   
},
   
"words": {
       
"feature": {
           
"dtype": "string",
           
"id": null,
           
"_type": "Value"
       
},
       
"length": -1,
       
"id": null,
       
"_type": "Sequence"
   
},
   
"ner": {
       
"feature": {
           
"dtype": "string",
           
"id": null,
           
"_type": "Value"
       
},
       
"length": -1,
       
"id": null,
       
"_type": "Sequence"
   
}
}

ner_hineng

השתמש בפקודה הבאה כדי לטעון מערך נתונים זה ב-TFDS:

ds = tfds.load('huggingface:lince/ner_hineng')
  • תיאור :
LinCE is a centralized Linguistic Code-switching Evaluation benchmark
(https://ritual.uh.edu/lince/) that contains data for training and evaluating
NLP systems on code
-switching tasks.
  • רישיון : אין רישיון ידוע
  • גרסה : 1.0.0
  • פיצולים :
לְפַצֵל דוגמאות
'test' 522
'train' 1243
'validation' 314
  • תכונות :
{
   
"idx": {
       
"dtype": "int32",
       
"id": null,
       
"_type": "Value"
   
},
   
"words": {
       
"feature": {
           
"dtype": "string",
           
"id": null,
           
"_type": "Value"
       
},
       
"length": -1,
       
"id": null,
       
"_type": "Sequence"
   
},
   
"lid": {
       
"feature": {
           
"dtype": "string",
           
"id": null,
           
"_type": "Value"
       
},
       
"length": -1,
       
"id": null,
       
"_type": "Sequence"
   
},
   
"ner": {
       
"feature": {
           
"dtype": "string",
           
"id": null,
           
"_type": "Value"
       
},
       
"length": -1,
       
"id": null,
       
"_type": "Sequence"
   
}
}

sa_spaeng

השתמש בפקודה הבאה כדי לטעון מערך נתונים זה ב-TFDS:

ds = tfds.load('huggingface:lince/sa_spaeng')
  • תיאור :
LinCE is a centralized Linguistic Code-switching Evaluation benchmark
(https://ritual.uh.edu/lince/) that contains data for training and evaluating
NLP systems on code
-switching tasks.
  • רישיון : אין רישיון ידוע
  • גרסה : 1.0.0
  • פיצולים :
לְפַצֵל דוגמאות
'test' 4736
'train' 12194
'validation' 1859
  • תכונות :
{
   
"idx": {
       
"dtype": "int32",
       
"id": null,
       
"_type": "Value"
   
},
   
"words": {
       
"feature": {
           
"dtype": "string",
           
"id": null,
           
"_type": "Value"
       
},
       
"length": -1,
       
"id": null,
       
"_type": "Sequence"
   
},
   
"lid": {
       
"feature": {
           
"dtype": "string",
           
"id": null,
           
"_type": "Value"
       
},
       
"length": -1,
       
"id": null,
       
"_type": "Sequence"
   
},
   
"sa": {
       
"dtype": "string",
       
"id": null,
       
"_type": "Value"
   
}
}