- תיאור :
תאגיד מקביל בקנה מידה אינטרנט לשפות אירופאיות רשמיות.
תיעוד נוסף : חקור על ניירות עם קוד
דף הבית : https://paracrawl.eu/releases.html
קוד מקור :
tfds.datasets.para_crawl.Builder
גרסאות :
-
1.2.0
(ברירת מחדל): אין הערות שחרור.
-
איור ( tfds.show_examples ): לא נתמך.
ציטוט :
@misc {paracrawl,
title = "ParaCrawl",
year = "2018",
url = "http://paracrawl.eu/download.html."
}
para_crawl/enbg (תצורת ברירת המחדל)
תיאור תצורה : מערך נתונים תרגום מאנגלית ל-bg.
גודל הורדה :
98.94 MiB
גודל ערכת נתונים:
362.46 MiB
שמירה אוטומטית במטמון ( תיעוד ): לא
פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'train' | 1,039,885 |
- מבנה תכונה :
Translation({
'bg': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- תיעוד תכונה :
תכונה | מעמד | צוּרָה | Dtype | תיאור |
---|---|---|---|---|
תִרגוּם | ||||
bg | טֶקסט | חוּט | ||
he | טֶקסט | חוּט |
מפתחות בפיקוח (ראה
as_supervised
doc ):('en', 'bg')
דוגמאות ( tfds.as_dataframe ):
para_crawl/encs
תיאור תצורה : מערך נתונים תרגום מאנגלית ל-cs.
גודל הורדה :
187.31 MiB
גודל מערך נתונים :
666.34 MiB
שמירה אוטומטית במטמון ( תיעוד ): לא
פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'train' | 2,981,949 |
- מבנה תכונה :
Translation({
'cs': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- תיעוד תכונה :
תכונה | מעמד | צוּרָה | Dtype | תיאור |
---|---|---|---|---|
תִרגוּם | ||||
cs | טֶקסט | חוּט | ||
he | טֶקסט | חוּט |
מפתחות בפיקוח (ראה
as_supervised
doc ):('en', 'cs')
דוגמאות ( tfds.as_dataframe ):
para_crawl/enda
תיאור תצורה : מערך נתונים של תרגום מאנגלית ל-da.
גודל הורדה :
174.34 MiB
גודל ערכת נתונים:
619.77 MiB
שמירה אוטומטית במטמון ( תיעוד ): לא
פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'train' | 2,414,895 |
- מבנה תכונה :
Translation({
'da': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- תיעוד תכונה :
תכונה | מעמד | צוּרָה | Dtype | תיאור |
---|---|---|---|---|
תִרגוּם | ||||
דה | טֶקסט | חוּט | ||
he | טֶקסט | חוּט |
מפתחות בפיקוח (ראה
as_supervised
doc ):('en', 'da')
דוגמאות ( tfds.as_dataframe ):
para_crawl/ende
תיאור תצורה : מערך נתונים של תרגום מאנגלית ל-de.
גודל הורדה :
1.22 GiB
גודל מערך נתונים :
4.04 GiB
שמירה אוטומטית במטמון ( תיעוד ): לא
פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'train' | 16,264,448 |
- מבנה תכונה :
Translation({
'de': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- תיעוד תכונה :
תכונה | מעמד | צוּרָה | Dtype | תיאור |
---|---|---|---|---|
תִרגוּם | ||||
דה | טֶקסט | חוּט | ||
he | טֶקסט | חוּט |
מפתחות בפיקוח (ראה
as_supervised
doc ):('en', 'de')
דוגמאות ( tfds.as_dataframe ):
para_crawl/enel
תיאור תצורה : מערך נתונים תרגום מאנגלית ל-el.
גודל הורדה :
184.59 MiB
גודל ערכת נתונים:
698.75 MiB
שמירה אוטומטית במטמון ( תיעוד ): לא
פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'train' | 1,985,233 |
- מבנה תכונה :
Translation({
'el': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- תיעוד תכונה :
תכונה | מעמד | צוּרָה | Dtype | תיאור |
---|---|---|---|---|
תִרגוּם | ||||
אל | טֶקסט | חוּט | ||
he | טֶקסט | חוּט |
מפתחות בפיקוח (ראה
as_supervised
doc ):('en', 'el')
דוגמאות ( tfds.as_dataframe ):
para_crawl/enes
תיאור תצורה : מערך נתונים תרגום מאנגלית ל-es.
גודל הורדה :
1.82 GiB
גודל מערך נתונים :
6.23 GiB
שמירה אוטומטית במטמון ( תיעוד ): לא
פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'train' | 21,987,267 |
- מבנה תכונה :
Translation({
'en': Text(shape=(), dtype=string),
'es': Text(shape=(), dtype=string),
})
- תיעוד תכונה :
תכונה | מעמד | צוּרָה | Dtype | תיאור |
---|---|---|---|---|
תִרגוּם | ||||
he | טֶקסט | חוּט | ||
es | טֶקסט | חוּט |
מפתחות בפיקוח (ראה
as_supervised
doc ):('en', 'es')
דוגמאות ( tfds.as_dataframe ):
para_crawl/enet
תיאור תצורה : מערך נתונים של תרגום מאנגלית ל-et.
גודל הורדה :
66.91 MiB
גודל ערכת נתונים:
209.16 MiB
שמור אוטומטי במטמון ( תיעוד ): רק כאשר
shuffle_files=False
(רכבת)פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'train' | 853,422 |
- מבנה תכונה :
Translation({
'en': Text(shape=(), dtype=string),
'et': Text(shape=(), dtype=string),
})
- תיעוד תכונה :
תכונה | מעמד | צוּרָה | Dtype | תיאור |
---|---|---|---|---|
תִרגוּם | ||||
he | טֶקסט | חוּט | ||
et | טֶקסט | חוּט |
מפתחות בפיקוח (ראה
as_supervised
doc ):('en', 'et')
דוגמאות ( tfds.as_dataframe ):
para_crawl/enfi
תיאור תצורה : מערך נתונים של תרגום מאנגלית ל-fi.
גודל הורדה :
151.83 MiB
גודל מערך נתונים :
543.85 MiB
שמירה אוטומטית במטמון ( תיעוד ): לא
פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'train' | 2,156,069 |
- מבנה תכונה :
Translation({
'en': Text(shape=(), dtype=string),
'fi': Text(shape=(), dtype=string),
})
- תיעוד תכונה :
תכונה | מעמד | צוּרָה | Dtype | תיאור |
---|---|---|---|---|
תִרגוּם | ||||
he | טֶקסט | חוּט | ||
fi | טֶקסט | חוּט |
מפתחות בפיקוח (ראה
as_supervised
doc ):('en', 'fi')
דוגמאות ( tfds.as_dataframe ):
para_crawl/enfr
תיאור תצורה : מערך נתונים תרגום מאנגלית ל-fr.
גודל הורדה :
2.63 GiB
גודל מערך נתונים :
9.04 GiB
שמירה אוטומטית במטמון ( תיעוד ): לא
פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'train' | 31,374,161 |
- מבנה תכונה :
Translation({
'en': Text(shape=(), dtype=string),
'fr': Text(shape=(), dtype=string),
})
- תיעוד תכונה :
תכונה | מעמד | צוּרָה | Dtype | תיאור |
---|---|---|---|---|
תִרגוּם | ||||
he | טֶקסט | חוּט | ||
fr | טֶקסט | חוּט |
מפתחות בפיקוח (ראה
as_supervised
doc ):('en', 'fr')
דוגמאות ( tfds.as_dataframe ):
para_crawl/enga
תיאור תצורה : מערך נתונים של תרגום מאנגלית ל-ga.
גודל הורדה :
28.03 MiB
גודל מערך נתונים :
107.09 MiB
שמור אוטומטי במטמון ( תיעוד ): כן
פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'train' | 357,399 |
- מבנה תכונה :
Translation({
'en': Text(shape=(), dtype=string),
'ga': Text(shape=(), dtype=string),
})
- תיעוד תכונה :
תכונה | מעמד | צוּרָה | Dtype | תיאור |
---|---|---|---|---|
תִרגוּם | ||||
he | טֶקסט | חוּט | ||
ga | טֶקסט | חוּט |
מפתחות בפיקוח (ראה
as_supervised
doc ):('en', 'ga')
דוגמאות ( tfds.as_dataframe ):
para_crawl/enhr
תיאור תצורה : מערך נתונים תרגום מאנגלית ל-hr.
גודל הורדה :
80.97 MiB
גודל ערכת נתונים:
256.37 MiB
שמירה אוטומטית במטמון ( תיעוד ): לא
פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'train' | 1,002,053 |
- מבנה תכונה :
Translation({
'en': Text(shape=(), dtype=string),
'hr': Text(shape=(), dtype=string),
})
- תיעוד תכונה :
תכונה | מעמד | צוּרָה | Dtype | תיאור |
---|---|---|---|---|
תִרגוּם | ||||
he | טֶקסט | חוּט | ||
שעה | טֶקסט | חוּט |
מפתחות בפיקוח (ראה
as_supervised
doc ):('en', 'hr')
דוגמאות ( tfds.as_dataframe ):
para_crawl/enhu
תיאור תצורה : מערך נתונים של תרגום מאנגלית ל-hu.
גודל הורדה :
114.24 MiB
גודל מערך נתונים :
421.40 MiB
שמירה אוטומטית במטמון ( תיעוד ): לא
פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'train' | 1,901,342 |
- מבנה תכונה :
Translation({
'en': Text(shape=(), dtype=string),
'hu': Text(shape=(), dtype=string),
})
- תיעוד תכונה :
תכונה | מעמד | צוּרָה | Dtype | תיאור |
---|---|---|---|---|
תִרגוּם | ||||
he | טֶקסט | חוּט | ||
hu | טֶקסט | חוּט |
מפתחות בפיקוח (ראה
as_supervised
doc ):('en', 'hu')
דוגמאות ( tfds.as_dataframe ):
para_crawl/enit
תיאור תצורה : תרגום מערך נתונים מאנגלית אליו.
גודל הורדה :
1017.30 MiB
גודל מערך נתונים :
3.36 GiB
שמירה אוטומטית במטמון ( תיעוד ): לא
פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'train' | 12,162,239 |
- מבנה תכונה :
Translation({
'en': Text(shape=(), dtype=string),
'it': Text(shape=(), dtype=string),
})
- תיעוד תכונה :
תכונה | מעמד | צוּרָה | Dtype | תיאור |
---|---|---|---|---|
תִרגוּם | ||||
he | טֶקסט | חוּט | ||
זה | טֶקסט | חוּט |
מפתחות בפיקוח (ראה
as_supervised
doc ):('en', 'it')
דוגמאות ( tfds.as_dataframe ):
para_crawl/enlt
תיאור תצורה : מערך נתונים תרגום מאנגלית ל-lt.
גודל הורדה :
63.28 MiB
גודל ערכת נתונים:
204.70 MiB
שמור אוטומטי במטמון ( תיעוד ): רק כאשר
shuffle_files=False
(רכבת)פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'train' | 844,643 |
- מבנה תכונה :
Translation({
'en': Text(shape=(), dtype=string),
'lt': Text(shape=(), dtype=string),
})
- תיעוד תכונה :
תכונה | מעמד | צוּרָה | Dtype | תיאור |
---|---|---|---|---|
תִרגוּם | ||||
he | טֶקסט | חוּט | ||
לט | טֶקסט | חוּט |
מפתחות בפיקוח (ראה
as_supervised
doc ):('en', 'lt')
דוגמאות ( tfds.as_dataframe ):
para_crawl/enlv
תיאור תצורה : מערך נתונים תרגום מאנגלית ל-lv.
גודל הורדה :
45.17 MiB
גודל מערך נתונים :
147.09 MiB
שמור אוטומטי במטמון ( תיעוד ): רק כאשר
shuffle_files=False
(רכבת)פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'train' | 553,060 |
- מבנה תכונה :
Translation({
'en': Text(shape=(), dtype=string),
'lv': Text(shape=(), dtype=string),
})
- תיעוד תכונה :
תכונה | מעמד | צוּרָה | Dtype | תיאור |
---|---|---|---|---|
תִרגוּם | ||||
he | טֶקסט | חוּט | ||
lv | טֶקסט | חוּט |
מפתחות בפיקוח (ראה
as_supervised
doc ):('en', 'lv')
דוגמאות ( tfds.as_dataframe ):
para_crawl/enmt
תיאור תצורה : מערך נתונים תרגום מאנגלית ל-mt.
גודל הורדה :
18.15 MiB
גודל ערכת נתונים:
54.36 MiB
שמור אוטומטי במטמון ( תיעוד ): כן
פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'train' | 195,502 |
- מבנה תכונה :
Translation({
'en': Text(shape=(), dtype=string),
'mt': Text(shape=(), dtype=string),
})
- תיעוד תכונה :
תכונה | מעמד | צוּרָה | Dtype | תיאור |
---|---|---|---|---|
תִרגוּם | ||||
he | טֶקסט | חוּט | ||
הר | טֶקסט | חוּט |
מפתחות בפיקוח (ראה
as_supervised
doc ):('en', 'mt')
דוגמאות ( tfds.as_dataframe ):
para_crawl/ennl
תיאור תצורה : מערך נתונים של תרגום מאנגלית ל-nl.
גודל הורדה :
400.63 MiB
גודל מערך נתונים :
1.40 GiB
שמירה אוטומטית במטמון ( תיעוד ): לא
פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'train' | 5,659,268 |
- מבנה תכונה :
Translation({
'en': Text(shape=(), dtype=string),
'nl': Text(shape=(), dtype=string),
})
- תיעוד תכונה :
תכונה | מעמד | צוּרָה | Dtype | תיאור |
---|---|---|---|---|
תִרגוּם | ||||
he | טֶקסט | חוּט | ||
nl | טֶקסט | חוּט |
מפתחות בפיקוח (ראה
as_supervised
doc ):('en', 'nl')
דוגמאות ( tfds.as_dataframe ):
para_crawl/enpl
תיאור תצורה : מערך נתונים של תרגום מאנגלית ל-pl.
גודל הורדה :
257.90 MiB
גודל ערכת נתונים:
885.63 MiB
שמירה אוטומטית במטמון ( תיעוד ): לא
פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'train' | 3,503,276 |
- מבנה תכונה :
Translation({
'en': Text(shape=(), dtype=string),
'pl': Text(shape=(), dtype=string),
})
- תיעוד תכונה :
תכונה | מעמד | צוּרָה | Dtype | תיאור |
---|---|---|---|---|
תִרגוּם | ||||
he | טֶקסט | חוּט | ||
pl | טֶקסט | חוּט |
מפתחות בפיקוח (ראה
as_supervised
doc ):('en', 'pl')
דוגמאות ( tfds.as_dataframe ):
para_crawl/enpt
תיאור תצורה : מערך נתונים תרגום מאנגלית ל- pt.
גודל הורדה :
608.62 MiB
גודל מערך נתונים :
2.05 GiB
שמירה אוטומטית במטמון ( תיעוד ): לא
פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'train' | 8,141,940 |
- מבנה תכונה :
Translation({
'en': Text(shape=(), dtype=string),
'pt': Text(shape=(), dtype=string),
})
- תיעוד תכונה :
תכונה | מעמד | צוּרָה | Dtype | תיאור |
---|---|---|---|---|
תִרגוּם | ||||
he | טֶקסט | חוּט | ||
pt | טֶקסט | חוּט |
מפתחות בפיקוח (ראה
as_supervised
doc ):('en', 'pt')
דוגמאות ( tfds.as_dataframe ):
para_crawl/enro
תיאור תצורה : מערך נתונים של תרגום מאנגלית ל-ro.
גודל הורדה :
153.24 MiB
גודל ערכת נתונים:
534.34 MiB
שמירה אוטומטית במטמון ( תיעוד ): לא
פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'train' | 1,952,043 |
- מבנה תכונה :
Translation({
'en': Text(shape=(), dtype=string),
'ro': Text(shape=(), dtype=string),
})
- תיעוד תכונה :
תכונה | מעמד | צוּרָה | Dtype | תיאור |
---|---|---|---|---|
תִרגוּם | ||||
he | טֶקסט | חוּט | ||
ro | טֶקסט | חוּט |
מפתחות בפיקוח (ראה
as_supervised
doc ):('en', 'ro')
דוגמאות ( tfds.as_dataframe ):
para_crawl/ensk
תיאור תצורה : מערך נתונים תרגום מאנגלית ל-sk.
גודל הורדה :
96.61 MiB
גודל ערכת נתונים:
352.91 MiB
שמירה אוטומטית במטמון ( תיעוד ): לא
פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'train' | 1,591,831 |
- מבנה תכונה :
Translation({
'en': Text(shape=(), dtype=string),
'sk': Text(shape=(), dtype=string),
})
- תיעוד תכונה :
תכונה | מעמד | צוּרָה | Dtype | תיאור |
---|---|---|---|---|
תִרגוּם | ||||
he | טֶקסט | חוּט | ||
sk | טֶקסט | חוּט |
מפתחות בפיקוח (ראה
as_supervised
doc ):('en', 'sk')
דוגמאות ( tfds.as_dataframe ):
para_crawl/ensl
תיאור תצורה : מערך נתונים תרגום מאנגלית ל-SL.
גודל הורדה :
62.02 MiB
גודל ערכת נתונים:
187.66 MiB
שמור אוטומטי במטמון ( תיעוד ): רק כאשר
shuffle_files=False
(רכבת)פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'train' | 660,161 |
- מבנה תכונה :
Translation({
'en': Text(shape=(), dtype=string),
'sl': Text(shape=(), dtype=string),
})
- תיעוד תכונה :
תכונה | מעמד | צוּרָה | Dtype | תיאור |
---|---|---|---|---|
תִרגוּם | ||||
he | טֶקסט | חוּט | ||
sl | טֶקסט | חוּט |
מפתחות בפיקוח (ראה
as_supervised
doc ):('en', 'sl')
דוגמאות ( tfds.as_dataframe ):
para_crawl/ensv
תיאור תצורה : מערך נתונים תרגום מאנגלית ל-sv.
גודל הורדה :
262.76 MiB
גודל מערך נתונים :
905.72 MiB
שמירה אוטומטית במטמון ( תיעוד ): לא
פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'train' | 3,476,729 |
- מבנה תכונה :
Translation({
'en': Text(shape=(), dtype=string),
'sv': Text(shape=(), dtype=string),
})
- תיעוד תכונה :
תכונה | מעמד | צוּרָה | Dtype | תיאור |
---|---|---|---|---|
תִרגוּם | ||||
he | טֶקסט | חוּט | ||
sv | טֶקסט | חוּט |
מפתחות בפיקוח (ראה
as_supervised
doc ):('en', 'sv')
דוגמאות ( tfds.as_dataframe ):