- opis :
Korpusy równoległe w skali sieciowej dla oficjalnych języków europejskich.
Dodatkowa dokumentacja : Przeglądaj dokumenty z kodem na
Strona główna : https://paracrawl.eu/releases.html
Kod źródłowy :
tfds.datasets.para_crawl.Builder
Wersje :
-
1.2.0
(domyślnie): Brak informacji o wersji.
-
Rysunek ( tfds.show_examples ): Nieobsługiwany.
Cytat :
@misc {paracrawl,
title = "ParaCrawl",
year = "2018",
url = "http://paracrawl.eu/download.html."
}
para_crawl/enbg (domyślna konfiguracja)
Opis konfiguracji : Zestaw danych tłumaczenia z angielskiego na bg.
Rozmiar pliku do pobrania :
98.94 MiB
Rozmiar zestawu danych :
362.46 MiB
Automatyczne buforowanie ( dokumentacja ): Nie
Podziały :
Rozdzielać | Przykłady |
---|---|
'train' | 1 039 885 |
- Struktura funkcji :
Translation({
'bg': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
Tłumaczenie | ||||
bg | Tekst | strunowy | ||
en | Tekst | strunowy |
Nadzorowane klucze (zobacz
as_supervised
doc ):('en', 'bg')
Przykłady ( tfds.as_dataframe ):
para_crawl/encs
Opis konfiguracji : Zestaw danych tłumaczenia z angielskiego na cs.
Rozmiar pliku do pobrania :
187.31 MiB
Rozmiar zestawu danych :
666.34 MiB
Automatyczne buforowanie ( dokumentacja ): Nie
Podziały :
Rozdzielać | Przykłady |
---|---|
'train' | 2 981 949 |
- Struktura funkcji :
Translation({
'cs': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
Tłumaczenie | ||||
cs | Tekst | strunowy | ||
en | Tekst | strunowy |
Nadzorowane klucze (Zobacz
as_supervised
doc ):('en', 'cs')
Przykłady ( tfds.as_dataframe ):
para_crawl/enda
Opis konfiguracji : Zestaw danych tłumaczenia z angielskiego na da.
Rozmiar pliku do pobrania :
174.34 MiB
Rozmiar zbioru danych :
619.77 MiB
Automatyczne buforowanie ( dokumentacja ): Nie
Podziały :
Rozdzielać | Przykłady |
---|---|
'train' | 2414895 |
- Struktura funkcji :
Translation({
'da': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
Tłumaczenie | ||||
da | Tekst | strunowy | ||
en | Tekst | strunowy |
Nadzorowane klucze (zobacz
as_supervised
doc ):('en', 'da')
Przykłady ( tfds.as_dataframe ):
para_crawl/ende
Opis konfiguracji : Zestaw danych tłumaczenia z angielskiego na de.
Rozmiar pliku do pobrania :
1.22 GiB
Rozmiar zestawu danych :
4.04 GiB
Automatyczne buforowanie ( dokumentacja ): Nie
Podziały :
Rozdzielać | Przykłady |
---|---|
'train' | 16 264 448 |
- Struktura funkcji :
Translation({
'de': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
Tłumaczenie | ||||
de | Tekst | strunowy | ||
en | Tekst | strunowy |
Nadzorowane klucze (zobacz
as_supervised
doc ):('en', 'de')
Przykłady ( tfds.as_dataframe ):
para_crawl/enel
Opis konfiguracji : Zestaw danych tłumaczenia z angielskiego na el.
Rozmiar pliku do pobrania :
184.59 MiB
Rozmiar zestawu danych :
698.75 MiB
Automatyczne buforowanie ( dokumentacja ): Nie
Podziały :
Rozdzielać | Przykłady |
---|---|
'train' | 1 985 233 |
- Struktura funkcji :
Translation({
'el': Text(shape=(), dtype=string),
'en': Text(shape=(), dtype=string),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
Tłumaczenie | ||||
el | Tekst | strunowy | ||
en | Tekst | strunowy |
Klucze nadzorowane (zobacz dokument
as_supervised
):('en', 'el')
Przykłady ( tfds.as_dataframe ):
para_crawl/enes
Opis konfiguracji : Zestaw danych tłumaczenia z angielskiego na es.
Rozmiar pliku do pobrania :
1.82 GiB
Rozmiar zestawu danych :
6.23 GiB
Automatyczne buforowanie ( dokumentacja ): Nie
Podziały :
Rozdzielać | Przykłady |
---|---|
'train' | 21 987 267 |
- Struktura funkcji :
Translation({
'en': Text(shape=(), dtype=string),
'es': Text(shape=(), dtype=string),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
Tłumaczenie | ||||
en | Tekst | strunowy | ||
es | Tekst | strunowy |
Nadzorowane klucze (zobacz
as_supervised
doc ):('en', 'es')
Przykłady ( tfds.as_dataframe ):
para_crawl/enet
Opis konfiguracji : Zestaw danych tłumaczenia z angielskiego na et.
Rozmiar pliku do pobrania :
66.91 MiB
Rozmiar zestawu danych :
209.16 MiB
Automatyczne buforowanie ( dokumentacja ): Tylko wtedy, gdy
shuffle_files=False
(pociąg)Podziały :
Rozdzielać | Przykłady |
---|---|
'train' | 853422 |
- Struktura funkcji :
Translation({
'en': Text(shape=(), dtype=string),
'et': Text(shape=(), dtype=string),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
Tłumaczenie | ||||
en | Tekst | strunowy | ||
et | Tekst | strunowy |
Klucze nadzorowane (zobacz dokument
as_supervised
):('en', 'et')
Przykłady ( tfds.as_dataframe ):
para_crawl/enfi
Opis konfiguracji : Zestaw danych tłumaczenia z angielskiego na fi.
Rozmiar pliku do pobrania :
151.83 MiB
Rozmiar zbioru danych :
543.85 MiB
Automatyczne buforowanie ( dokumentacja ): Nie
Podziały :
Rozdzielać | Przykłady |
---|---|
'train' | 2156069 |
- Struktura funkcji :
Translation({
'en': Text(shape=(), dtype=string),
'fi': Text(shape=(), dtype=string),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
Tłumaczenie | ||||
en | Tekst | strunowy | ||
fi | Tekst | strunowy |
Nadzorowane klucze (Zobacz
as_supervised
doc ):('en', 'fi')
Przykłady ( tfds.as_dataframe ):
para_crawl/enfr
Opis konfiguracji : Zestaw danych tłumaczenia z angielskiego na fr.
Rozmiar pliku do pobrania :
2.63 GiB
Rozmiar zestawu danych :
9.04 GiB
Automatyczne buforowanie ( dokumentacja ): Nie
Podziały :
Rozdzielać | Przykłady |
---|---|
'train' | 31 374 161 |
- Struktura funkcji :
Translation({
'en': Text(shape=(), dtype=string),
'fr': Text(shape=(), dtype=string),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
Tłumaczenie | ||||
en | Tekst | strunowy | ||
fr | Tekst | strunowy |
Klucze nadzorowane (zobacz dokument
as_supervised
):('en', 'fr')
Przykłady ( tfds.as_dataframe ):
para_crawl/enga
Opis konfiguracji : Zestaw danych tłumaczenia z angielskiego na ga.
Rozmiar pliku do pobrania :
28.03 MiB
Rozmiar zestawu danych :
107.09 MiB
Automatyczne buforowanie ( dokumentacja ): Tak
Podziały :
Rozdzielać | Przykłady |
---|---|
'train' | 357399 |
- Struktura funkcji :
Translation({
'en': Text(shape=(), dtype=string),
'ga': Text(shape=(), dtype=string),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
Tłumaczenie | ||||
en | Tekst | strunowy | ||
ga | Tekst | strunowy |
Klucze nadzorowane (zobacz dokument
as_supervised
):('en', 'ga')
Przykłady ( tfds.as_dataframe ):
para_crawl/enhr
Opis konfiguracji : Zestaw danych tłumaczenia z angielskiego na hr.
Rozmiar pliku do pobrania :
80.97 MiB
Rozmiar zestawu danych :
256.37 MiB
Automatyczne buforowanie ( dokumentacja ): Nie
Podziały :
Rozdzielać | Przykłady |
---|---|
'train' | 1 002 053 |
- Struktura funkcji :
Translation({
'en': Text(shape=(), dtype=string),
'hr': Text(shape=(), dtype=string),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
Tłumaczenie | ||||
en | Tekst | strunowy | ||
godz | Tekst | strunowy |
Nadzorowane klucze (Zobacz
as_supervised
doc ):('en', 'hr')
Przykłady ( tfds.as_dataframe ):
para_crawl/enhu
Opis konfiguracji : Zestaw danych tłumaczenia z angielskiego na hu.
Rozmiar pliku do pobrania :
114.24 MiB
Rozmiar zestawu danych :
421.40 MiB
Automatyczne buforowanie ( dokumentacja ): Nie
Podziały :
Rozdzielać | Przykłady |
---|---|
'train' | 1 901 342 |
- Struktura funkcji :
Translation({
'en': Text(shape=(), dtype=string),
'hu': Text(shape=(), dtype=string),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
Tłumaczenie | ||||
en | Tekst | strunowy | ||
hu | Tekst | strunowy |
Klucze nadzorowane (zobacz dokument
as_supervised
):('en', 'hu')
Przykłady ( tfds.as_dataframe ):
para_crawl/enit
Opis konfiguracji : Zestaw danych tłumaczenia z angielskiego na to.
Rozmiar pliku do pobrania :
1017.30 MiB
Rozmiar zestawu danych :
3.36 GiB
Automatyczne buforowanie ( dokumentacja ): Nie
Podziały :
Rozdzielać | Przykłady |
---|---|
'train' | 12 162 239 |
- Struktura funkcji :
Translation({
'en': Text(shape=(), dtype=string),
'it': Text(shape=(), dtype=string),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
Tłumaczenie | ||||
en | Tekst | strunowy | ||
to | Tekst | strunowy |
Nadzorowane klucze (Zobacz
as_supervised
doc ):('en', 'it')
Przykłady ( tfds.as_dataframe ):
para_crawl/enlt
Opis konfiguracji : Zestaw danych tłumaczenia z angielskiego na lt.
Rozmiar pliku do pobrania :
63.28 MiB
Rozmiar zestawu danych :
204.70 MiB
Automatyczne buforowanie ( dokumentacja ): Tylko wtedy, gdy
shuffle_files=False
(pociąg)Podziały :
Rozdzielać | Przykłady |
---|---|
'train' | 844643 |
- Struktura funkcji :
Translation({
'en': Text(shape=(), dtype=string),
'lt': Text(shape=(), dtype=string),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
Tłumaczenie | ||||
en | Tekst | strunowy | ||
lt | Tekst | strunowy |
Nadzorowane klucze (Zobacz
as_supervised
doc ):('en', 'lt')
Przykłady ( tfds.as_dataframe ):
para_crawl/enlv
Opis konfiguracji : Zestaw danych tłumaczenia z angielskiego na lv.
Rozmiar pliku do pobrania :
45.17 MiB
Rozmiar zestawu danych :
147.09 MiB
Automatyczne buforowanie ( dokumentacja ): Tylko wtedy, gdy
shuffle_files=False
(pociąg)Podziały :
Rozdzielać | Przykłady |
---|---|
'train' | 553.060 |
- Struktura funkcji :
Translation({
'en': Text(shape=(), dtype=string),
'lv': Text(shape=(), dtype=string),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
Tłumaczenie | ||||
en | Tekst | strunowy | ||
lv | Tekst | strunowy |
Nadzorowane klucze (Zobacz
as_supervised
doc ):('en', 'lv')
Przykłady ( tfds.as_dataframe ):
para_crawl/enmt
Opis konfiguracji : Zestaw danych tłumaczenia z angielskiego na mt.
Rozmiar pliku do pobrania :
18.15 MiB
Rozmiar zestawu danych :
54.36 MiB
Automatyczne buforowanie ( dokumentacja ): Tak
Podziały :
Rozdzielać | Przykłady |
---|---|
'train' | 195502 |
- Struktura funkcji :
Translation({
'en': Text(shape=(), dtype=string),
'mt': Text(shape=(), dtype=string),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
Tłumaczenie | ||||
en | Tekst | strunowy | ||
góra | Tekst | strunowy |
Nadzorowane klucze (Zobacz
as_supervised
doc ):('en', 'mt')
Przykłady ( tfds.as_dataframe ):
para_crawl/ennl
Opis konfiguracji : Zestaw danych tłumaczenia z angielskiego na nl.
Rozmiar pliku do pobrania :
400.63 MiB
Rozmiar zestawu danych :
1.40 GiB
Automatyczne buforowanie ( dokumentacja ): Nie
Podziały :
Rozdzielać | Przykłady |
---|---|
'train' | 5 659 268 |
- Struktura funkcji :
Translation({
'en': Text(shape=(), dtype=string),
'nl': Text(shape=(), dtype=string),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
Tłumaczenie | ||||
en | Tekst | strunowy | ||
nl | Tekst | strunowy |
Klucze nadzorowane (zobacz dokument
as_supervised
):('en', 'nl')
Przykłady ( tfds.as_dataframe ):
para_crawl/enpl
Opis konfiguracji : Zestaw danych do tłumaczenia z angielskiego na pl.
Rozmiar pliku do pobrania :
257.90 MiB
Rozmiar zestawu danych :
885.63 MiB
Automatyczne buforowanie ( dokumentacja ): Nie
Podziały :
Rozdzielać | Przykłady |
---|---|
'train' | 3503276 |
- Struktura funkcji :
Translation({
'en': Text(shape=(), dtype=string),
'pl': Text(shape=(), dtype=string),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
Tłumaczenie | ||||
en | Tekst | strunowy | ||
pl | Tekst | strunowy |
Nadzorowane klucze (Zobacz
as_supervised
doc ):('en', 'pl')
Przykłady ( tfds.as_dataframe ):
para_crawl/enpt
Opis konfiguracji : Zestaw danych do tłumaczenia z angielskiego na pt.
Rozmiar pliku do pobrania :
608.62 MiB
Rozmiar zestawu danych :
2.05 GiB
Automatyczne buforowanie ( dokumentacja ): Nie
Podziały :
Rozdzielać | Przykłady |
---|---|
'train' | 8141940 |
- Struktura funkcji :
Translation({
'en': Text(shape=(), dtype=string),
'pt': Text(shape=(), dtype=string),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
Tłumaczenie | ||||
en | Tekst | strunowy | ||
pkt | Tekst | strunowy |
Nadzorowane klucze (Zobacz
as_supervised
doc ):('en', 'pt')
Przykłady ( tfds.as_dataframe ):
para_crawl/enro
Opis konfiguracji : Zestaw danych tłumaczenia z angielskiego na ro.
Rozmiar pliku do pobrania :
153.24 MiB
Rozmiar zbioru danych :
534.34 MiB
Automatyczne buforowanie ( dokumentacja ): Nie
Podziały :
Rozdzielać | Przykłady |
---|---|
'train' | 1 952 043 |
- Struktura funkcji :
Translation({
'en': Text(shape=(), dtype=string),
'ro': Text(shape=(), dtype=string),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
Tłumaczenie | ||||
en | Tekst | strunowy | ||
ro | Tekst | strunowy |
Klucze nadzorowane (zobacz dokument
as_supervised
):('en', 'ro')
Przykłady ( tfds.as_dataframe ):
para_crawl/ensk
Opis konfiguracji : Zestaw danych tłumaczenia z angielskiego na sk.
Rozmiar pliku do pobrania :
96.61 MiB
Rozmiar zestawu danych :
352.91 MiB
Automatyczne buforowanie ( dokumentacja ): Nie
Podziały :
Rozdzielać | Przykłady |
---|---|
'train' | 1 591 831 |
- Struktura funkcji :
Translation({
'en': Text(shape=(), dtype=string),
'sk': Text(shape=(), dtype=string),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
Tłumaczenie | ||||
en | Tekst | strunowy | ||
sk | Tekst | strunowy |
Nadzorowane klucze (zobacz
as_supervised
doc ):('en', 'sk')
Przykłady ( tfds.as_dataframe ):
para_crawl/enl
Opis konfiguracji : Zestaw danych tłumaczenia z angielskiego na sl.
Rozmiar pliku do pobrania :
62.02 MiB
Rozmiar zestawu danych :
187.66 MiB
Automatyczne buforowanie ( dokumentacja ): Tylko wtedy, gdy
shuffle_files=False
(pociąg)Podziały :
Rozdzielać | Przykłady |
---|---|
'train' | 660161 |
- Struktura funkcji :
Translation({
'en': Text(shape=(), dtype=string),
'sl': Text(shape=(), dtype=string),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
Tłumaczenie | ||||
en | Tekst | strunowy | ||
śl | Tekst | strunowy |
Nadzorowane klucze (Zobacz
as_supervised
doc ):('en', 'sl')
Przykłady ( tfds.as_dataframe ):
para_crawl/env
Opis konfiguracji : Zestaw danych tłumaczenia z angielskiego na sv.
Rozmiar pliku do pobrania :
262.76 MiB
Rozmiar zbioru danych :
905.72 MiB
Automatyczne buforowanie ( dokumentacja ): Nie
Podziały :
Rozdzielać | Przykłady |
---|---|
'train' | 3 476 729 |
- Struktura funkcji :
Translation({
'en': Text(shape=(), dtype=string),
'sv': Text(shape=(), dtype=string),
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształt | Typ D | Opis |
---|---|---|---|---|
Tłumaczenie | ||||
en | Tekst | strunowy | ||
św | Tekst | strunowy |
Nadzorowane klucze (Zobacz
as_supervised
doc ):('en', 'sv')
Przykłady ( tfds.as_dataframe ):