user_libri_text

opis :

UserLibri to zestaw danych zawierający sparowane transkrypcje audio i dodatkowe dane tekstowe dla każdego ze 107 użytkowników. Jest to przeformatowanie zbioru danych LibriSpeech znajdującego się pod adresem http://www.openslr.org/12, reorganizacja danych według użytkowników ze średnią 52 wypowiedziami LibriSpeech i około 6700 przykładowymi zdaniami tekstowymi na użytkownika. Klasa UserLibriAudio zapewnia dostęp do par transkrypcji audio. Zobacz UserLibriText, aby uzyskać dodatkowe dane tekstowe.

Strona główna : https://www.kaggle.com/datasets/google/userlibri
Kod źródłowy : tfds.text.userlibri_lm_data.UserLibriText
Wersje :
- 1.0.0 (domyślnie): Brak informacji o wersji.
Rozmiar pliku do pobrania : Unknown size
Rozmiar zestawu danych : 86.86 MiB
Automatyczne buforowanie ( dokumentacja ): Tak
Podziały :

Rozdzielać	Przykłady
`'10136'`	38496
`'1041'`	970
`'10540'`	3283
`'108'`	5864
`'11'`	1348
`'11667'`	3312
`'1184'`	22062
`'12176'`	1467
`'12434'`	2796
`'12544'`	4080
`'13110'`	2634
`'13158'`	3440
`'13441'`	4145
`'135'`	37263
`'1353'`	4889
`'1399'`	18 914
`'14420'`	6950
`'14566'`	3810
`'1477'`	2526
`'14958'`	1495
`'15263'`	21085
`'15265'`	7647
`'1549'`	5439
`'1572'`	2882
`'1597'`	3586
`'1608'`	3605
`'16127'`	3588
`'16653'`	7600
`'18096'`	2384
`'1827'`	4806
`'19019'`	3248
`'19215'`	13542
`'19717'`	3762
`'1989'`	1105
`'1998'`	8923
`'20019'`	966
`'2002'`	239
`'20212'`	3363
`'209'`	2090
`'21297'`	4165
`'22002'`	4044
`'2300'`	22201
`'24'`	3537
`'24585'`	1789
`'24811'`	2399
`'2488'`	8239
`'2529'`	3934
`'26177'`	3598
`'26379'`	379
`'2681'`	8872
`'27067'`	3149
`'27090'`	3217
`'2770'`	3750
`'2787'`	4603
`'28700'`	5547
`'28725'`	3899
`'28952'`	2909
`'2981'`	54305
`'3076'`	7124
`'30905'`	2140
`'3178'`	8454
`'33'`	3569
`'33800'`	5145
`'3436'`	5899
`'3440'`	5087
`'3441'`	6042
`'36508'`	521
`'3748'`	4767
`'38675'`	2696
`'38804'`	5653
`'39159'`	2729
`'4028'`	9633
`'40359'`	7821
`'41326'`	6181
`'4217'`	6003
`'4276'`	10461
`'434'`	4319
`'4602'`	4421
`'507'`	9093
`'540'`	5452
`'5516'`	4963
`'5630'`	1130
`'574'`	452
`'5921'`	6040
`'6328'`	5926
`'6812'`	5839
`'732'`	22971
`'76'`	6454
`'7891'`	1476
`'8166'`	3190
`'820'`	11054
`'833'`	3638
`'9189'`	8387
`'94'`	1722
`'940'`	6172
`'9464'`	1695
`'955'`	3051
`'969'`	7799
`'9983'`	8898

Struktura funkcji :

FeaturesDict({
    'book_id': Text(shape=(), dtype=string),
    'text': Text(shape=(), dtype=string),
})

Dokumentacja funkcji :

Funkcja	Klasa	Typ D	Opis
	FunkcjeDict
identyfikator_książki	Tekst	strunowy	Książka, z której pochodzi ten tekst
tekst	Tekst	strunowy	Zdanie tekstu zaczerpnięte z książki

Nadzorowane klucze (Zobacz as_supervised doc ): ('text', 'text')
Rysunek ( tfds.show_examples ): Nieobsługiwany.
Przykłady ( tfds.as_dataframe ):

Cytat :

@inproceedings{breiner2022userlibri,
  title={UserLibri: A Dataset for ASR Personalization Using Only Text},
  author={Breiner, Theresa and Ramaswamy, Swaroop and Variani, Ehsan and Garg, Shefali and Mathews, Rajiv and Sim, Khe Chai and Gupta, Kilol and Chen, Mingqing and McConnaughey, Lara},
  booktitle={Proc. Interspeech 2022},
  year={2022}
}

user_libri_text Zadbaj o dobrą organizację dzięki kolekcji Zapisuj i kategoryzuj treści zgodnie ze swoimi preferencjami.

user_libri_text