ljdiscours

  • Descriptif :

Il s'agit d'un ensemble de données vocales du domaine public composé de 13 100 courts extraits audio d'un seul locuteur lisant des passages de 7 livres de non-fiction. Une transcription est fournie pour chaque clip. Les clips varient en longueur de 1 à 10 secondes et ont une durée totale d'environ 24 heures.

Les textes ont été publiés entre 1884 et 1964, et sont dans le domaine public. L'audio a été enregistré en 2016-17 par le projet LibriVox et est également dans le domaine public.

Diviser Exemples
'train' 13 100
  • Structure des fonctionnalités :
FeaturesDict({
    'id': string,
    'speech': Audio(shape=(None,), dtype=int16),
    'text': Text(shape=(), dtype=string),
    'text_normalized': Text(shape=(), dtype=string),
})
  • Documentation des fonctionnalités :
Caractéristique Classer Forme Dtype La description
FonctionnalitésDict
identifiant Tenseur chaîne de caractères
parole l'audio (Aucun,) int16
texte Texte chaîne de caractères
text_normalized Texte chaîne de caractères
  • Citation :
@misc{ljspeech17,
  author       = {Keith Ito},
  title        = {The LJ Speech Dataset},
  howpublished = {\url{https://keithito.com/LJ-Speech-Dataset/} },
  year         = 2017
}