- Descripción :
El Groove MIDI Dataset (GMD) se compone de 13,6 horas de MIDI alineado y audio (sintetizado) de percusión expresiva interpretada por humanos y alineada con el tempo capturada en un kit de batería electrónica Roland TD-11 V-Drum.
Documentación adicional : Explore en Papers With Code
Página de inicio: https://g.co/magenta/groove-dataset
Código fuente :
tfds.datasets.groove.Builder
Versiones :
-
2.0.1
(predeterminado): Sin notas de la versión.
-
Claves supervisadas (Ver
as_supervised
doc ):None
Figura ( tfds.show_examples ): no compatible.
Cita :
@inproceedings{groove2019,
Author = {Jon Gillick and Adam Roberts and Jesse Engel and Douglas Eck and David Bamman},
Title = {Learning to Groove with Inverse Sequence Transformations},
Booktitle = {International Conference on Machine Learning (ICML)}
Year = {2019},
}
groove/full-midionly (configuración predeterminada)
Descripción de la configuración : conjunto de datos de Groove sin audio, sin dividir.
Tamaño de la descarga :
3.11 MiB
Tamaño del conjunto de datos :
5.22 MiB
Almacenamiento automático en caché ( documentación ): Sí
Divisiones :
Separar | Ejemplos |
---|---|
'test' | 129 |
'train' | 897 |
'validation' | 124 |
- Estructura de características :
FeaturesDict({
'bpm': int32,
'drummer': ClassLabel(shape=(), dtype=int64, num_classes=10),
'id': string,
'midi': string,
'style': FeaturesDict({
'primary': ClassLabel(shape=(), dtype=int64, num_classes=18),
'secondary': string,
}),
'time_signature': ClassLabel(shape=(), dtype=int64, num_classes=5),
'type': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
bpm | Tensor | int32 | ||
batería | Etiqueta de clase | int64 | ||
identificación | Tensor | cuerda | ||
midi | Tensor | cuerda | ||
estilo | CaracterísticasDict | |||
estilo/primario | Etiqueta de clase | int64 | ||
estilo/secundario | Tensor | cuerda | ||
Signatura de compás | Etiqueta de clase | int64 | ||
escribe | Etiqueta de clase | int64 |
- Ejemplos ( tfds.as_dataframe ):
surco/completo-16000hz
Descripción de la configuración : conjunto de datos de Groove con audio, sin dividir.
Tamaño de descarga :
4.76 GiB
Tamaño del conjunto de datos :
2.33 GiB
Almacenamiento automático en caché ( documentación ): No
Divisiones :
Separar | Ejemplos |
---|---|
'test' | 124 |
'train' | 846 |
'validation' | 120 |
- Estructura de características :
FeaturesDict({
'audio': Audio(shape=(None,), dtype=float32),
'bpm': int32,
'drummer': ClassLabel(shape=(), dtype=int64, num_classes=10),
'id': string,
'midi': string,
'style': FeaturesDict({
'primary': ClassLabel(shape=(), dtype=int64, num_classes=18),
'secondary': string,
}),
'time_signature': ClassLabel(shape=(), dtype=int64, num_classes=5),
'type': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
audio | Audio | (Ninguna,) | flotar32 | |
bpm | Tensor | int32 | ||
batería | Etiqueta de clase | int64 | ||
identificación | Tensor | cuerda | ||
midi | Tensor | cuerda | ||
estilo | CaracterísticasDict | |||
estilo/primario | Etiqueta de clase | int64 | ||
estilo/secundario | Tensor | cuerda | ||
Signatura de compás | Etiqueta de clase | int64 | ||
escribe | Etiqueta de clase | int64 |
- Ejemplos ( tfds.as_dataframe ):
surco/2bar-midionly
Descripción de la configuración : conjunto de datos de Groove sin audio, dividido en fragmentos de 2 compases.
Tamaño de la descarga :
3.11 MiB
Tamaño del conjunto de datos :
19.59 MiB
Almacenamiento automático en caché ( documentación ): Sí
Divisiones :
Separar | Ejemplos |
---|---|
'test' | 2,204 |
'train' | 18,163 |
'validation' | 2,252 |
- Estructura de características :
FeaturesDict({
'bpm': int32,
'drummer': ClassLabel(shape=(), dtype=int64, num_classes=10),
'id': string,
'midi': string,
'style': FeaturesDict({
'primary': ClassLabel(shape=(), dtype=int64, num_classes=18),
'secondary': string,
}),
'time_signature': ClassLabel(shape=(), dtype=int64, num_classes=5),
'type': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
bpm | Tensor | int32 | ||
batería | Etiqueta de clase | int64 | ||
identificación | Tensor | cuerda | ||
midi | Tensor | cuerda | ||
estilo | CaracterísticasDict | |||
estilo/primario | Etiqueta de clase | int64 | ||
estilo/secundario | Tensor | cuerda | ||
Signatura de compás | Etiqueta de clase | int64 | ||
escribe | Etiqueta de clase | int64 |
- Ejemplos ( tfds.as_dataframe ):
ranura/2bar-16000hz
Descripción de la configuración : conjunto de datos de Groove con audio, dividido en fragmentos de 2 compases.
Tamaño de descarga :
4.76 GiB
Tamaño del conjunto de datos :
4.61 GiB
Almacenamiento automático en caché ( documentación ): No
Divisiones :
Separar | Ejemplos |
---|---|
'test' | 1,873 |
'train' | 14,390 |
'validation' | 2,034 |
- Estructura de características :
FeaturesDict({
'audio': Audio(shape=(None,), dtype=float32),
'bpm': int32,
'drummer': ClassLabel(shape=(), dtype=int64, num_classes=10),
'id': string,
'midi': string,
'style': FeaturesDict({
'primary': ClassLabel(shape=(), dtype=int64, num_classes=18),
'secondary': string,
}),
'time_signature': ClassLabel(shape=(), dtype=int64, num_classes=5),
'type': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
audio | Audio | (Ninguna,) | flotar32 | |
bpm | Tensor | int32 | ||
batería | Etiqueta de clase | int64 | ||
identificación | Tensor | cuerda | ||
midi | Tensor | cuerda | ||
estilo | CaracterísticasDict | |||
estilo/primario | Etiqueta de clase | int64 | ||
estilo/secundario | Tensor | cuerda | ||
Signatura de compás | Etiqueta de clase | int64 | ||
escribe | Etiqueta de clase | int64 |
- Ejemplos ( tfds.as_dataframe ):
surco/4bar-midionly
Descripción de la configuración : conjunto de datos de Groove sin audio, dividido en fragmentos de 4 compases.
Tamaño de la descarga :
3.11 MiB
Tamaño del conjunto de datos :
27.32 MiB
Almacenamiento automático en caché ( documentación ): Sí
Divisiones :
Separar | Ejemplos |
---|---|
'test' | 2,033 |
'train' | 17,261 |
'validation' | 2,121 |
- Estructura de características :
FeaturesDict({
'bpm': int32,
'drummer': ClassLabel(shape=(), dtype=int64, num_classes=10),
'id': string,
'midi': string,
'style': FeaturesDict({
'primary': ClassLabel(shape=(), dtype=int64, num_classes=18),
'secondary': string,
}),
'time_signature': ClassLabel(shape=(), dtype=int64, num_classes=5),
'type': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
bpm | Tensor | int32 | ||
batería | Etiqueta de clase | int64 | ||
identificación | Tensor | cuerda | ||
midi | Tensor | cuerda | ||
estilo | CaracterísticasDict | |||
estilo/primario | Etiqueta de clase | int64 | ||
estilo/secundario | Tensor | cuerda | ||
Signatura de compás | Etiqueta de clase | int64 | ||
escribe | Etiqueta de clase | int64 |
- Ejemplos ( tfds.as_dataframe ):