- Descrição :
O conjunto de dados Groove MIDI (GMD) é composto por 13,6 horas de MIDI alinhado e áudio (sintetizado) de percussão expressiva executada por humanos e alinhada ao tempo, capturada em um kit de bateria eletrônica Roland TD-11 V-Drum.
Documentação Adicional : Explore em Papers With Code
Página inicial : https://g.co/magenta/groove-dataset
Código -fonte:
tfds.datasets.groove.Builder
Versões :
-
2.0.1
(padrão): Sem notas de versão.
-
Chaves supervisionadas (Consulte
as_supervised
doc ):None
Figura ( tfds.show_examples ): Não suportado.
Citação :
@inproceedings{groove2019,
Author = {Jon Gillick and Adam Roberts and Jesse Engel and Douglas Eck and David Bamman},
Title = {Learning to Groove with Inverse Sequence Transformations},
Booktitle = {International Conference on Machine Learning (ICML)}
Year = {2019},
}
groove/full-midionly (configuração padrão)
Descrição da configuração : conjunto de dados do Groove sem áudio, não dividido.
Tamanho do download :
3.11 MiB
Tamanho do conjunto de dados :
5.22 MiB
Cache automático ( documentação ): Sim
Divisões :
Dividir | Exemplos |
---|---|
'test' | 129 |
'train' | 897 |
'validation' | 124 |
- Estrutura de recursos :
FeaturesDict({
'bpm': int32,
'drummer': ClassLabel(shape=(), dtype=int64, num_classes=10),
'id': string,
'midi': string,
'style': FeaturesDict({
'primary': ClassLabel(shape=(), dtype=int64, num_classes=18),
'secondary': string,
}),
'time_signature': ClassLabel(shape=(), dtype=int64, num_classes=5),
'type': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
- Documentação do recurso:
Característica | Classe | Forma | Tipo D | Descrição |
---|---|---|---|---|
RecursosDict | ||||
bpm | tensor | int32 | ||
baterista | ClassLabel | int64 | ||
Eu iria | tensor | corda | ||
midi | tensor | corda | ||
estilo | RecursosDict | |||
estilo/primário | ClassLabel | int64 | ||
estilo/secundário | tensor | corda | ||
time_signature | ClassLabel | int64 | ||
modelo | ClassLabel | int64 |
- Exemplos ( tfds.as_dataframe ):
groove/full-16000hz
Descrição da configuração : Conjunto de dados do Groove com áudio, não dividido.
Tamanho do download :
4.76 GiB
Tamanho do conjunto de dados :
2.33 GiB
Armazenado em cache automaticamente ( documentação ): Não
Divisões :
Dividir | Exemplos |
---|---|
'test' | 124 |
'train' | 846 |
'validation' | 120 |
- Estrutura de recursos :
FeaturesDict({
'audio': Audio(shape=(None,), dtype=float32),
'bpm': int32,
'drummer': ClassLabel(shape=(), dtype=int64, num_classes=10),
'id': string,
'midi': string,
'style': FeaturesDict({
'primary': ClassLabel(shape=(), dtype=int64, num_classes=18),
'secondary': string,
}),
'time_signature': ClassLabel(shape=(), dtype=int64, num_classes=5),
'type': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
- Documentação do recurso:
Característica | Classe | Forma | Tipo D | Descrição |
---|---|---|---|---|
RecursosDict | ||||
áudio | áudio | (Nenhum,) | float32 | |
bpm | tensor | int32 | ||
baterista | ClassLabel | int64 | ||
Eu iria | tensor | corda | ||
midi | tensor | corda | ||
estilo | RecursosDict | |||
estilo/primário | ClassLabel | int64 | ||
estilo/secundário | tensor | corda | ||
time_signature | ClassLabel | int64 | ||
modelo | ClassLabel | int64 |
- Exemplos ( tfds.as_dataframe ):
groove/2bar-midionly
Descrição da configuração : conjunto de dados do Groove sem áudio, dividido em blocos de 2 compassos.
Tamanho do download :
3.11 MiB
Tamanho do conjunto de dados :
19.59 MiB
Cache automático ( documentação ): Sim
Divisões :
Dividir | Exemplos |
---|---|
'test' | 2.204 |
'train' | 18.163 |
'validation' | 2.252 |
- Estrutura de recursos :
FeaturesDict({
'bpm': int32,
'drummer': ClassLabel(shape=(), dtype=int64, num_classes=10),
'id': string,
'midi': string,
'style': FeaturesDict({
'primary': ClassLabel(shape=(), dtype=int64, num_classes=18),
'secondary': string,
}),
'time_signature': ClassLabel(shape=(), dtype=int64, num_classes=5),
'type': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
- Documentação do recurso:
Característica | Classe | Forma | Tipo D | Descrição |
---|---|---|---|---|
RecursosDict | ||||
bpm | tensor | int32 | ||
baterista | ClassLabel | int64 | ||
Eu iria | tensor | corda | ||
midi | tensor | corda | ||
estilo | RecursosDict | |||
estilo/primário | ClassLabel | int64 | ||
estilo/secundário | tensor | corda | ||
time_signature | ClassLabel | int64 | ||
modelo | ClassLabel | int64 |
- Exemplos ( tfds.as_dataframe ):
groove/2bar-16000hz
Descrição da configuração : conjunto de dados Groove com áudio, dividido em blocos de 2 compassos.
Tamanho do download :
4.76 GiB
Tamanho do conjunto de dados :
4.61 GiB
Armazenado em cache automaticamente ( documentação ): Não
Divisões :
Dividir | Exemplos |
---|---|
'test' | 1.873 |
'train' | 14.390 |
'validation' | 2.034 |
- Estrutura de recursos :
FeaturesDict({
'audio': Audio(shape=(None,), dtype=float32),
'bpm': int32,
'drummer': ClassLabel(shape=(), dtype=int64, num_classes=10),
'id': string,
'midi': string,
'style': FeaturesDict({
'primary': ClassLabel(shape=(), dtype=int64, num_classes=18),
'secondary': string,
}),
'time_signature': ClassLabel(shape=(), dtype=int64, num_classes=5),
'type': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
- Documentação do recurso:
Característica | Classe | Forma | Tipo D | Descrição |
---|---|---|---|---|
RecursosDict | ||||
áudio | áudio | (Nenhum,) | float32 | |
bpm | tensor | int32 | ||
baterista | ClassLabel | int64 | ||
Eu iria | tensor | corda | ||
midi | tensor | corda | ||
estilo | RecursosDict | |||
estilo/primário | ClassLabel | int64 | ||
estilo/secundário | tensor | corda | ||
time_signature | ClassLabel | int64 | ||
modelo | ClassLabel | int64 |
- Exemplos ( tfds.as_dataframe ):
groove/4bar-midionly
Descrição da configuração : conjunto de dados do Groove sem áudio, dividido em blocos de 4 compassos.
Tamanho do download :
3.11 MiB
Tamanho do conjunto de dados :
27.32 MiB
Cache automático ( documentação ): Sim
Divisões :
Dividir | Exemplos |
---|---|
'test' | 2.033 |
'train' | 17.261 |
'validation' | 2.121 |
- Estrutura de recursos :
FeaturesDict({
'bpm': int32,
'drummer': ClassLabel(shape=(), dtype=int64, num_classes=10),
'id': string,
'midi': string,
'style': FeaturesDict({
'primary': ClassLabel(shape=(), dtype=int64, num_classes=18),
'secondary': string,
}),
'time_signature': ClassLabel(shape=(), dtype=int64, num_classes=5),
'type': ClassLabel(shape=(), dtype=int64, num_classes=2),
})
- Documentação do recurso:
Característica | Classe | Forma | Tipo D | Descrição |
---|---|---|---|---|
RecursosDict | ||||
bpm | tensor | int32 | ||
baterista | ClassLabel | int64 | ||
Eu iria | tensor | corda | ||
midi | tensor | corda | ||
estilo | RecursosDict | |||
estilo/primário | ClassLabel | int64 | ||
estilo/secundário | tensor | corda | ||
time_signature | ClassLabel | int64 | ||
modelo | ClassLabel | int64 |
- Exemplos ( tfds.as_dataframe ):