- opis :
Zbiór danych modelowania Criteo Uplift
Ten zbiór danych jest publikowany wraz z artykułem: „A Large Scale Benchmark for Uplift Modeling” Eustache Diemert, Artem Betlei, Christophe Renaudin; (Criteo AI Lab), Massih-Reza Amini (LIG, Grenoble INP)
Ta praca została opublikowana w: Warsztaty AdKDD 2018, w połączeniu z KDD 2018.
Opis danych
Ten zestaw danych jest tworzony poprzez gromadzenie danych wynikających z kilku testów przyrostowych, szczególnej randomizowanej procedury próbnej, w której losowa część populacji nie jest kierowana reklamą. składa się z 25 milionów wierszy, z których każdy reprezentuje użytkownika z 11 cechami, wskaźnikiem leczenia i 2 etykietami (wizyty i konwersje).
Pola
Oto szczegółowy opis pól (w pliku są one oddzielone przecinkami):
- f0, f1, f2, f3, f4, f5, f6, f7, f8, f9, f10, f11: wartości cech (gęsty, zmiennoprzecinkowy)
- leczenie: grupa leczona (1 = leczona, 0 = kontrolna)
- konwersja: czy nastąpiła konwersja dla tego użytkownika (binarna, etykieta)
- wizyta: czy nastąpiła wizyta dla tego użytkownika (binarnie, etykieta)
- ekspozycja: efekt leczenia, czy użytkownik został skutecznie narażony (binarnie)
Kluczowe dane
- Format: CSV
- Rozmiar: 459 MB (skompresowany)
- Rzędy: 25 309 483
- Średni wskaźnik odwiedzin: 0,04132
- Średni współczynnik konwersji: 0,00229
- Współczynnik leczenia: 0,846
Zadania
Zbiór danych został zebrany i przygotowany z myślą o przewidywaniu wypiętrzenia jako głównego zadania. Dodatkowo możemy przewidzieć powiązane zastosowania, takie jak między innymi:
- punkt odniesienia dla wnioskowania przyczynowego
- modelowanie wypiętrzenia
- interakcje między cechami a leczeniem
- niejednorodność leczenia
punkt odniesienia dla obserwacyjnych metod przyczynowości
Dodatkowa dokumentacja : Przeglądaj dokumenty z kodem na
Strona główna : https://ailab.criteo.com/criteo-uplift-prediction-dataset/
Kod źródłowy :
tfds.recommendation.criteo.Criteo
Wersje :
-
1.0.0
: Pierwsza wersja. -
1.0.1
(domyślnie): Naprawiono parsowanie pólconversion
,visit
iexposure
.
-
Rozmiar pliku do pobrania :
297.00 MiB
Rozmiar zestawu danych :
3.55 GiB
Automatyczne buforowanie ( dokumentacja ): Nie
Podziały :
Podział | Przykłady |
---|---|
'train' | 13 979 592 |
- Struktura funkcji :
FeaturesDict({
'conversion': bool,
'exposure': bool,
'f0': float32,
'f1': float32,
'f10': float32,
'f11': float32,
'f2': float32,
'f3': float32,
'f4': float32,
'f5': float32,
'f6': float32,
'f7': float32,
'f8': float32,
'f9': float32,
'treatment': int64,
'visit': bool,
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształtować się | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
konwersja | Napinacz | bool | ||
narażenie | Napinacz | bool | ||
f0 | Napinacz | pływak32 | ||
f1 | Napinacz | pływak32 | ||
f10 | Napinacz | pływak32 | ||
f11 | Napinacz | pływak32 | ||
f2 | Napinacz | pływak32 | ||
f3 | Napinacz | pływak32 | ||
f4 | Napinacz | pływak32 | ||
f5 | Napinacz | pływak32 | ||
f6 | Napinacz | pływak32 | ||
f7 | Napinacz | pływak32 | ||
f8 | Napinacz | pływak32 | ||
f9 | Napinacz | pływak32 | ||
leczenie | Napinacz | int64 | ||
odwiedzić | Napinacz | bool |
Nadzorowane klucze (Patrz
as_supervised
doc ):({'exposure': 'exposure', 'f0': 'f0', 'f1': 'f1', 'f10': 'f10', 'f11': 'f11', 'f2': 'f2', 'f3': 'f3', 'f4': 'f4', 'f5': 'f5', 'f6': 'f6', 'f7': 'f7', 'f8': 'f8', 'f9': 'f9', 'treatment': 'treatment'}, 'visit')
Rysunek ( tfds.show_examples ): Nieobsługiwany.
Przykłady ( tfds.as_dataframe ):
- Cytat :
@inproceedings{Diemert2018,
author = { {Diemert Eustache, Betlei Artem} and Renaudin, Christophe and Massih-Reza, Amini},
title={A Large Scale Benchmark for Uplift Modeling},
publisher = {ACM},
booktitle = {Proceedings of the AdKDD and TargetAd Workshop, KDD, London,United Kingdom, August, 20, 2018},
year = {2018}
}
, - opis :
Zbiór danych modelowania Criteo Uplift
Ten zbiór danych jest publikowany wraz z artykułem: „A Large Scale Benchmark for Uplift Modeling” Eustache Diemert, Artem Betlei, Christophe Renaudin; (Criteo AI Lab), Massih-Reza Amini (LIG, Grenoble INP)
Ta praca została opublikowana w: Warsztaty AdKDD 2018, w połączeniu z KDD 2018.
Opis danych
Ten zestaw danych jest tworzony poprzez gromadzenie danych wynikających z kilku testów przyrostowych, szczególnej randomizowanej procedury próbnej, w której losowa część populacji nie jest kierowana reklamą. składa się z 25 milionów wierszy, z których każdy reprezentuje użytkownika z 11 cechami, wskaźnikiem leczenia i 2 etykietami (wizyty i konwersje).
Pola
Oto szczegółowy opis pól (w pliku są one oddzielone przecinkami):
- f0, f1, f2, f3, f4, f5, f6, f7, f8, f9, f10, f11: wartości cech (gęsty, zmiennoprzecinkowy)
- leczenie: grupa leczona (1 = leczona, 0 = kontrolna)
- konwersja: czy nastąpiła konwersja dla tego użytkownika (binarna, etykieta)
- wizyta: czy nastąpiła wizyta dla tego użytkownika (binarnie, etykieta)
- ekspozycja: efekt leczenia, czy użytkownik został skutecznie narażony (binarnie)
Kluczowe dane
- Format: CSV
- Rozmiar: 459 MB (skompresowany)
- Rzędy: 25 309 483
- Średni wskaźnik odwiedzin: 0,04132
- Średni współczynnik konwersji: 0,00229
- Współczynnik leczenia: 0,846
Zadania
Zbiór danych został zebrany i przygotowany z myślą o przewidywaniu wypiętrzenia jako głównego zadania. Dodatkowo możemy przewidzieć powiązane zastosowania, takie jak między innymi:
- punkt odniesienia dla wnioskowania przyczynowego
- modelowanie wypiętrzenia
- interakcje między cechami a leczeniem
- niejednorodność leczenia
punkt odniesienia dla obserwacyjnych metod przyczynowości
Dodatkowa dokumentacja : Przeglądaj dokumenty z kodem na
Strona główna : https://ailab.criteo.com/criteo-uplift-prediction-dataset/
Kod źródłowy :
tfds.recommendation.criteo.Criteo
Wersje :
-
1.0.0
: Pierwsza wersja. -
1.0.1
(domyślnie): Naprawiono parsowanie pólconversion
,visit
iexposure
.
-
Rozmiar pliku do pobrania :
297.00 MiB
Rozmiar zestawu danych :
3.55 GiB
Automatyczne buforowanie ( dokumentacja ): Nie
Podziały :
Podział | Przykłady |
---|---|
'train' | 13 979 592 |
- Struktura funkcji :
FeaturesDict({
'conversion': bool,
'exposure': bool,
'f0': float32,
'f1': float32,
'f10': float32,
'f11': float32,
'f2': float32,
'f3': float32,
'f4': float32,
'f5': float32,
'f6': float32,
'f7': float32,
'f8': float32,
'f9': float32,
'treatment': int64,
'visit': bool,
})
- Dokumentacja funkcji :
Funkcja | Klasa | Kształtować się | Typ D | Opis |
---|---|---|---|---|
FunkcjeDict | ||||
konwersja | Napinacz | bool | ||
narażenie | Napinacz | bool | ||
f0 | Napinacz | pływak32 | ||
f1 | Napinacz | pływak32 | ||
f10 | Napinacz | pływak32 | ||
f11 | Napinacz | pływak32 | ||
f2 | Napinacz | pływak32 | ||
f3 | Napinacz | pływak32 | ||
f4 | Napinacz | pływak32 | ||
f5 | Napinacz | pływak32 | ||
f6 | Napinacz | pływak32 | ||
f7 | Napinacz | pływak32 | ||
f8 | Napinacz | pływak32 | ||
f9 | Napinacz | pływak32 | ||
leczenie | Napinacz | int64 | ||
odwiedzić | Napinacz | bool |
Nadzorowane klucze (patrz
as_supervised
doc ):({'exposure': 'exposure', 'f0': 'f0', 'f1': 'f1', 'f10': 'f10', 'f11': 'f11', 'f2': 'f2', 'f3': 'f3', 'f4': 'f4', 'f5': 'f5', 'f6': 'f6', 'f7': 'f7', 'f8': 'f8', 'f9': 'f9', 'treatment': 'treatment'}, 'visit')
Rysunek ( tfds.show_examples ): Nieobsługiwany.
Przykłady ( tfds.as_dataframe ):
- Cytat :
@inproceedings{Diemert2018,
author = { {Diemert Eustache, Betlei Artem} and Renaudin, Christophe and Massih-Reza, Amini},
title={A Large Scale Benchmark for Uplift Modeling},
publisher = {ACM},
booktitle = {Proceedings of the AdKDD and TargetAd Workshop, KDD, London,United Kingdom, August, 20, 2018},
year = {2018}
}