kryt

  • opis :

Zbiór danych modelowania Criteo Uplift

Ten zbiór danych jest publikowany wraz z artykułem: „A Large Scale Benchmark for Uplift Modeling” Eustache Diemert, Artem Betlei, Christophe Renaudin; (Criteo AI Lab), Massih-Reza Amini (LIG, Grenoble INP)

Ta praca została opublikowana w: Warsztaty AdKDD 2018, w połączeniu z KDD 2018.

Opis danych

Ten zestaw danych jest tworzony poprzez gromadzenie danych wynikających z kilku testów przyrostowych, szczególnej randomizowanej procedury próbnej, w której losowa część populacji nie jest kierowana reklamą. składa się z 25 milionów wierszy, z których każdy reprezentuje użytkownika z 11 cechami, wskaźnikiem leczenia i 2 etykietami (wizyty i konwersje).

Pola

Oto szczegółowy opis pól (w pliku są one oddzielone przecinkami):

  • f0, f1, f2, f3, f4, f5, f6, f7, f8, f9, f10, f11: wartości cech (gęsty, zmiennoprzecinkowy)
  • leczenie: grupa leczona (1 = leczona, 0 = kontrolna)
  • konwersja: czy nastąpiła konwersja dla tego użytkownika (binarna, etykieta)
  • wizyta: czy nastąpiła wizyta dla tego użytkownika (binarnie, etykieta)
  • ekspozycja: efekt leczenia, czy użytkownik został skutecznie narażony (binarnie)

Kluczowe dane

  • Format: CSV
  • Rozmiar: 459 MB (skompresowany)
  • Rzędy: 25 309 483
  • Średni wskaźnik odwiedzin: 0,04132
  • Średni współczynnik konwersji: 0,00229
  • Współczynnik leczenia: 0,846

Zadania

Zbiór danych został zebrany i przygotowany z myślą o przewidywaniu wypiętrzenia jako głównego zadania. Dodatkowo możemy przewidzieć powiązane zastosowania, takie jak między innymi:

Podział Przykłady
'train' 13 979 592
  • Struktura funkcji :
FeaturesDict({
    'conversion': bool,
    'exposure': bool,
    'f0': float32,
    'f1': float32,
    'f10': float32,
    'f11': float32,
    'f2': float32,
    'f3': float32,
    'f4': float32,
    'f5': float32,
    'f6': float32,
    'f7': float32,
    'f8': float32,
    'f9': float32,
    'treatment': int64,
    'visit': bool,
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształtować się Typ D Opis
FunkcjeDict
konwersja Napinacz bool
narażenie Napinacz bool
f0 Napinacz pływak32
f1 Napinacz pływak32
f10 Napinacz pływak32
f11 Napinacz pływak32
f2 Napinacz pływak32
f3 Napinacz pływak32
f4 Napinacz pływak32
f5 Napinacz pływak32
f6 Napinacz pływak32
f7 Napinacz pływak32
f8 Napinacz pływak32
f9 Napinacz pływak32
leczenie Napinacz int64
odwiedzić Napinacz bool
  • Nadzorowane klucze (Patrz as_supervised doc ): ({'exposure': 'exposure', 'f0': 'f0', 'f1': 'f1', 'f10': 'f10', 'f11': 'f11', 'f2': 'f2', 'f3': 'f3', 'f4': 'f4', 'f5': 'f5', 'f6': 'f6', 'f7': 'f7', 'f8': 'f8', 'f9': 'f9', 'treatment': 'treatment'}, 'visit')

  • Rysunek ( tfds.show_examples ): Nieobsługiwany.

  • Przykłady ( tfds.as_dataframe ):

  • Cytat :
@inproceedings{Diemert2018,
author = { {Diemert Eustache, Betlei Artem} and Renaudin, Christophe and Massih-Reza, Amini},
title={A Large Scale Benchmark for Uplift Modeling},
publisher = {ACM},
booktitle = {Proceedings of the AdKDD and TargetAd Workshop, KDD, London,United Kingdom, August, 20, 2018},
year = {2018}
}
,

  • opis :

Zbiór danych modelowania Criteo Uplift

Ten zbiór danych jest publikowany wraz z artykułem: „A Large Scale Benchmark for Uplift Modeling” Eustache Diemert, Artem Betlei, Christophe Renaudin; (Criteo AI Lab), Massih-Reza Amini (LIG, Grenoble INP)

Ta praca została opublikowana w: Warsztaty AdKDD 2018, w połączeniu z KDD 2018.

Opis danych

Ten zestaw danych jest tworzony poprzez gromadzenie danych wynikających z kilku testów przyrostowych, szczególnej randomizowanej procedury próbnej, w której losowa część populacji nie jest kierowana reklamą. składa się z 25 milionów wierszy, z których każdy reprezentuje użytkownika z 11 cechami, wskaźnikiem leczenia i 2 etykietami (wizyty i konwersje).

Pola

Oto szczegółowy opis pól (w pliku są one oddzielone przecinkami):

  • f0, f1, f2, f3, f4, f5, f6, f7, f8, f9, f10, f11: wartości cech (gęsty, zmiennoprzecinkowy)
  • leczenie: grupa leczona (1 = leczona, 0 = kontrolna)
  • konwersja: czy nastąpiła konwersja dla tego użytkownika (binarna, etykieta)
  • wizyta: czy nastąpiła wizyta dla tego użytkownika (binarnie, etykieta)
  • ekspozycja: efekt leczenia, czy użytkownik został skutecznie narażony (binarnie)

Kluczowe dane

  • Format: CSV
  • Rozmiar: 459 MB (skompresowany)
  • Rzędy: 25 309 483
  • Średni wskaźnik odwiedzin: 0,04132
  • Średni współczynnik konwersji: 0,00229
  • Współczynnik leczenia: 0,846

Zadania

Zbiór danych został zebrany i przygotowany z myślą o przewidywaniu wypiętrzenia jako głównego zadania. Dodatkowo możemy przewidzieć powiązane zastosowania, takie jak między innymi:

Podział Przykłady
'train' 13 979 592
  • Struktura funkcji :
FeaturesDict({
    'conversion': bool,
    'exposure': bool,
    'f0': float32,
    'f1': float32,
    'f10': float32,
    'f11': float32,
    'f2': float32,
    'f3': float32,
    'f4': float32,
    'f5': float32,
    'f6': float32,
    'f7': float32,
    'f8': float32,
    'f9': float32,
    'treatment': int64,
    'visit': bool,
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształtować się Typ D Opis
FunkcjeDict
konwersja Napinacz bool
narażenie Napinacz bool
f0 Napinacz pływak32
f1 Napinacz pływak32
f10 Napinacz pływak32
f11 Napinacz pływak32
f2 Napinacz pływak32
f3 Napinacz pływak32
f4 Napinacz pływak32
f5 Napinacz pływak32
f6 Napinacz pływak32
f7 Napinacz pływak32
f8 Napinacz pływak32
f9 Napinacz pływak32
leczenie Napinacz int64
odwiedzić Napinacz bool
  • Nadzorowane klucze (patrz as_supervised doc ): ({'exposure': 'exposure', 'f0': 'f0', 'f1': 'f1', 'f10': 'f10', 'f11': 'f11', 'f2': 'f2', 'f3': 'f3', 'f4': 'f4', 'f5': 'f5', 'f6': 'f6', 'f7': 'f7', 'f8': 'f8', 'f9': 'f9', 'treatment': 'treatment'}, 'visit')

  • Rysunek ( tfds.show_examples ): Nieobsługiwany.

  • Przykłady ( tfds.as_dataframe ):

  • Cytat :
@inproceedings{Diemert2018,
author = { {Diemert Eustache, Betlei Artem} and Renaudin, Christophe and Massih-Reza, Amini},
title={A Large Scale Benchmark for Uplift Modeling},
publisher = {ACM},
booktitle = {Proceedings of the AdKDD and TargetAd Workshop, KDD, London,United Kingdom, August, 20, 2018},
year = {2018}
}