- توضیحات :
مجموعه داده مدلسازی کریتیو ارتقاء
این مجموعه داده همراه با مقاله منتشر شده است: "معیار مقیاس بزرگ برای مدلسازی ارتقاء" Eustache Diemert, Artem Betlei, Christophe Renaudin; (Criteo AI Lab)، مسیح رضا امینی (LIG، Grenoble INP)
این اثر در: کارگاه آموزشی AdKDD 2018، همراه با KDD 2018 منتشر شده است.
توضیحات داده ها
این مجموعه داده با جمعآوری دادههای حاصل از چندین آزمایش افزایشی ساخته میشود، یک روش آزمایشی تصادفی خاص که در آن بخشی تصادفی از جمعیت از هدف قرار گرفتن تبلیغات جلوگیری میشود. این شامل 25 میلیون ردیف است که هر یک نشان دهنده یک کاربر با 11 ویژگی، یک نشانگر درمان و 2 برچسب (بازدید و تبدیل) است.
زمینه های
در اینجا شرح مفصلی از فیلدها آمده است (آنها در فایل با کاما از هم جدا شده اند):
- f0، f1، f2، f3، f4، f5، f6، f7، f8، f9، f10، f11: مقادیر ویژگی (متراکم، شناور)
- درمان: گروه درمان (1 = درمان، 0 = کنترل)
- تبدیل: آیا یک تبدیل برای این کاربر رخ داده است (باینری، برچسب)
- بازدید: آیا بازدیدی برای این کاربر رخ داده است (باینری، برچسب)
- قرار گرفتن در معرض: اثر درمان، اینکه آیا کاربر به طور موثر در معرض قرار گرفته است (دودویی)
ارقام کلیدی
- فرمت: CSV
- حجم: 459 مگابایت (فشرده شده)
- ردیف: 25,309,483
- میانگین نرخ بازدید: 0.04132
- میانگین نرخ تبدیل: 0.00229
- نسبت درمان: 0.846
وظایف
مجموعه داده با پیش بینی افزایش به عنوان وظیفه اصلی جمع آوری و تهیه شد. بهعلاوه، میتوانیم کاربردهای مرتبطی مانند، اما نه محدود به موارد زیر را پیشبینی کنیم:
- معیار برای استنتاج علی
- مدل سازی بالا بردن
- تعامل بین ویژگی ها و درمان
- ناهمگونی درمان
معیار برای روش های علیت مشاهده ای
اسناد اضافی : کاوش در کاغذها با کد
صفحه اصلی : https://ailab.criteo.com/criteo-uplift-prediction-dataset/
کد منبع :
tfds.recommendation.criteo.Criteo
نسخه ها :
-
1.0.0
: انتشار اولیه. -
1.0.1
(پیش فرض): تجزیه فیلدهایconversion
،visit
وexposure
ثابت.
-
حجم دانلود :
297.00 MiB
حجم مجموعه داده :
3.55 GiB
ذخیره خودکار ( اسناد ): خیر
تقسیمات :
شکاف | مثال ها |
---|---|
'train' | 13,979,592 |
- ساختار ویژگی :
FeaturesDict({
'conversion': bool,
'exposure': bool,
'f0': float32,
'f1': float32,
'f10': float32,
'f11': float32,
'f2': float32,
'f3': float32,
'f4': float32,
'f5': float32,
'f6': float32,
'f7': float32,
'f8': float32,
'f9': float32,
'treatment': int64,
'visit': bool,
})
- مستندات ویژگی :
ویژگی | کلاس | شکل | نوع D | شرح |
---|---|---|---|---|
FeaturesDict | ||||
تبدیل | تانسور | بوول | ||
ارائه | تانسور | بوول | ||
f0 | تانسور | float32 | ||
f1 | تانسور | float32 | ||
f10 | تانسور | float32 | ||
f11 | تانسور | float32 | ||
f2 | تانسور | float32 | ||
f3 | تانسور | float32 | ||
f4 | تانسور | float32 | ||
f5 | تانسور | float32 | ||
f6 | تانسور | float32 | ||
f7 | تانسور | float32 | ||
f8 | تانسور | float32 | ||
f9 | تانسور | float32 | ||
رفتار | تانسور | int64 | ||
بازدید کنید | تانسور | بوول |
کلیدهای نظارت شده (مشاهده
as_supervised
doc ):({'exposure': 'exposure', 'f0': 'f0', 'f1': 'f1', 'f10': 'f10', 'f11': 'f11', 'f2': 'f2', 'f3': 'f3', 'f4': 'f4', 'f5': 'f5', 'f6': 'f6', 'f7': 'f7', 'f8': 'f8', 'f9': 'f9', 'treatment': 'treatment'}, 'visit')
شکل ( tfds.show_examples ): پشتیبانی نمی شود.
مثالها ( tfds.as_dataframe ):
- نقل قول :
@inproceedings{Diemert2018,
author = { {Diemert Eustache, Betlei Artem} and Renaudin, Christophe and Massih-Reza, Amini},
title={A Large Scale Benchmark for Uplift Modeling},
publisher = {ACM},
booktitle = {Proceedings of the AdKDD and TargetAd Workshop, KDD, London,United Kingdom, August, 20, 2018},
year = {2018}
}