- 설명 :
전체 이름: 개인화된 치료 효과를 위한 시뮬레이션
R의 Uplift 패키지로 생성됨: https://rdrr.io/cran/uplift/man/sim_pte.html
패키지는 여기에서 다운로드할 수 있습니다: https://cran.r-project.org/src/contrib/Archive/uplift/
다음 코드를 사용하여 R 버전 4.1.2에서 생성된 데이터 세트:
library(uplift)
set.seed(123)
train <- sim_pte(n = 1000, p = 20, rho = 0, sigma = sqrt(2), beta.den = 4)
test <- sim_pte(n = 2000, p = 20, rho = 0, sigma = sqrt(2), beta.den = 4)
train$treat <- ifelse(train$treat == 1, 2, 1)
test$treat <- ifelse(test$treat == 1, 2, 1)
train$y <- ifelse(train$y == 1, 2, 1)
test$y <- ifelse(test$y == 1, 2, 1)
train$ts = NULL
test$ts = NULL
매개변수:
-
n
= 샘플 수 -
p
= 예측 변수의 수 -
ro
= 예측 변수 간의 공분산 -
sigma
= 오류 항의 승수 -
beta.den
= 베타가 1/beta.den으로 축소됨
작성자: 레오 Guelman leo.guelman@gmail.com
소스 코드 :
tfds.datasets.simpte.Builder
버전 :
-
1.0.0
(기본값): 최초 릴리스.
-
다운로드 크기 :
Unknown size
데이터 세트 크기 :
1.04 MiB
수동 다운로드 지침 : 이 데이터 세트는 원본 데이터를 download_config.manual_dir에 수동으로
download_config.manual_dir
해야 합니다(기본값은~/tensorflow_datasets/downloads/manual/
).
학습 데이터: sim_pte_train.csv 및 테스트 데이터: sim_pte_test.csv를 ~/tensorflow_datasets/downloads/manual/에 다운로드하십시오.자동 캐시 ( 문서 ): 예
분할 :
나뉘다 | 예 |
---|---|
'test' | 2,000 |
'train' | 1,000 |
- 기능 구조 :
FeaturesDict({
'X1': float32,
'X10': float32,
'X11': float32,
'X12': float32,
'X13': float32,
'X14': float32,
'X15': float32,
'X16': float32,
'X17': float32,
'X18': float32,
'X19': float32,
'X2': float32,
'X20': float32,
'X3': float32,
'X4': float32,
'X5': float32,
'X6': float32,
'X7': float32,
'X8': float32,
'X9': float32,
'treat': int32,
'y': int32,
})
- 기능 문서 :
특징 | 수업 | 모양 | D타입 | 설명 |
---|---|---|---|---|
풍모Dict | ||||
X1 | 텐서 | float32 | ||
X10 | 텐서 | float32 | ||
X11 | 텐서 | float32 | ||
X12 | 텐서 | float32 | ||
X13 | 텐서 | float32 | ||
X14 | 텐서 | float32 | ||
X15 | 텐서 | float32 | ||
X16 | 텐서 | float32 | ||
X17 | 텐서 | float32 | ||
X18 | 텐서 | float32 | ||
X19 | 텐서 | float32 | ||
X2 | 텐서 | float32 | ||
X20 | 텐서 | float32 | ||
X3 | 텐서 | float32 | ||
X4 | 텐서 | float32 | ||
X5 | 텐서 | float32 | ||
X6 | 텐서 | float32 | ||
X7 | 텐서 | float32 | ||
X8 | 텐서 | float32 | ||
X9 | 텐서 | float32 | ||
치료하다 | 텐서 | int32 | ||
와이 | 텐서 | int32 |
감독된 키 (
as_supervised
문서 참조):({'X1': 'X1', 'X10': 'X10', 'X11': 'X11', 'X12': 'X12', 'X13': 'X13', 'X14': 'X14', 'X15': 'X15', 'X16': 'X16', 'X17': 'X17', 'X18': 'X18', 'X19': 'X19', 'X2': 'X2', 'X20': 'X20', 'X3': 'X3', 'X4': 'X4', 'X5': 'X5', 'X6': 'X6', 'X7': 'X7', 'X8': 'X8', 'X9': 'X9', 'treat': 'treat'}, 'y')
그림 ( tfds.show_examples ): 지원되지 않습니다.
예 ( tfds.as_dataframe ):
- 인용 :
@misc{https://doi.org/10.48550/arxiv.1212.2995,
doi = {10.48550/ARXIV.1212.2995},
url = {https://arxiv.org/abs/1212.2995},
author = {Tian, Lu and Alizadeh, Ash and Gentles, Andrew and Tibshirani, Robert},
keywords = {Methodology (stat.ME), FOS: Computer and information sciences, FOS: Computer and information sciences},
title = {A Simple Method for Detecting Interactions between a Treatment and a Large Number of Covariates},
publisher = {arXiv},
year = {2012},
copyright = {arXiv.org perpetual, non-exclusive license}
}