Peringatan: API ini tidak digunakan lagi dan akan dihapus di versi TensorFlow mendatang setelah penggantinya stabil.

BoostedTreesCalculateBestGainsPerFeature

public class akhir BoostedTreesCalculateBestGainsPerFeature

Menghitung keuntungan untuk setiap fitur dan mengembalikan informasi split terbaik untuk fitur tersebut.

Informasi split adalah ambang terbaik (bucket id), keuntungan dan kontribusi node kiri/kanan per node untuk setiap fitur.

Ada kemungkinan tidak semua node dapat dipecah pada setiap fitur. Oleh karena itu, daftar kemungkinan node dapat berbeda di antara fitur-fiturnya. Oleh karena itu, kami mengembalikan `node_ids_list` untuk setiap fitur, yang berisi daftar node yang dapat digunakan untuk memisahkan fitur ini.

Dengan cara ini, outputnya adalah split terbaik per fitur dan per node, sehingga perlu digabungkan nanti untuk menghasilkan split terbaik untuk setiap node (di antara semua fitur yang mungkin).

Panjang daftar keluaran semuanya memiliki panjang yang sama, `jumlah_fitur`. Bentuk output kompatibel sedemikian rupa sehingga dimensi pertama dari semua tensor dari semua daftar adalah sama dan sama dengan jumlah node split yang mungkin untuk setiap fitur.

Metode Publik

statis BoostedTreesCalculateBestGainsPerFeature
membuat ( Lingkup lingkup, Operan <Integer> nodeIdRange, Iterable < Operan <Lampung >> statsSummaryList, Operan <Lampung> l1, Operan <Lampung> l2, Operan <Lampung> treeComplexity, Operan <Lampung> minNodeWeight, Long maxSplits)
Metode pabrik untuk membuat kelas yang membungkus operasi BoostedTreesCalculateBestGainsPerFeature baru.
Daftar < Keluaran <Lampung >>
gainsList ()
Daftar keluaran tensor Peringkat 1 yang menunjukkan perolehan terbaik untuk setiap fitur untuk dipisah untuk node tertentu.
Daftar < Keluaran <Lampung >>
leftNodeContribsList ()
Daftar tensor Peringkat 2 yang menunjukkan kontribusi node kiri saat bercabang dari node induk (diberikan oleh elemen tensor dalam output node_ids_list) ke arah kiri oleh ambang batas yang diberikan untuk setiap fitur.
Daftar < Keluaran <Integer >>
nodeIdsList ()
Daftar keluaran tensor Peringkat 1 yang menunjukkan kemungkinan id node terpisah untuk setiap fitur.
Daftar < Keluaran <Lampung >>
rightNodeContribsList ()
Daftar tensor Peringkat 2, dengan bentuk/kondisi yang sama dengan left_node_contribs_list, tetapi nilainya hanya untuk node kanan.
Daftar < Keluaran <Integer >>
thresholdsList ()
Daftar keluaran tensor Peringkat 1 yang menunjukkan id bucket untuk dibandingkan (sebagai ambang batas) untuk pemisahan di setiap node.

Metode yang Diwarisi

Metode Publik

public static BoostedTreesCalculateBestGainsPerFeature membuat ( Scope lingkup, Operan <Integer> nodeIdRange, Iterable < Operan <Lampung >> statsSummaryList, Operan <Lampung> l1, Operan <Lampung> l2, Operan <Lampung> treeComplexity, Operan <Lampung> minNodeWeight, Long maxSplits)

Metode pabrik untuk membuat kelas yang membungkus operasi BoostedTreesCalculateBestGainsPerFeature baru.

Parameter
cakupan lingkup saat ini
nodeIdRange Tensor Peringkat 1 (bentuk=[2]) untuk menentukan rentang [pertama, terakhir) id node yang akan diproses dalam `stats_summary_list`. Node diulang di antara dua node yang ditentukan oleh tensor, seperti `untuk node_id dalam range(node_id_range[0], node_id_range[1])` (Perhatikan bahwa indeks terakhir node_id_range[1] eksklusif).
statsSummaryList Daftar tensor Peringkat 3 (#shape=[max_splits, bucket, 2]) untuk akumulasi ringkasan statistik (gradien/hessian) per node per bucket untuk setiap fitur. Dimensi pertama dari tensor adalah jumlah maksimum pemisahan, dan dengan demikian tidak semua elemennya akan digunakan, tetapi hanya indeks yang ditentukan oleh node_ids yang akan digunakan.
l1 l1 faktor regularisasi pada bobot daun, berdasarkan contoh.
l2 l2 faktor regularisasi pada bobot daun, berdasarkan contoh.
kompleksitas pohon penyesuaian untuk keuntungan, per daun berbasis.
minNodeWeight rata-rata minimum hessians dalam sebuah node sebelum diperlukan agar node dipertimbangkan untuk dipecah.
maxSplits jumlah node yang dapat dibagi di seluruh pohon. Digunakan sebagai dimensi tensor keluaran.
Kembali
  • contoh baru BoostedTreesCalculateBestGainsPerFeature

public List < Keluaran <Lampung >> gainsList ()

Daftar keluaran tensor Peringkat 1 yang menunjukkan perolehan terbaik untuk setiap fitur untuk dipisah untuk node tertentu. Lihat di atas untuk detail seperti bentuk dan ukuran.

public List < Keluaran <Lampung >> leftNodeContribsList ()

Daftar tensor Peringkat 2 yang menunjukkan kontribusi node kiri saat bercabang dari node induk (diberikan oleh elemen tensor dalam output node_ids_list) ke arah kiri oleh ambang batas yang diberikan untuk setiap fitur. Nilai ini akan digunakan untuk membuat nilai simpul kiri dengan menambahkan nilai simpul induk. Ukuran dimensi kedua adalah 1 untuk logit 1 dimensi, tetapi akan lebih besar untuk masalah multi-kelas. Lihat di atas untuk detail seperti bentuk dan ukuran.

public List < Keluaran <Integer >> nodeIdsList ()

Daftar keluaran tensor Peringkat 1 yang menunjukkan kemungkinan id node terpisah untuk setiap fitur. Panjang daftar adalah num_features, tetapi setiap tensor memiliki ukuran yang berbeda karena setiap fitur menyediakan kemungkinan node yang berbeda. Lihat di atas untuk detail seperti bentuk dan ukuran.

public List < Keluaran <Lampung >> rightNodeContribsList ()

Daftar tensor Peringkat 2, dengan bentuk/kondisi yang sama dengan left_node_contribs_list, tetapi nilainya hanya untuk node kanan.

public List < Keluaran <Integer >> thresholdsList ()

Daftar keluaran tensor Peringkat 1 yang menunjukkan id bucket untuk dibandingkan (sebagai ambang batas) untuk pemisahan di setiap node. Lihat di atas untuk detail seperti bentuk dan ukuran.