BoostedTreesCalculateBestFeatureSplitV2

kelas akhir publik BoostedTreesCalculateBestFeatureSplitV2

Menghitung keuntungan untuk setiap fitur dan mengembalikan informasi pemisahan terbaik untuk setiap node. Namun, jika tidak ada pemisahan yang ditemukan, maka tidak ada informasi pemisahan yang dikembalikan untuk node tersebut.

Informasi yang dipisahkan adalah ambang batas terbaik (id keranjang), perolehan, dan kontribusi node kiri/kanan per node untuk setiap fitur.

Ada kemungkinan tidak semua node dapat dipecah pada setiap fitur. Oleh karena itu, daftar kemungkinan node dapat berbeda antar fitur. Oleh karena itu, kami mengembalikan `node_ids_list` untuk setiap fitur, yang berisi daftar node yang dapat digunakan untuk dipisahkan oleh fitur ini.

Dengan cara ini, outputnya adalah pemisahan terbaik per fitur dan per node, sehingga nantinya perlu digabungkan untuk menghasilkan pemisahan terbaik untuk setiap node (di antara semua fitur yang mungkin).

Bentuk keluaran kompatibel sedemikian rupa sehingga dimensi pertama semua tensor sama dan sama dengan jumlah kemungkinan node terpisah untuk setiap fitur.

Metode Publik

BoostedTreesCalculateBestFeatureSplitV2 statis
buat ( Lingkup lingkup, Operan <Integer> nodeIdRange, Iterable< Operand <Float>> statsSummariesList, Operan <String> splitTypes, Operan <Integer> kandidatFeatureIds, Operan <Float> l1, Operan <Float> l2, Operan <Float> treeComplexity, Operan <Float> minNodeWeight, LogitsDimension panjang)
Metode pabrik untuk membuat kelas yang membungkus operasi BoostedTreesCalculateBestFeatureSplitV2 baru.
Keluaran <Bilangan Bulat>
fiturDimensi ()
Tensor Peringkat 1 yang menunjukkan dimensi fitur terbaik untuk setiap fitur yang akan dipisahkan untuk node tertentu jika fitur tersebut multidimensi.
Keluaran <Bilangan Bulat>
ID fitur ()
Tensor Peringkat 1 yang menunjukkan id fitur terbaik untuk setiap node.
Keluaran <Mengambang>
keuntungan ()
Tensor Peringkat 1 yang menunjukkan perolehan terbaik untuk setiap fitur yang akan dibagi untuk node tertentu.
Keluaran <Mengambang>
kiriNodeContribs ()
Tensor peringkat 2 yang menunjukkan kontribusi node kiri ketika bercabang dari node induk (diberikan oleh elemen tensor di output node_ids_list) ke arah kiri dengan ambang batas yang diberikan untuk setiap fitur.
Keluaran <Bilangan Bulat>
nodeId ()
Tensor Peringkat 1 yang menunjukkan kemungkinan id node terpisah untuk setiap fitur.
Keluaran <Mengambang>
kananNodeContribs ()
Tensor peringkat 2, dengan bentuk/kondisi yang sama dengan left_node_contribs_list, tetapi nilainya hanya untuk node kanan.
Keluaran <String>
splitDenganDefaultDirections ()
Tensor Peringkat 1 yang menunjukkan arah mana yang harus dituju jika data hilang.
Keluaran <Bilangan Bulat>
ambang batas ()
Tensor Peringkat 1 yang menunjukkan id keranjang yang akan dibandingkan (sebagai ambang batas) untuk pemisahan di setiap node.

Metode Warisan

Metode Publik

public static BoostedTreesCalculateBestFeatureSplitV2 buat ( Lingkup lingkup, Operan <Integer> nodeIdRange, Iterable< Operand <Float>> statsSummariesList, Operand <String> splitTypes, Operand <Integer> kandidatFeatureIds, Operand <Float> l1, Operand <Float> l2, Operand <Float > treeComplexity, Operand <Float> minNodeWeight, LogitsDimension panjang)

Metode pabrik untuk membuat kelas yang membungkus operasi BoostedTreesCalculateBestFeatureSplitV2 baru.

Parameter
cakupan ruang lingkup saat ini
nodeIdRange Tensor Peringkat 1 (bentuk=[2]) untuk menentukan rentang [pertama, terakhir) dari id node yang akan diproses dalam `stats_summary_list`. Node diiterasi antara dua node yang ditentukan oleh tensor, seperti `untuk node_id dalam rentang(node_id_range[0], node_id_range[1])` (Perhatikan bahwa indeks terakhir node_id_range[1] bersifat eksklusif).
statsSummariesList Daftar tensor Peringkat 4 (#shape=[max_splits, feature_dims, bucket, stats_dims]) untuk akumulasi ringkasan statistik (gradien/hessian) per node, per dimensi, per bucket untuk setiap fitur. Dimensi pertama tensor adalah jumlah pemisahan maksimum, sehingga tidak semua elemennya akan digunakan, tetapi hanya indeks yang ditentukan oleh node_ids yang akan digunakan.
tipe terpisah Tensor Peringkat 1 yang menunjukkan apakah Operasi ini harus melakukan pembagian ketidaksetaraan atau pembagian kesetaraan per fitur.
kandidatFeatureIds Beri peringkat 1 tensor dengan id untuk setiap fitur. Ini adalah id sebenarnya dari fitur tersebut.
l1 l1 faktor regularisasi pada bobot daun, berdasarkan per contoh.
l2 l2 faktor regularisasi pada bobot daun, berdasarkan per contoh.
kompleksitas pohon penyesuaian terhadap keuntungan, berdasarkan per daun.
minNodeBerat rata-rata minimum goni dalam sebuah node sebelum diperlukan agar node tersebut dipertimbangkan untuk dipecah.
LogitsDimensi Dimensi logit, yaitu jumlah kelas.
Kembali
  • contoh baru dari BoostedTreesCalculateBestFeatureSplitV2

Output publik <Integer> featureDimensions ()

Tensor Peringkat 1 yang menunjukkan dimensi fitur terbaik untuk setiap fitur yang akan dipisahkan untuk node tertentu jika fitur tersebut multidimensi. Lihat di atas untuk detail seperti bentuk dan ukuran.

Output publik <Integer> featureIds ()

Tensor Peringkat 1 yang menunjukkan id fitur terbaik untuk setiap node. Lihat di atas untuk detail seperti bentuk dan ukuran.

Output publik <Float> keuntungan ()

Tensor Peringkat 1 yang menunjukkan perolehan terbaik untuk setiap fitur yang akan dibagi untuk node tertentu. Lihat di atas untuk detail seperti bentuk dan ukuran.

Keluaran publik <Float> leftNodeContribs ()

Tensor peringkat 2 yang menunjukkan kontribusi node kiri ketika bercabang dari node induk (diberikan oleh elemen tensor di output node_ids_list) ke arah kiri dengan ambang batas yang diberikan untuk setiap fitur. Nilai ini akan digunakan untuk membuat nilai simpul kiri dengan menambahkan nilai simpul induk. Ukuran dimensi kedua adalah 1 untuk logit 1 dimensi, tetapi akan lebih besar untuk masalah kelas jamak. Lihat di atas untuk detail seperti bentuk dan ukuran.

Keluaran publik <Bilangan Bulat> nodeIds ()

Tensor Peringkat 1 yang menunjukkan kemungkinan id node terpisah untuk setiap fitur. Panjang daftarnya adalah num_features, tetapi setiap tensor memiliki ukuran berbeda karena setiap fitur menyediakan kemungkinan node yang berbeda. Lihat di atas untuk detail seperti bentuk dan ukuran.

Keluaran publik <Float> rightNodeContribs ()

Tensor peringkat 2, dengan bentuk/kondisi yang sama dengan left_node_contribs_list, tetapi nilainya hanya untuk node kanan.

Keluaran publik <String> splitWithDefaultDirections ()

Tensor Peringkat 1 yang menunjukkan arah mana yang harus dituju jika data hilang. Lihat di atas untuk detail seperti bentuk dan ukuran. Pertidaksamaan dengan kiri bawaan menghasilkan 0, pertidaksamaan dengan kanan bawaan menghasilkan 1, persamaan dengan kanan bawaan menghasilkan 2.

ambang batas Output publik <Integer> ()

Tensor Peringkat 1 yang menunjukkan id keranjang yang akan dibandingkan (sebagai ambang batas) untuk pemisahan di setiap node. Lihat di atas untuk detail seperti bentuk dan ukuran.