Menghitung keuntungan untuk setiap fitur dan mengembalikan informasi pemisahan terbaik untuk fitur tersebut.
Informasi yang dipisahkan adalah ambang batas terbaik (id keranjang), perolehan, dan kontribusi node kiri/kanan per node untuk setiap fitur.
Ada kemungkinan tidak semua node dapat dipecah pada setiap fitur. Oleh karena itu, daftar kemungkinan node dapat berbeda antar fitur. Oleh karena itu, kami mengembalikan `node_ids_list` untuk setiap fitur, yang berisi daftar node yang dapat digunakan untuk dipisahkan oleh fitur ini.
Dengan cara ini, outputnya adalah pemisahan terbaik per fitur dan per node, sehingga nantinya perlu digabungkan untuk menghasilkan pemisahan terbaik untuk setiap node (di antara semua fitur yang mungkin).
Bentuk keluaran kompatibel sedemikian rupa sehingga dimensi pertama semua tensor sama dan sama dengan jumlah kemungkinan node terpisah untuk setiap fitur.
Kelas Bersarang
kelas | BoostedTreesSparseCalculateBestFeatureSplit.Options | Atribut opsional untuk BoostedTreesSparseCalculateBestFeatureSplit |
Metode Publik
BoostedTreesSparseCalculateBestFeatureSplit statis | buat ( Lingkup lingkup, Operan <Integer> nodeIdRange, Operan <Integer> statsSummaryIndices, Operan <Float> statsSummaryValues, Operan <Integer> statsSummaryShape, Operan <Float> l1, Operan <Float> l2, Operan <Float> treeComplexity, Operan <Float > minNodeWeight, LogitsDimension panjang, Opsi... opsi) Metode pabrik untuk membuat kelas yang membungkus operasi BoostedTreesSparseCalculateBestFeatureSplit baru. |
Keluaran <Bilangan Bulat> | fiturDimensi () Tensor Peringkat 1 yang menunjukkan dimensi fitur terbaik untuk setiap fitur yang akan dipisahkan untuk setiap node. |
Keluaran <Mengambang> | keuntungan () Tensor Peringkat 1 yang menunjukkan perolehan terbaik untuk membagi setiap node. |
Keluaran <Mengambang> | kiriNodeContribs () Tensor peringkat 2 yang menunjukkan kontribusi node kiri ketika bercabang dari node induk ke arah kiri berdasarkan ambang batas yang diberikan untuk setiap fitur. |
Keluaran <Bilangan Bulat> | nodeId () Tensor Peringkat 1 yang menunjukkan kemungkinan id node yang dapat dipisahkan. |
Keluaran <Mengambang> | kananNodeContribs () Tensor peringkat 2, dengan bentuk/kondisi yang sama dengan left_node_contribs_list, tetapi nilainya hanya untuk node kanan. |
BoostedTreesSparseCalculateBestFeatureSplit.Options statis | splitType (String splitType) |
Keluaran <String> | splitDenganDefaultDirections () Tensor Peringkat 1 yang menunjukkan arah mana yang harus dituju jika data hilang. |
Keluaran <Bilangan Bulat> | ambang batas () Tensor Peringkat 1 yang menunjukkan id keranjang yang akan dibandingkan (sebagai ambang batas) untuk pemisahan di setiap node. |
Metode Warisan
Metode Publik
public static BoostedTreesSparseCalculateBestFeatureSplit buat ( Lingkup cakupan, Operan <Integer> nodeIdRange, Operan <Integer> statsSummaryIndices, Operan <Float> statsSummaryValues, Operan <Integer> statsSummaryShape, Operan <Float> l1, Operan <Float> l2, Operan <Float> treeComplexity, Operan <Float> minNodeWeight, LogitsDimension panjang, Opsi... opsi)
Metode pabrik untuk membuat kelas yang membungkus operasi BoostedTreesSparseCalculateBestFeatureSplit baru.
Parameter
cakupan | ruang lingkup saat ini |
---|---|
nodeIdRange | Tensor Peringkat 1 (bentuk=[2]) untuk menentukan rentang [pertama, terakhir) dari id node yang akan diproses dalam `stats_summary_list`. Node diiterasi antara dua node yang ditentukan oleh tensor, seperti `untuk node_id dalam rentang(node_id_range[0], node_id_range[1])` (Perhatikan bahwa indeks terakhir node_id_range[1] bersifat eksklusif). |
statsRingkasanIndeks | Tensor int64 Peringkat 2 dengan bentuk padat [N, 4] (N menentukan jumlah nilai bukan nol) untuk ringkasan statistik akumulasi (gradien/hessian) per node per bucket untuk setiap fitur. Dimensi kedua berisi id simpul, dimensi fitur, id keranjang, dan peredupan statistik. stats dim adalah penjumlahan dari dimensi logit dan dimensi goni, dimensi goni dapat berupa dimensi logit jika digunakan goni diagonal, atau dimensi logit^2 jika digunakan goni penuh. |
statsSummaryValues | Tensor float Peringkat 1 dengan bentuk padat [N] (N menentukan jumlah nilai bukan nol), yang menyediakan nilai untuk setiap elemen dalam ringkasan_indeks. |
statsRingkasanBentuk | Tensor float Peringkat 1 dengan bentuk padat [4], yang menentukan bentuk padat dari tensor renggang, yaitu [jumlah simpul pohon, dimensi fitur, jumlah keranjang, statistik redup]. |
l1 | l1 faktor regularisasi pada bobot daun, berdasarkan per contoh. |
l2 | l2 faktor regularisasi pada bobot daun, berdasarkan per contoh. |
kompleksitas pohon | penyesuaian terhadap keuntungan, berdasarkan per daun. |
minNodeBerat | rata-rata minimum goni dalam sebuah node sebelum diperlukan agar node tersebut dipertimbangkan untuk dipecah. |
LogitsDimensi | Dimensi logit, yaitu jumlah kelas. |
pilihan | membawa nilai atribut opsional |
Kembali
- contoh baru dari BoostedTreesSparseCalculateBestFeatureSplit
Output publik <Integer> featureDimensions ()
Tensor Peringkat 1 yang menunjukkan dimensi fitur terbaik untuk setiap fitur yang akan dipisahkan untuk setiap node.
Output publik <Float> keuntungan ()
Tensor Peringkat 1 yang menunjukkan perolehan terbaik untuk membagi setiap node.
Keluaran publik <Float> leftNodeContribs ()
Tensor peringkat 2 yang menunjukkan kontribusi node kiri ketika bercabang dari node induk ke arah kiri berdasarkan ambang batas yang diberikan untuk setiap fitur. Nilai ini akan digunakan untuk membuat nilai simpul kiri dengan menambahkan nilai simpul induk. Ukuran dimensi kedua adalah dimensi logits.
Keluaran publik <Bilangan Bulat> nodeIds ()
Tensor Peringkat 1 yang menunjukkan kemungkinan id node yang dapat dipisahkan.
Keluaran publik <Float> rightNodeContribs ()
Tensor peringkat 2, dengan bentuk/kondisi yang sama dengan left_node_contribs_list, tetapi nilainya hanya untuk node kanan.
public static BoostedTreesSparseCalculateBestFeatureSplit.Options splitType (String splitType)
Parameter
Tipe terpisah | Sebuah string yang menunjukkan apakah Operasi ini harus melakukan pemisahan ketidaksetaraan atau pemisahan kesetaraan. |
---|
Keluaran publik <String> splitWithDefaultDirections ()
Tensor Peringkat 1 yang menunjukkan arah mana yang harus dituju jika data hilang. Pertidaksamaan dengan kiri bawaan menghasilkan 0, pertidaksamaan dengan kanan bawaan menghasilkan 1, persamaan dengan kanan bawaan menghasilkan 2.
ambang batas Output publik <Integer> ()
Tensor Peringkat 1 yang menunjukkan id keranjang yang akan dibandingkan (sebagai ambang batas) untuk pemisahan di setiap node.