Peringatan: API ini tidak digunakan lagi dan akan dihapus di versi TensorFlow mendatang setelah penggantinya stabil.

BoostedTreesSparseCalculateBestFeatureSplit

public class akhir BoostedTreesSparseCalculateBestFeatureSplit

Menghitung keuntungan untuk setiap fitur dan mengembalikan informasi split terbaik untuk fitur tersebut.

Informasi split adalah ambang terbaik (bucket id), keuntungan dan kontribusi node kiri/kanan per node untuk setiap fitur.

Ada kemungkinan tidak semua node dapat dipecah pada setiap fitur. Oleh karena itu, daftar kemungkinan node dapat berbeda di antara fitur-fiturnya. Oleh karena itu, kami mengembalikan `node_ids_list` untuk setiap fitur, yang berisi daftar node yang dapat digunakan untuk memisahkan fitur ini.

Dengan cara ini, outputnya adalah split terbaik per fitur dan per node, sehingga perlu digabungkan nanti untuk menghasilkan split terbaik untuk setiap node (di antara semua fitur yang mungkin).

Bentuk output kompatibel sedemikian rupa sehingga dimensi pertama dari semua tensor adalah sama dan sama dengan jumlah node split yang mungkin untuk setiap fitur.

Kelas Bersarang

kelas BoostedTreesSparseCalculateBestFeatureSplit.Options Atribut opsional untuk BoostedTreesSparseCalculateBestFeatureSplit

Metode Publik

statis BoostedTreesSparseCalculateBestFeatureSplit
membuat ( Lingkup lingkup, Operan <Integer> nodeIdRange, Operan <Integer> statsSummaryIndices, Operan <Lampung> statsSummaryValues, Operan <Integer> statsSummaryShape, Operan <Lampung> l1, Operan <Lampung> l2, Operan <Lampung> treeComplexity, Operan <Lampung > minNodeWeight, Long logitsDimension, Options ... pilihan)
Metode pabrik untuk membuat kelas yang membungkus operasi BoostedTreesSparseCalculateBestFeatureSplit baru.
Output <Integer>
featureDimensions ()
Tensor Peringkat 1 yang menunjukkan dimensi fitur terbaik untuk setiap fitur yang akan dipisah untuk setiap node.
Output <Lampung>
keuntungan ()
Tensor Peringkat 1 yang menunjukkan perolehan terbaik untuk membagi setiap node.
Output <Lampung>
leftNodeContribs ()
Tensor Peringkat 2 yang menunjukkan kontribusi simpul kiri saat bercabang dari simpul induk ke arah kiri dengan ambang batas yang diberikan untuk setiap fitur.
Output <Integer>
nodeIds ()
Tensor Peringkat 1 yang menunjukkan kemungkinan id simpul yang dapat dipisah.
Output <Lampung>
rightNodeContribs ()
Tensor Peringkat 2, dengan bentuk/kondisi yang sama dengan left_node_contribs_list, tetapi nilainya hanya untuk node kanan.
statis BoostedTreesSparseCalculateBestFeatureSplit.Options
splitType (String splitType)
Output <String>
splitWithDefaultDirections ()
Tensor Peringkat 1 yang menunjukkan arah mana yang harus dituju jika data tidak ada.
Output <Integer>
ambang batas ()
Tensor Peringkat 1 yang menunjukkan id bucket untuk dibandingkan dengan (sebagai ambang batas) untuk pemisahan di setiap node.

Metode yang Diwarisi

Metode Publik

public static BoostedTreesSparseCalculateBestFeatureSplit membuat ( Scope lingkup, Operan <Integer> nodeIdRange, Operan <Integer> statsSummaryIndices, Operan <Lampung> statsSummaryValues, Operan <Integer> statsSummaryShape, Operan <Lampung> l1, Operan <Lampung> l2, Operan <Lampung> treeComplexity, operan <Lampung> minNodeWeight, Long logitsDimension, Options ... pilihan)

Metode pabrik untuk membuat kelas yang membungkus operasi BoostedTreesSparseCalculateBestFeatureSplit baru.

Parameter
cakupan lingkup saat ini
nodeIdRange Tensor Peringkat 1 (bentuk=[2]) untuk menentukan rentang [pertama, terakhir) id node yang akan diproses dalam `stats_summary_list`. Node diulang di antara dua node yang ditentukan oleh tensor, seperti `untuk node_id dalam range(node_id_range[0], node_id_range[1])` (Perhatikan bahwa indeks terakhir node_id_range[1] eksklusif).
statsSummaryIndices Tensor int64 peringkat 2 bentuk padat [N, 4] (N menentukan jumlah nilai bukan nol) untuk akumulasi ringkasan statistik (gradien/hessian) per node per bucket untuk setiap fitur. Dimensi kedua berisi id node, dimensi fitur, id bucket, dan stats redup. stats dim adalah jumlah dari dimensi logit dan dimensi goni, dimensi goni dapat berupa dimensi logit jika goni diagonal digunakan, atau dimensi logit^2 jika goni penuh digunakan.
statsRingkasanNilai Tensor float peringkat 1 berbentuk padat [N] (N menentukan jumlah nilai bukan nol), yang memasok nilai untuk setiap elemen dalam ringkasan_index.
statsRingkasanBentuk Tensor float peringkat 1 bentuk padat [4], yang menentukan bentuk padat tensor jarang, yaitu [jumlah node pohon, dimensi fitur, jumlah ember, statistik redup].
l1 l1 faktor regularisasi pada bobot daun, berdasarkan contoh.
l2 l2 faktor regularisasi pada bobot daun, berdasarkan contoh.
kompleksitas pohon penyesuaian untuk keuntungan, per daun berbasis.
minNodeWeight rata-rata minimum hessians dalam sebuah node sebelum diperlukan agar node dipertimbangkan untuk dipecah.
LogitsDimensi Dimensi logit, yaitu jumlah kelas.
pilihan membawa nilai atribut opsional
Kembali
  • contoh baru BoostedTreesSparseCalculateBestFeatureSplit

publik Keluaran <Integer> featureDimensions ()

Tensor Peringkat 1 yang menunjukkan dimensi fitur terbaik untuk setiap fitur yang akan dipisah untuk setiap node.

publik Keluaran <Lampung> keuntungan ()

Tensor Peringkat 1 yang menunjukkan perolehan terbaik untuk membagi setiap node.

publik Keluaran <Lampung> leftNodeContribs ()

Tensor Peringkat 2 yang menunjukkan kontribusi simpul kiri saat bercabang dari simpul induk ke arah kiri dengan ambang batas yang diberikan untuk setiap fitur. Nilai ini akan digunakan untuk membuat nilai simpul kiri dengan menambahkan nilai simpul induk. Ukuran dimensi kedua adalah dimensi logit.

publik Keluaran <Integer> nodeIds ()

Tensor Peringkat 1 yang menunjukkan kemungkinan id simpul yang dapat dipisah.

publik Keluaran <Lampung> rightNodeContribs ()

Tensor Peringkat 2, dengan bentuk/kondisi yang sama dengan left_node_contribs_list, tetapi nilainya hanya untuk node kanan.

public static BoostedTreesSparseCalculateBestFeatureSplit.Options splitType (String splitType)

Parameter
splitType Sebuah string yang menunjukkan apakah Op ini harus melakukan pembagian ketidaksetaraan atau pemerataan.

publik Keluaran <String> splitWithDefaultDirections ()

Tensor Peringkat 1 yang menunjukkan arah mana yang harus dituju jika data tidak ada. Pertidaksamaan dengan pengembalian kiri default 0, ketidaksetaraan dengan pengembalian kanan default 1, kesetaraan dengan pengembalian kanan default 2.

publik Keluaran <Integer> ambang batas ()

Tensor Peringkat 1 yang menunjukkan id bucket untuk dibandingkan (sebagai ambang batas) untuk pemisahan di setiap node.