รวมสรุปสถิติสะสมสำหรับแบตช์
สถิติสรุปประกอบด้วยการไล่ระดับสีและเฮสเซียนที่สะสมสำหรับแต่ละโหนด ที่เก็บข้อมูล และรหัสมิติ
วิธีการสาธารณะ
BoostedTreesSparseAggregateStats แบบคงที่ | สร้าง (ขอบเขต ขอบเขต , ตัวดำเนินการ <Integer> nodeIds, ตัวดำเนินการ <Float> การไล่ระดับสี, ตัวดำเนินการ <Float> hessians, ตัวดำเนินการ <Integer> คุณลักษณะดัชนี, ตัวดำเนินการ <Integer> คุณลักษณะค่า, ตัวดำเนินการ <Integer> คุณลักษณะรูปร่าง, ยาว maxSplits, ยาว numBuckets) วิธีการจากโรงงานเพื่อสร้างคลาสที่ห่อการดำเนินการ BoostedTreesSparseAggregateStats ใหม่ |
เอาต์พุต <จำนวนเต็ม> | สถิติสรุปดัชนี () int32; อันดับ 2 ดัชนีของเทนเซอร์แบบกระจายสรุป (รูปร่าง=[จำนวนสถิติที่ไม่ใช่ศูนย์, 4]) แกนที่สองสามารถมีได้เพียง 4 เท่านั้น รวมถึงรหัสโหนด มิติข้อมูลคุณลักษณะ รหัสบัคเก็ต และสถิติสถิติ |
เอาต์พุต <จำนวนเต็ม> | สถิติสรุปรูปร่าง () เอาท์พุตอันดับ 1 เทนเซอร์ (รูปร่าง=[4]) เทนเซอร์มีค่า 4 ค่าต่อไปนี้: [max_splits, คุณลักษณะ_มิติ, num_buckets, สถิติ_มิติ] โดยที่statistics_digim = ลาด_มิติ + hessian_มิติ |
เอาท์พุต <โฟลต> | สถิติสรุปค่า () เอาท์พุตอันดับ 1 เทนเซอร์ (รูปร่าง=[จำนวนสถิติที่ไม่ใช่ศูนย์]) |
วิธีการสืบทอด
วิธีการสาธารณะ
BoostedTreesSparseAggregateStats แบบคงที่สาธารณะ สร้าง (ขอบเขต ขอบเขต , ตัวดำเนินการ <Integer> nodeIds, ตัวดำเนินการ <Float> การไล่ระดับสี, ตัวดำเนินการ <Float> hessians, ตัวดำเนินการ <Integer> คุณลักษณะดัชนี, ตัวดำเนินการ <Integer> คุณลักษณะค่า, ตัวดำเนินการ <Integer> คุณลักษณะรูปร่าง, ยาว maxSplits, numBuckets แบบยาว)
วิธีการจากโรงงานเพื่อสร้างคลาสที่ห่อการดำเนินการ BoostedTreesSparseAggregateStats ใหม่
พารามิเตอร์
ขอบเขต | ขอบเขตปัจจุบัน |
---|---|
nodeIds | int32; อันดับ 1 เทนเซอร์ที่มีรหัสโหนดสำหรับแต่ละตัวอย่าง รูปร่าง [batch_size] |
การไล่ระดับสี | ลอย32; อันดับ 2 เทนเซอร์ (shape=[batch_size, logits_daiment]) พร้อมการไล่ระดับสีสำหรับแต่ละตัวอย่าง |
เฮสเซียน | ลอย32; อันดับ 2 เทนเซอร์ (shape=[batch_size, hessian_size]) พร้อมด้วยเฮสเซียนสำหรับแต่ละตัวอย่าง |
คุณลักษณะดัชนี | int32; ดัชนีคุณลักษณะอันดับ 2 ของเทนเซอร์แบบกระจัดกระจาย (รูปร่าง=[จำนวนรายการกระจัดกระจาย, 2]) จำนวนรายการที่กระจัดกระจายในทุกอินสแตนซ์จากแบตช์ ค่าแรกคือดัชนีของอินสแตนซ์ ค่าที่สองคือมิติของคุณลักษณะ แกนที่สองจะมีได้เพียง 2 ค่าเท่านั้น กล่าวคือ เทนเซอร์เวอร์ชันอินพุตหนาแน่นสามารถเป็นได้เพียงเมทริกซ์เท่านั้น |
ค่าคุณลักษณะ | int32; ค่าอันดับ 1 ของฟีเจอร์ sparse Tensors (รูปร่าง=[จำนวนรายการกระจัดกระจาย]) จำนวนรายการที่กระจัดกระจายในทุกอินสแตนซ์จากแบตช์ ค่าแรกคือดัชนีของอินสแตนซ์ ค่าที่สองคือมิติของคุณลักษณะ |
ลักษณะรูปร่าง | int32; รูปร่างหนาแน่นอันดับที่ 1 ของฟีเจอร์กระจัดกระจายเทนเซอร์ (รูปร่าง=[2]) แกนแรกจะมีได้เพียง 2 ค่าเท่านั้น [batch_size, คุณลักษณะ_มิติ] |
แม็กซ์สปลิท | อินท์; จำนวนการแยกสูงสุดที่เป็นไปได้ในทั้งแผนผัง |
numBuckets | อินท์; เท่ากับค่าสูงสุดที่เป็นไปได้ของฟีเจอร์ที่เก็บข้อมูล + 1 |
การส่งคืน
- อินสแตนซ์ใหม่ของ BoostedTreesSparseAggregateStats
สาธารณะ เอาท์พุท <จำนวนเต็ม> statsSummaryIndices ()
int32; อันดับ 2 ดัชนีของเทนเซอร์แบบกระจายสรุป (รูปร่าง=[จำนวนสถิติที่ไม่ใช่ศูนย์, 4]) แกนที่สองสามารถมีได้เพียง 4 เท่านั้น รวมถึงรหัสโหนด มิติข้อมูลคุณลักษณะ รหัสบัคเก็ต และสถิติสถิติ สถิติ_มิติ = logits_มิติ + เฮสเซียน_มิติ
สถิติเอาท์พุท สาธารณะ <จำนวนเต็ม> statsSummaryShape ()
เอาท์พุตอันดับ 1 เทนเซอร์ (รูปร่าง=[4]) เทนเซอร์มีค่า 4 ค่าต่อไปนี้: [max_splits, คุณลักษณะ_มิติ, num_buckets, สถิติ_มิติ] โดยที่statistics_digim = ลาด_มิติ + hessian_มิติ การไล่ระดับ_มิติจะเหมือนกับ label_size กล่าวคือ พื้นที่เอาท์พุต hessian_ dimensions สามารถเหมือนกับ logits มิติข้อมูลเมื่อใช้ hessian แบบทแยงมุม หรือ label_ dimensions^2 เมื่อใช้ hessian แบบเต็ม
สถิติเอาท์พุท สาธารณะ <Float> statsSummaryValues ()
เอาท์พุตอันดับ 1 เทนเซอร์ (รูปร่าง=[จำนวนสถิติที่ไม่ใช่ศูนย์])