อัปเดต '*var' ตามอัลกอริทึม AdaMax
m_t <- beta1 * m_{t-1} + (1 - beta1) * g v_t <- max(beta2 * v_{t-1}, abs(g)) ตัวแปร <- ตัวแปร - Learning_rate / (1 - beta1^ เสื้อ) * m_t / (v_t + เอปไซลอน)
คลาสที่ซ้อนกัน
| ระดับ | ApplyAdaMax.ตัวเลือก | คุณลักษณะเพิ่มเติมสำหรับ ApplyAdaMax | |
ค่าคงที่
| สตริง | OP_NAME | ชื่อของ op นี้ ซึ่งรู้จักกันในชื่อของเอ็นจิ้นหลัก TensorFlow |
วิธีการสาธารณะ
| เอาท์พุต <T> | เป็นเอาท์พุต () ส่งกลับค่าแฮนเดิลสัญลักษณ์ของเทนเซอร์ |
| คงที่ <T ขยาย TType > ApplyAdaMax <T> | สร้าง ( ขอบเขต ขอบเขต ตัวดำเนินการ <T> var, ตัวดำเนินการ <T> m, ตัวถูกดำเนินการ <T> v, ตัวถูกดำเนินการ <T> beta1Power, ตัวถูกดำเนินการ <T> lr, ตัว ถูกดำเนินการ <T> beta1, ตัวถูกดำเนินการ <T> beta2, ตัว ถูกดำเนินการ <T > เอปไซลอน, ตัวดำเนินการ <T> ผู้สำเร็จการศึกษา, ตัวเลือก... ตัวเลือก) วิธีการจากโรงงานเพื่อสร้างคลาสที่รวมการดำเนินการ ApplyAdaMax ใหม่ |
| เอาท์พุต <T> | ออก () เช่นเดียวกับ "var" |
| ApplyAdaMax.Options แบบคงที่ | useLocking (การใช้ล็อคแบบบูลีน) |
วิธีการสืบทอด
ค่าคงที่
สตริงสุดท้ายแบบคงที่สาธารณะ OP_NAME
ชื่อของ op นี้ ซึ่งรู้จักกันในชื่อของเอ็นจิ้นหลัก TensorFlow
วิธีการสาธารณะ
เอาท์ พุท สาธารณะ <T> asOutput ()
ส่งกลับค่าแฮนเดิลสัญลักษณ์ของเทนเซอร์
อินพุตสำหรับการดำเนินการ TensorFlow คือเอาต์พุตของการดำเนินการ TensorFlow อื่น วิธีการนี้ใช้เพื่อรับหมายเลขอ้างอิงสัญลักษณ์ที่แสดงถึงการคำนวณอินพุต
สาธารณะคง ApplyAdaMax <T> สร้าง ( ขอบเขต ขอบเขต ตัวดำเนินการ <T> var, ตัว ดำเนินการ <T> m, ตัวดำเนินการ <T> v, ตัวดำเนินการ <T> beta1Power, ตัวดำเนินการ <T> lr, ตัวดำเนินการ <T> beta1, ตัวดำเนินการ <T > beta2, ตัวดำเนินการ <T> เอปไซลอน, ตัวดำเนินการ <T> ผู้สำเร็จการศึกษา, ตัวเลือก... ตัวเลือก)
วิธีการจากโรงงานเพื่อสร้างคลาสที่รวมการดำเนินการ ApplyAdaMax ใหม่
พารามิเตอร์
| ขอบเขต | ขอบเขตปัจจุบัน |
|---|---|
| var | ควรมาจากตัวแปร () |
| ม | ควรมาจากตัวแปร () |
| โวลต์ | ควรมาจากตัวแปร () |
| เบต้า1พาวเวอร์ | ต้องเป็นสเกลาร์ |
| ล | ปัจจัยการปรับขนาด ต้องเป็นสเกลาร์ |
| เบต้า1 | ปัจจัยโมเมนตัม ต้องเป็นสเกลาร์ |
| เบต้า2 | ปัจจัยโมเมนตัม ต้องเป็นสเกลาร์ |
| เอปไซลอน | ระยะริดจ์ ต้องเป็นสเกลาร์ |
| ผู้สำเร็จการศึกษา | การไล่ระดับสี |
| ตัวเลือก | มีค่าแอตทริบิวต์ทางเลือก |
การส่งคืน
- อินสแตนซ์ใหม่ของ ApplyAdaMax
ApplyAdaMax.Options แบบคงที่สาธารณะ useLocking (useLocking แบบบูลีน)
พารามิเตอร์
| ใช้ล็อค | หากเป็น "จริง" การอัปเดตเทนเซอร์ var, m และ v จะได้รับการปกป้องด้วยการล็อค มิฉะนั้นพฤติกรรมจะไม่ได้กำหนดไว้ แต่อาจแสดงความขัดแย้งน้อยลง |
|---|