حریصانه زیرمجموعه ای از جعبه های مرزی را به ترتیب امتیاز نزولی انتخاب می کند،
این عملیات non_max_suppression را روی ورودیهای هر دسته، در همه کلاسها انجام میدهد. جعبههایی را که دارای تقاطع بیش از حد (IOU) بالا هستند با جعبههای انتخاب شده قبلی همپوشانی دارند. جعبه های مرزی به صورت [y1، x1، y2، x2] عرضه می شوند، که در آن (y1، x1) و (y2، x2) مختصات هر جفت مورب گوشه های جعبه هستند و مختصات را می توان به صورت نرمال ارائه کرد (یعنی خوابیده در فاصله [0، 1]) یا مطلق. توجه داشته باشید که این الگوریتم نسبت به جایی که مبدأ در سیستم مختصات است آگنوستیک است. همچنین توجه داشته باشید که این الگوریتم نسبت به تبدیلهای متعامد و ترجمههای سیستم مختصات ثابت است. بنابراین ترجمه یا بازتاب سیستم مختصات منجر به انتخاب کادرهای مشابه توسط الگوریتم می شود. خروجی این عملیات، کادرهای نهایی، امتیازها و تانسور کلاسهایی است که پس از انجام non_max_suppression برگردانده میشوند.
کلاس های تو در تو
کلاس | CombinedNonMaxSuppression.Options | ویژگی های اختیاری برای CombinedNonMaxSuppression |
ثابت ها
رشته | OP_NAME | نام این عملیات، همانطور که توسط موتور هسته TensorFlow شناخته می شود |
روش های عمومی
استاتیک CombinedNonMaxSuppression.Options | باکس های کلیپ (کلیپ باکس های بولی) |
استاتیک CombinedNonMaxSuppression | ایجاد ( scope scope، Operand < TFloat32 > کادرها، Operand < TFloat32 > امتیازات، Operand < TINT32 > maxOutputSizePerClass، Operand < TINT32 > maxTotalSize، Operand < TFloat32 > iouThreshold، Operand < TFloats32 گزینه ها، روش کارخانه برای ایجاد کلاسی که یک عملیات CombinedNonMaxSuppression جدید را بسته بندی می کند. |
خروجی < TFloat32 > | nmsedBoxes () یک تانسور [batch_size, max_detections, 4] float32 که حاوی جعبههای غیرحداکثر سرکوبشده است. |
خروجی < TFloat32 > | nmsedClasses () یک تانسور [batch_size, max_detections] float32 که شامل کلاسهای جعبهها است. |
خروجی < TFloat32 > | nmsedScores () یک تانسور [batch_size, max_detections] float32 که حاوی امتیازات جعبهها است. |
استاتیک CombinedNonMaxSuppression.Options | padPerClass (Boolean padPerClass) |
خروجی < TINT32 > | تشخیص های معتبر () یک تانسور [batch_size] int32 که تعداد شناساییهای معتبر در هر مورد دستهای را نشان میدهد. |
روش های ارثی
ثابت ها
رشته نهایی ثابت عمومی OP_NAME
نام این عملیات، همانطور که توسط موتور هسته TensorFlow شناخته می شود
روش های عمومی
عمومی استاتیک CombinedNonMaxSuppression.ClipBox های گزینه (ClipBoxهای بولی)
مولفه های
clipboxes | اگر درست است، مختصات جعبه را بین [0، 1] فرض کنید و اگر از [0، 1] خارج شدند، جعبههای خروجی را قطع کنید. اگر نادرست است، برش را انجام ندهید و مختصات جعبه را همانطور که هست خارج کنید. |
---|
استاتیک عمومی CombinedNonMaxSuppression ایجاد ( محدوده دامنه ، عملوند < TFloat32 > کادرها، عملوند < TFloat32 > امتیازها، عملوند < TINT32 > maxOutputSizePerClass، عملوند < TINT32 > maxTotalSize ، عملوند < TFloat32 >TFloat32 > گزینههای iouT )
روش کارخانه برای ایجاد کلاسی که یک عملیات CombinedNonMaxSuppression جدید را بسته بندی می کند.
مولفه های
محدوده | محدوده فعلی |
---|---|
جعبه ها | یک تانسور شناور 4 بعدی به شکل «[بچ_اندازه، تعداد_جعبهها، q، 4]». اگر 'q' 1 باشد، جعبه های یکسان برای همه کلاس ها استفاده می شود، در غیر این صورت، اگر 'q' برابر با تعداد کلاس ها باشد، از کادرهای مخصوص کلاس استفاده می شود. |
امتیازات | یک تانسور شناور سه بعدی به شکل «[بچ_اندازه، تعداد_جعبهها، تعداد_کلاسها]» که نشاندهنده یک امتیاز واحد مربوط به هر جعبه (هر ردیف از جعبهها) است. |
maxOutputSizePerClass | یک تانسور عدد صحیح اسکالر که نشان دهنده حداکثر تعداد کادرهایی است که باید با سرکوب غیر حداکثر در هر کلاس انتخاب شوند. |
maxTotalSize | یک اسکالر که نشان دهنده حداکثر تعداد جعبه های حفظ شده در تمام کلاس ها است. |
iouThreshold | یک تانسور شناور 0-D که آستانه ای را برای تصمیم گیری در مورد همپوشانی بیش از حد جعبه ها نسبت به IOU نشان می دهد. |
آستانه امتیاز | یک تانسور شناور 0-D که آستانه تصمیم گیری برای حذف جعبه ها بر اساس امتیاز را نشان می دهد. |
گزینه ها | مقادیر ویژگی های اختیاری را حمل می کند |
برمی گرداند
- یک نمونه جدید از CombinedNonMaxSuppression
خروجی عمومی < TFloat32 > nmsedBoxes ()
یک تانسور [batch_size, max_detections, 4] float32 که حاوی جعبههای غیرحداکثر سرکوبشده است.
خروجی عمومی < TFloat32 > nmsedClasses ()
یک تانسور [batch_size, max_detections] float32 که شامل کلاسهای جعبهها است.
خروجی عمومی < TFloat32 > nmsedScores ()
یک تانسور [batch_size, max_detections] float32 که حاوی امتیازات جعبهها است.
عمومی استاتیک CombinedNonMaxSuppression.Options padPerClass (Boolean padPerClass)
مولفه های
padPerClass | اگر نادرست باشد، جعبههای nmsed خروجی، امتیازها و کلاسها به «max_total_size» اضافه میشوند/بریده میشوند. اگر درست باشد، جعبههای nmsed خروجی، امتیازها و کلاسها به طول «max_size_per_class»*`num_classes» اضافه میشوند، مگر اینکه از «max_total_size» بیشتر شود، در این صورت به «max_total_size» بریده میشود. پیش فرض به نادرست. |
---|