Google I/O-তে টিউন করার জন্য ধন্যবাদ। চাহিদা অনুযায়ী সব সেশন দেখুন চাহিদা অনুযায়ী দেখুন

CTCLossV2

পাবলিক চূড়ান্ত বর্গ CTCLossV2

প্রতিটি ব্যাচ এন্ট্রির জন্য CTC ক্ষতি (লগ সম্ভাব্যতা) গণনা করে। হিসাবও করে

গ্রেডিয়েন্ট এই ক্লাসটি আপনার জন্য সফ্টম্যাক্স অপারেশন করে, তাই ইনপুট হওয়া উচিত যেমন একটি LSTM দ্বারা আউটপুটগুলির রৈখিক অনুমান।

নেস্টেড ক্লাস

ক্লাস CTLossV2.Options জন্য ঐচ্ছিক বৈশিষ্ট্য CTCLossV2

পাবলিক পদ্ধতি

স্ট্যাটিক CTCLossV2
তৈরি ( ব্যাপ্তি সুযোগ প্রতীক <ফ্লোট> ইনপুট, প্রতীক <লং> labelsIndices, প্রতীক <integer> labelsValues, প্রতীক <integer> sequenceLength, বিকল্পসমূহ ... অপশন)
একটি নতুন CTLossV2 অপারেশন মোড়ানো একটি ক্লাস তৈরি করার কারখানার পদ্ধতি।
স্ট্যাটিক CTCLossV2.Options
ctcMergeRepeated (বুলিয়ান ctcMergeRepeated)
আউটপুট <ফ্লোট>
গ্রেডিয়েন্ট ()
`ক্ষতি` এর গ্রেডিয়েন্ট।
স্ট্যাটিক CTCLossV2.Options
ignoreLongerOutputsThanInputs (বুলিয়ান ignoreLongerOutputsThanInputs)
আউটপুট <ফ্লোট>
ক্ষতি ()
লগ-সম্ভাবনা ধারণকারী একটি ভেক্টর (ব্যাচ)।
স্ট্যাটিক CTCLossV2.Options
preprocessCollapseRepeated (বুলিয়ান preprocessCollapseRepeated)

উত্তরাধিকারসূত্রে প্রাপ্ত পদ্ধতি

পাবলিক পদ্ধতি

পাবলিক স্ট্যাটিক CTCLossV2 তৈরি করুন ( ব্যাপ্তি সুযোগ প্রতীক <ফ্লোট> ইনপুট, প্রতীক <লং> labelsIndices, প্রতীক <integer> labelsValues, প্রতীক <integer> sequenceLength, বিকল্পসমূহ ... অপশন)

একটি নতুন CTLossV2 অপারেশন মোড়ানো একটি ক্লাস তৈরি করার কারখানার পদ্ধতি।

পরামিতি
সুযোগ বর্তমান সুযোগ
ইনপুট 3-D, আকৃতি: `(max_time x ব্যাচ_size x num_classes)`, লগিট। ডিফল্ট ফাঁকা লেবেল হল 0 এর পরিবর্তে num_classes - 1।
লেবেল সূচক একটি `স্পার্স টেনসরের সূচক `। `labels_indices(i, :) == [b, t]` মানে `labels_values(i)` `(ব্যাচ b, time t)` এর জন্য আইডি সঞ্চয় করে।
লেবেল মান প্রদত্ত ব্যাচ এবং সময়ের সাথে যুক্ত মান (লেবেল)।
ক্রম দৈর্ঘ্য ক্রম দৈর্ঘ্য (ব্যাচ) ধারণকারী একটি ভেক্টর।
বিকল্প ঐচ্ছিক বৈশিষ্ট্য মান বহন করে
রিটার্নস
  • CTLossV2 এর একটি নতুন উদাহরণ

পাবলিক স্ট্যাটিক CTCLossV2.Options ctcMergeRepeated (বুলিয়ান ctcMergeRepeated)

পরামিতি
ctcMerge পুনরাবৃত্ত স্কেলার। যদি সেট মিথ্যাতে, ব্যবহার করুন CTC- হিসাব সময় আপনি বারবার অ ফাঁকা লেবেল মার্জ করা হবে না এবং পৃথক লেবেল হিসাবে ব্যাখ্যা করা হয়। এটি CTC এর একটি সরলীকৃত সংস্করণ।

পাবলিক আউটপুট <ফ্লোট> গ্রেডিয়েন্ট ()

`ক্ষতি` এর গ্রেডিয়েন্ট। 3-D, আকৃতি: `(সর্বোচ্চ_সময় x ব্যাচ_সাইজ x সংখ্যা_শ্রেণী)`।

পাবলিক স্ট্যাটিক CTCLossV2.Options ignoreLongerOutputsThanInputs (বুলিয়ান ignoreLongerOutputsThanInputs)

পরামিতি
লংজারআউটপুটসথানইনপুট উপেক্ষা করুন স্কেলার। যদি সত্যে সেট করা হয়, CTC গণনার সময়, ইনপুট সিকোয়েন্সের চেয়ে দীর্ঘ আউটপুট সিকোয়েন্স আছে এমন আইটেমগুলি এড়িয়ে যায়: তারা ক্ষতির মেয়াদে অবদান রাখে না এবং শূন্য-গ্রেডিয়েন্ট থাকে।

পাবলিক আউটপুট <ফ্লোট> হ্রাস ()

লগ-সম্ভাবনা ধারণকারী একটি ভেক্টর (ব্যাচ)।

পাবলিক স্ট্যাটিক CTCLossV2.Options preprocessCollapseRepeated (বুলিয়ান preprocessCollapseRepeated)

পরামিতি
প্রিপ্রসেস কোলাপসপুনরাবৃত্ত স্কেলার, যদি সত্য হয় তাহলে বারবার লেবেলগুলি CTC গণনার আগে ভেঙে ফেলা হয়।