Mfcc

सार्वजनिक अंतिम वर्ग एमएफसीसी

स्पेक्ट्रोग्राम को ऐसे रूप में परिवर्तित करता है जो वाक् पहचान के लिए उपयोगी हो।

मेल फ़्रीक्वेंसी सेप्स्ट्रल गुणांक ऑडियो डेटा का प्रतिनिधित्व करने का एक तरीका है जो मशीन लर्निंग के लिए एक इनपुट सुविधा के रूप में प्रभावी है। वे एक स्पेक्ट्रोग्राम (एक 'सेपस्ट्रम') के स्पेक्ट्रम को लेकर और कुछ उच्च आवृत्तियों को त्यागकर बनाए जाते हैं जो मानव कान के लिए कम महत्वपूर्ण हैं। वाक् पहचान की दुनिया में उनका एक लंबा इतिहास है, और अधिक जानने के लिए https://en.wikipedia.org/wiki/Mel-frequeency_cepstrum एक अच्छा संसाधन है।

नेस्टेड क्लासेस

कक्षा एमएफसीसी.विकल्प Mfcc के लिए वैकल्पिक विशेषताएँ

स्थिरांक

डोरी OP_NAME इस ऑप का नाम, जैसा कि TensorFlow कोर इंजन द्वारा जाना जाता है

सार्वजनिक तरीके

आउटपुट < TFloat32 >
आउटपुट के रूप में ()
टेंसर का प्रतीकात्मक हैंडल लौटाता है।
स्थिर एमएफसीसी
बनाएं ( स्कोप स्कोप, ऑपरेंड < TFloat32 > स्पेक्ट्रोग्राम, ऑपरेंड < TInt32 > नमूना दर, विकल्प... विकल्प)
एक नए एमएफसीसी ऑपरेशन को लपेटकर एक क्लास बनाने की फ़ैक्टरी विधि।
स्थिर एमएफसीसी.विकल्प
dctCoefficientCount (लंबा dctCoefficientCount)
स्थिर एमएफसीसी.विकल्प
फ़िल्टरबैंकचैनलकाउंट (लंबा फ़िल्टरबैंकचैनलकाउंट)
स्थिर एमएफसीसी.विकल्प
लोअरफ़्रीक्वेंसीलिमिट (फ़्लोट लोअरफ़्रीक्वेंसीलिमिट)
आउटपुट < TFloat32 >
स्थिर एमएफसीसी.विकल्प
अपरफ़्रीक्वेंसीलिमिट (फ्लोट अपरफ़्रीक्वेंसीलिमिट)

विरासत में मिली विधियाँ

org.tensorflow.op.RawOp से
अंतिम बूलियन
बराबर (वस्तु obj)
अंतिम पूर्णांक
संचालन
ऑप ()
गणना की इस इकाई को एकल Operation के रूप में लौटाएँ।
अंतिम स्ट्रिंग
बूलियन
बराबर (ऑब्जेक्ट arg0)
अंतिम कक्षा<?>
गेटक्लास ()
int यहाँ
हैश कोड ()
अंतिम शून्य
सूचित करें ()
अंतिम शून्य
सभी को सूचित करें ()
डोरी
स्ट्रिंग ()
अंतिम शून्य
प्रतीक्षा करें (लंबा arg0, int arg1)
अंतिम शून्य
प्रतीक्षा करें (लंबा arg0)
अंतिम शून्य
इंतज़ार ()
org.tensorflow.op.Op
सार निष्पादन वातावरण
एनवी ()
उस निष्पादन वातावरण को लौटाएँ जिसमें यह ऑप बनाया गया था।
सार संचालन
ऑप ()
गणना की इस इकाई को एकल Operation के रूप में लौटाएँ।
org.tensorflow.Operand से
सार आउटपुट < TFloat32 >
आउटपुट के रूप में ()
टेंसर का प्रतीकात्मक हैंडल लौटाता है।
सार TFloat32
एस्टेंसर ()
इस ऑपरेंड पर टेंसर लौटाता है।
अमूर्त आकार
आकार ()
इस ऑपरेंड के Output द्वारा निर्दिष्ट टेंसर का (संभवतः आंशिक रूप से ज्ञात) आकार लौटाता है।
सार वर्ग< TFloat32 >
प्रकार ()
इस ऑपरेंड का टेंसर प्रकार लौटाता है
org.tensorflow.ndarray.Shaped
सार इंट
पद ()
अमूर्त आकार
अमूर्त लंबा
आकार ()
इस कंटेनर के कुल आकार की गणना करता है और मानों की संख्या में लौटाता है।

स्थिरांक

सार्वजनिक स्थैतिक अंतिम स्ट्रिंग OP_NAME

इस ऑप का नाम, जैसा कि TensorFlow कोर इंजन द्वारा जाना जाता है

स्थिर मान: "Mfcc"

सार्वजनिक तरीके

सार्वजनिक आउटपुट < TFloat32 > asOutput ()

टेंसर का प्रतीकात्मक हैंडल लौटाता है।

TensorFlow संचालन के इनपुट किसी अन्य TensorFlow ऑपरेशन के आउटपुट हैं। इस पद्धति का उपयोग एक प्रतीकात्मक हैंडल प्राप्त करने के लिए किया जाता है जो इनपुट की गणना का प्रतिनिधित्व करता है।

सार्वजनिक स्थैतिक एमएफसीसी निर्माण ( स्कोप स्कोप, ऑपरेंड < TFloat32 > स्पेक्ट्रोग्राम, ऑपरेंड < TInt32 > नमूना दर, विकल्प... विकल्प)

एक नए एमएफसीसी ऑपरेशन को लपेटकर एक क्लास बनाने की फ़ैक्टरी विधि।

पैरामीटर
दायरा वर्तमान दायरा
spectrogram आमतौर पर स्पेक्ट्रोग्राम ऑप द्वारा निर्मित, परिमाण_वर्ग को सत्य पर सेट किया जाता है।
नमूना दर स्रोत ऑडियो ने प्रति सेकंड कितने नमूनों का उपयोग किया।
विकल्प वैकल्पिक गुण मान रखता है
रिटर्न
  • एमएफसीसी का एक नया उदाहरण

सार्वजनिक स्थैतिक Mfcc.Options dctCoefficientCount (लंबा dctCoefficientCount)

पैरामीटर
dctCoefficientCount प्रति टाइम स्लाइस में कितने आउटपुट चैनल तैयार करने हैं।

सार्वजनिक स्थैतिक Mfcc.Options फ़िल्टरबैंकचैनलकाउंट (लंबा फ़िल्टरबैंकचैनलकाउंट)

पैरामीटर
फ़िल्टरबैंकचैनलकाउंट मेल बैंक का रिज़ॉल्यूशन आंतरिक रूप से उपयोग किया जाता है।

सार्वजनिक स्थैतिक Mfcc.ऑप्शंस लोअरफ़्रीक्वेंसीलिमिट (फ़्लोट लोअरफ़्रीक्वेंसीलिमिट)

पैरामीटर
निचलीआवृत्तिसीमा सेप्टस्ट्रम की गणना करते समय उपयोग की जाने वाली सबसे कम आवृत्ति।

सार्वजनिक आउटपुट < TFloat32 > आउटपुट ()

सार्वजनिक स्थैतिक Mfcc.ऑप्शंस अपरफ़्रीक्वेंसीलिमिट (फ़्लोट अपरफ़्रीक्वेंसीलिमिट)

पैरामीटर
ऊपरीआवृत्तिसीमा सेप्टस्ट्रम की गणना करते समय उपयोग की जाने वाली उच्चतम आवृत्ति।