جریان تنسور:: عملیات:: StringNGrams
#include <string_ops.h>
ngram ها را از داده های رشته ای ایجاد می کند.
خلاصه
این عملیات یک تانسور ژندهدار با 1 بعد ژندهدار که فقط شامل رشتهها است را میپذیرد و یک تانسور ژندهدار با 1 بعد ژندهدار حاوی نانوگرمهای آن رشته را که در امتداد داخلیترین محور به هم وصل شدهاند، خروجی میدهد.
استدلال ها:
- scope: یک شی Scope
- داده: تانسور مقادیر تانسور رشتهای که از آن ngram ساخته میشود. باید یک تانسور رشته 1 بعدی باشد.
- data_splits: تانسور تانسور رشتهای راگ شده را تقسیم میکند تا ngramها را از آن بسازد.
- جداکننده: رشته ای که بین عناصر توکن الحاق می شود. بدون جداکننده از "" استفاده کنید.
- ngram_widths: اندازه های ngram برای ایجاد.
- left_pad: رشته ای که برای پد کردن سمت چپ دنباله ngram استفاده می شود. فقط در صورتی استفاده می شود که pad_width != 0 باشد.
- right_pad: رشته ای که برای پد کردن سمت راست دنباله ngram استفاده می شود. فقط در صورتی استفاده می شود که pad_width != 0 باشد.
- pad_width: تعداد عناصر padding برای اضافه کردن به هر طرف هر دنباله. توجه داشته باشید که بدون در نظر گرفتن این مقدار، padding هرگز بزرگتر از 'ngram_widths'-1 نخواهد بود. اگر
pad_width=-1
باشد، آنگاه عناصرmax(ngram_widths)-1
را اضافه کنید.
برمیگرداند:
-
Output
ngrams: تانسور مقادیر تانسور ngrams خروجی ragged. -
Output
ngrams_splits: تانسور تقسیم تانسور خروجی ngrams ragged.
سازندگان و ویرانگرها | |
---|---|
StringNGrams (const :: tensorflow::Scope & scope, :: tensorflow::Input data, :: tensorflow::Input data_splits, StringPiece separator, const gtl::ArraySlice< int > & ngram_widths, StringPiece left_pad, StringPiece right_pad, int64 pad_width, bool preserve_short_sequences) |
صفات عمومی | |
---|---|
ngrams | |
ngrams_splits | |
operation |
صفات عمومی
ngrams
::tensorflow::Output ngrams
ngrams_splits
::tensorflow::Output ngrams_splits
عملیات
Operation operation
توابع عمومی
StringNGrams
StringNGrams( const ::tensorflow::Scope & scope, ::tensorflow::Input data, ::tensorflow::Input data_splits, StringPiece separator, const gtl::ArraySlice< int > & ngram_widths, StringPiece left_pad, StringPiece right_pad, int64 pad_width, bool preserve_short_sequences )
جز در مواردی که غیر از این ذکر شده باشد،محتوای این صفحه تحت مجوز Creative Commons Attribution 4.0 License است. نمونه کدها نیز دارای مجوز Apache 2.0 License است. برای اطلاع از جزئیات، به خطمشیهای سایت Google Developers مراجعه کنید. جاوا علامت تجاری ثبتشده Oracle و/یا شرکتهای وابسته به آن است.
تاریخ آخرین بهروزرسانی 2024-11-24 بهوقت ساعت هماهنگ جهانی.
[null,null,["تاریخ آخرین بهروزرسانی 2024-11-24 بهوقت ساعت هماهنگ جهانی."],[],[]]