StringNGrams

StringNGrams คลาสสุดท้ายสาธารณะ

สร้าง ngrams จากข้อมูลสตริงที่ขาดหายไป

สหกรณ์นี้ยอมรับเมตริกซ์ที่ขาดซึ่งมี 1 มิติที่ขาดซึ่งมีเฉพาะสตริง และส่งออกเทนเซอร์ที่ขาด 1 มิติที่มี ngrams ของสตริงนั้น เชื่อมต่อกันตามแกนในสุด

วิธีการสาธารณะ

คงที่ <T ขยายจำนวน> StringNGrams <T>
สร้าง (ขอบเขต ขอบเขต ข้อมูล ตัวดำเนินการ <String> ตัว ดำเนินการ <T> dataSplits ตัวคั่นสตริง รายการ<Long> ngramWidths สตริง leftPad สตริง rightPad ยาว padWidth บูลีนรักษา ShortSequences)
วิธีการจากโรงงานเพื่อสร้างคลาสที่รวมการดำเนินการ StringNGrams ใหม่
เอาท์พุต <สตริง>
แกรม ()
ค่าเทนเซอร์ของเอาต์พุต ngrams เทนเซอร์ที่ขาดหาย
เอาท์พุต <T>
ngramsSplits ()
เทนเซอร์แยกของเอาท์พุต ngrams เทนเซอร์ที่ขาดหาย

วิธีการสืบทอด

วิธีการสาธารณะ

สาธารณะคง StringNGrams <T> สร้าง ( ขอบเขต ขอบเขต ข้อมูล ตัวดำเนินการ <สตริง> ตัว ดำเนินการ <T> dataSplits ตัวแยกสตริง รายการ <ยาว> ngramWidths สตริง leftPad สตริง rightPad ยาว padWidth บูลีนรักษา ShortSequences)

วิธีการจากโรงงานเพื่อสร้างคลาสที่ห่อการดำเนินการ StringNGrams ใหม่

พารามิเตอร์
ขอบเขต ขอบเขตปัจจุบัน
ข้อมูล ค่าเทนเซอร์ของเทนเซอร์สตริงที่ขาดเพื่อสร้าง ngrams ต้องเป็นเทนเซอร์สตริง 1D
ข้อมูลแยก แยกเมตริกซ์ของเทนเซอร์สตริงที่ขาดเพื่อสร้าง ngrams
ตัวคั่น สตริงที่จะต่อท้ายระหว่างองค์ประกอบของโทเค็น ใช้ "" โดยไม่มีตัวคั่น
ngramWidths ขนาดของงแกรมที่จะสร้าง
แพดซ้าย สตริงที่ใช้เพื่อแพดด้านซ้ายของลำดับ ngram ใช้เฉพาะเมื่อ pad_width != 0
ขวาแพด สตริงที่จะใช้เพื่อวางด้านขวาของลำดับ ngram ใช้เฉพาะเมื่อ pad_width != 0
ความกว้างของเบาะ จำนวนองค์ประกอบการเสริมที่จะเพิ่มลงในแต่ละด้านของแต่ละลำดับ โปรดทราบว่าช่องว่างภายในจะไม่มากกว่า 'ngram_widths'-1 โดยไม่คำนึงถึงค่านี้ หาก `pad_width=-1` ให้เพิ่มองค์ประกอบ `max(ngram_widths)-1`
การส่งคืน
  • อินสแตนซ์ใหม่ของ StringNGrams

เอาท์ พุท สาธารณะ <String> ngrams ()

ค่าเทนเซอร์ของเอาต์พุต ngrams เทนเซอร์ที่ขาดหาย

เอาท์พุท สาธารณะ <T> ngramsSplits ()

เทนเซอร์แยกของเอาท์พุต ngrams เทนเซอร์ที่ขาดหาย