แบบจำลองภาษา Wiki40B

ดูบน TensorFlow.org ทำงานใน Google Colab ดูบน GitHub ดาวน์โหลดโน๊ตบุ๊ค ดูรุ่น TF Hub

สร้างวิกิพีเดียเหมือนข้อความโดยใช้รูปแบบภาษา Wiki40B จาก TensorFlow ฮับ !

สมุดบันทึกนี้แสดงวิธี:

  • โหลด 41 เดียวและรูปแบบ 2 ภาษาพูดได้หลายภาษาที่เป็นส่วนหนึ่งของ คอลเลกชัน Wiki40b-LM บน TF-Hub
  • ใช้แบบจำลองเพื่อรับความฉงนสนเท่ห์ การเปิดใช้งานต่อเลเยอร์ และการฝังคำสำหรับข้อความที่กำหนด
  • สร้างโทเค็นข้อความโดยโทเค็นจากชิ้นส่วนของข้อความเมล็ด

รูปแบบภาษามีการฝึกอบรมเกี่ยวกับการตีพิมพ์ใหม่ทำความสะอาดขึ้น Wiki40B ชุดข้อมูลที่ มีอยู่ใน TensorFlow ชุดข้อมูล การฝึกอบรมการติดตั้งอยู่บนพื้นฐานของกระดาษ “วิกิพีเดีย-40B: พูดได้หลายภาษาภาษารุ่นชุดข้อมูล”

ติดตั้ง

การติดตั้งการพึ่งพา

นำเข้า

เลือกภาษา

ลองเลือกรูปแบบภาษาในการโหลดจาก TF-Hub และความยาวของข้อความที่จะสร้าง

Using the https://tfhub.dev/google/wiki40b-lm-en/1 model to generate sequences of max length 20.

สร้างแบบจำลอง

เอาล่ะตอนนี้ที่เราได้กำหนดค่าไว้ล่วงหน้าซึ่งผ่านการฝึกอบรมรุ่นที่จะใช้ขอกำหนดค่าเพื่อสร้างข้อความถึง max_gen_len เราจะต้องโหลดโมเดลภาษาจาก TF-Hub ป้อนข้อความเริ่มต้น จากนั้นป้อนโทเค็นซ้ำๆ เมื่อถูกสร้างขึ้น

โหลดชิ้นส่วนโมเดลภาษา

2021-11-05 13:33:19.950673: W tensorflow/core/common_runtime/graph_constructor.cc:1511] Importing a graph with a lower producer version 359 into an existing graph with producer version 808. Shape inference will have run different parts of the graph with different producer versions.

สร้างกราฟต่อโทเค็น

สร้างกราฟคลี่แบบคงที่สำหรับ max_gen_len ราชสกุล

สร้างข้อความ

มาสร้างข้อความกันเถอะ! เราจะตั้งค่าข้อความ seed เพื่อให้รูปแบบภาษา

คุณสามารถใช้หนึ่งของเมล็ดที่กำหนดไว้ล่วงหน้าหรือเลือกที่จะป้อนของคุณเอง ข้อความนี้จะใช้เป็นเมล็ดพันธุ์สำหรับโมเดลภาษาเพื่อช่วยให้โมเดลภาษาทราบถึงสิ่งที่จะสร้างต่อไป

คุณสามารถใช้โทเค็นพิเศษต่อไปนี้ก่อนส่วนพิเศษของบทความที่สร้างขึ้น ใช้ _START_ARTICLE_ เพื่อระบุจุดเริ่มต้นของบทความ _START_SECTION_ เพื่อบ่งชี้ถึงจุดเริ่มต้นของส่วนและ _START_PARAGRAPH_ เพื่อสร้างข้อความในบทความ

เมล็ดพันธุ์ที่กำหนดไว้ล่วงหน้า

ป้อนเมล็ดพันธุ์ของคุณเอง (ไม่บังคับ)

Generating text from seed:

_START_ARTICLE_
1882 Prince Edward Island general election
_START_PARAGRAPH_
The 1882 Prince Edward Island election was held on May 8, 1882 to elect members of the House of Assembly of the province of Prince Edward Island, Canada.

เริ่มต้นเซสชัน

สร้างข้อความ

_START_SECTION_ Candidates _START_PARAGRAPH_ Thirteen members of the House of Assembly were all members nominations. Among

เรายังสามารถดูผลลัพธ์อื่นๆ ของโมเดลได้ - ความฉงนสนเท่ห์ รหัสโทเค็น การเปิดใช้งานระดับกลาง และการฝัง

ppl_result
array([23.507753], dtype=float32)
token_ids_result
array([[   8,    3, 6794, 1579, 1582,  721,  489,  448,    8,    5,   26,
        6794, 1579, 1582,  721,  448,   17,  245,   22,  166, 2928, 6794,
          16, 7690,  384,   11,    7,  402,   11, 1172,   11,    7, 2115,
          11, 1579, 1582,  721,    9,  646,   10]], dtype=int32)
activations_result.shape
(12, 1, 39, 768)
embeddings_result
array([[[ 0.12262525,  5.548009  ,  1.4743135 , ...,  2.4388404 ,
         -2.2788858 ,  2.172028  ],
        [-2.3905468 , -0.97108954, -1.5513545 , ...,  8.458472  ,
         -2.8723319 ,  0.6534524 ],
        [-0.83790785,  0.41630274, -0.8740793 , ...,  1.6446769 ,
         -0.9074106 ,  0.3339265 ],
        ...,
        [-0.8054745 , -1.2495526 ,  2.6232922 , ...,  2.893288  ,
         -0.91287214, -1.1259722 ],
        [ 0.64944506,  3.3696785 ,  0.09543293, ..., -0.7839227 ,
         -1.3573489 ,  1.862214  ],
        [-1.2970612 ,  0.5961366 ,  3.3531897 , ...,  3.2853985 ,
         -1.6212384 ,  0.30257902]]], dtype=float32)