Tạo nhãn để lấy mẫu ứng viên bằng cách phân phối unigram đã học.
Xem phần giải thích về việc lấy mẫu ứng viên và các định dạng dữ liệu tại go/candidate-sampling.
Đối với mỗi lô, hoạt động này chọn một tập hợp các nhãn ứng cử viên được lấy mẫu.
Ưu điểm của việc lấy mẫu ứng viên theo từng đợt là tính đơn giản và khả năng nhân ma trận dày đặc hiệu quả. Điểm bất lợi là các ứng cử viên được lấy mẫu phải được chọn độc lập với bối cảnh và nhãn thực sự.
Các lớp lồng nhau
lớp học | AllCandidateSampler.Options | Thuộc tính tùy chọn cho AllCandidateSampler |
Hằng số
Sợi dây | OP_NAME | Tên của op này, được biết đến bởi công cụ lõi TensorFlow |
Phương pháp công khai
AllCandidateSampler tĩnh | tạo ( Phạm vi phạm vi, Toán hạng < TInt64 > trueClasses, Long numTrue, Long numSampled, Boolean duy nhất, Tùy chọn... tùy chọn) Phương thức xuất xưởng để tạo một lớp bao bọc một thao tác AllCandidateSampler mới. |
Đầu ra < TInt64 > | đã lấy mẫuỨng viên () Một vectơ có độ dài được lấy mẫu bằng số, trong đó mỗi phần tử là ID của một ứng cử viên được lấy mẫu. |
Đầu ra < TFloat32 > | đã lấy mẫuExpectedCount () Một vectơ có độ dài bằng số_sampled, cho mỗi ứng viên được lấy mẫu biểu thị số lần ứng viên đó dự kiến sẽ xuất hiện trong một loạt ứng viên được lấy mẫu. |
tĩnh AllCandidateSampler.Options | hạt giống (Hạt dài) |
tĩnh AllCandidateSampler.Options | hạt giống2 (Hạt dài2) |
Đầu ra < TFloat32 > | trueExpectedCount () Ma trận batch_size * num_true, biểu thị số lần mỗi ứng viên dự kiến xuất hiện trong một loạt ứng viên được lấy mẫu. |
Phương pháp kế thừa
Hằng số
Chuỗi cuối cùng tĩnh công khai OP_NAME
Tên của op này, được biết đến bởi công cụ lõi TensorFlow
Phương pháp công khai
public static AllCandidateSampler tạo ( Phạm vi phạm vi, Toán hạng < TInt64 > trueClasses, Long numTrue, Long numSampled, Boolean duy nhất, Tùy chọn... tùy chọn)
Phương thức xuất xưởng để tạo một lớp bao bọc một thao tác AllCandidateSampler mới.
Thông số
phạm vi | phạm vi hiện tại |
---|---|
đúnglớp học | Ma trận batch_size * num_true, trong đó mỗi hàng chứa ID của num_true target_classes trong nhãn gốc tương ứng. |
số đúng | Số lượng nhãn thực sự cho mỗi ngữ cảnh. |
numĐã lấy mẫu | Số lượng ứng cử viên để sản xuất. |
độc nhất | Nếu duy nhất là đúng, chúng tôi lấy mẫu với sự từ chối, sao cho tất cả các ứng cử viên được lấy mẫu trong một đợt là duy nhất. Điều này đòi hỏi một số phép tính gần đúng để ước tính xác suất lấy mẫu sau loại bỏ. |
tùy chọn | mang các giá trị thuộc tính tùy chọn |
Trả lại
- một phiên bản mới của AllCandidateSampler
Đầu ra công khai < TInt64 > sampledCandidates ()
Một vectơ có độ dài được lấy mẫu bằng số, trong đó mỗi phần tử là ID của một ứng cử viên được lấy mẫu.
Đầu ra công khai < TFloat32 > sampledExpectedCount ()
Một vectơ có độ dài bằng số_sampled, cho mỗi ứng viên được lấy mẫu biểu thị số lần ứng viên đó dự kiến sẽ xuất hiện trong một loạt ứng viên được lấy mẫu. Nếu duy nhất=true thì đây là một xác suất.
public static AllCandidateSampler.Options Seed (Hạt giống dài)
Thông số
hạt giống | Nếu hạt giống hoặc hạt giống2 được đặt khác 0, thì bộ tạo số ngẫu nhiên sẽ được gieo hạt giống đã cho. Nếu không, nó sẽ được gieo bởi một hạt giống ngẫu nhiên. |
---|
public static AllCandidateSampler.Optionsseed2 ( Hạt giống dài2)
Thông số
hạt giống2 | Hạt giống thứ hai để tránh va chạm hạt giống. |
---|