amazon_us_reviews

 • Mô tả :

Đánh giá của khách hàng trên Amazon (hay còn gọi là Đánh giá sản phẩm) là một trong những sản phẩm mang tính biểu tượng của Amazons. Trong khoảng thời gian hơn hai thập kỷ kể từ lần đánh giá đầu tiên vào năm 1995, hàng triệu khách hàng của Amazon đã đóng góp hơn một trăm triệu bài đánh giá để bày tỏ ý kiến ​​và mô tả trải nghiệm của họ về các sản phẩm trên trang web Amazon.com. Điều này làm cho Đánh giá của khách hàng Amazon trở thành một nguồn thông tin phong phú cho các nhà nghiên cứu học thuật trong các lĩnh vực Xử lý ngôn ngữ tự nhiên (NLP), Truy xuất thông tin (IR) và Học máy (ML), cùng những lĩnh vực khác. Theo đó, chúng tôi sẽ phát hành dữ liệu này để nghiên cứu thêm về nhiều lĩnh vực liên quan đến việc hiểu trải nghiệm sản phẩm của khách hàng. Cụ thể, tập dữ liệu này được xây dựng để đại diện cho một mẫu đánh giá và ý kiến ​​của khách hàng, sự khác biệt trong nhận thức về sản phẩm giữa các khu vực địa lý và ý định quảng cáo hoặc thành kiến ​​trong các bài đánh giá.

Hơn 130 triệu đánh giá của khách hàng có sẵn cho các nhà nghiên cứu như một phần của bản phát hành này. Dữ liệu có sẵn trong các tệp TSV trong nhóm amazon-reviews-pds S3 ở AWS Khu vực phía Đông Hoa Kỳ. Mỗi dòng trong tệp dữ liệu tương ứng với một bài đánh giá riêng lẻ (được phân cách bằng tab, không có dấu ngoặc kép và ký tự thoát).

Mỗi Tập dữ liệu chứa các cột sau: thị trường - mã quốc gia gồm 2 chữ cái của thị trường nơi đánh giá được viết. customer_id - Giá trị nhận dạng ngẫu nhiên có thể được sử dụng để tổng hợp các bài đánh giá do một tác giả viết. review_id - ID duy nhất của bài đánh giá. product_id - ID Sản phẩm duy nhất mà bài đánh giá có. Trong tập dữ liệu đa ngôn ngữ, các bài đánh giá cho cùng một sản phẩm ở các quốc gia khác nhau có thể được nhóm theo cùng một product_id. product_parent - Giá trị nhận dạng ngẫu nhiên có thể được sử dụng để tổng hợp các bài đánh giá cho cùng một sản phẩm. product_title - Tiêu đề của sản phẩm. product_category - Danh mục sản phẩm rộng có thể được sử dụng để nhóm các bài đánh giá (cũng được sử dụng để nhóm tập dữ liệu thành các phần mạch lạc). star_rating - Xếp hạng 1-5 sao của bài đánh giá. Huu_votes - Số lượng phiếu bầu hữu ích. total_votes - Tổng số phiếu bầu mà bài đánh giá nhận được. Cây nho - Bài đánh giá được viết như một phần của chương trình Cây nho. Veri_purchase - Bài đánh giá về một giao dịch mua đã được xác minh. review_headline - Tiêu đề của bài đánh giá. review_body - Văn bản đánh giá. review_date - Ngày viết đánh giá.

FeaturesDict({
  'data': FeaturesDict({
    'customer_id': tf.string,
    'helpful_votes': tf.int32,
    'marketplace': tf.string,
    'product_category': tf.string,
    'product_id': tf.string,
    'product_parent': tf.string,
    'product_title': tf.string,
    'review_body': tf.string,
    'review_date': tf.string,
    'review_headline': tf.string,
    'review_id': tf.string,
    'star_rating': tf.int32,
    'total_votes': tf.int32,
    'verified_purchase': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
    'vine': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
  }),
})
 • Tài liệu tính năng :
Tính năng Lớp Hình dạng Loại Sự mô tả
Các tính năng
dữ liệu Các tính năng
data / customer_id Tensor tf.string
data / Huu_votes Tensor tf.int32
dữ liệu / thị trường Tensor tf.string
data / product_category Tensor tf.string
data / product_id Tensor tf.string
data / product_parent Tensor tf.string
data / product_title Tensor tf.string
data / review_body Tensor tf.string
data / review_date Tensor tf.string
data / review_headline Tensor tf.string
data / review_id Tensor tf.string
data / star_rating Tensor tf.int32
data / total_votes Tensor tf.int32
data / verify_purchase ClassLabel tf.int64
dữ liệu / cây nho ClassLabel tf.int64

amazon_us_reviews / Wireless_v1_00 (cấu hình mặc định)

 • Mô tả cấu hình : Tập dữ liệu bao gồm các đánh giá về các sản phẩm của Amazon Wireless_v1_00 trên thị trường Hoa Kỳ. Mỗi sản phẩm có phiên bản riêng như được chỉ định với nó.

 • Kích thước tải xuống : 1.59 GiB

 • Tách :

Tách ra Các ví dụ
'train' 9.002.021

amazon_us_reviews / Watches_v1_00

 • Mô tả cấu hình : Tập dữ liệu bao gồm các bài đánh giá về các sản phẩm Amazon Watches_v1_00 trên thị trường Hoa Kỳ. Mỗi sản phẩm có phiên bản riêng như được chỉ định với nó.

 • Kích thước tải xuống : 155.42 MiB

 • Tách :

Tách ra Các ví dụ
'train' 960.872

amazon_us_reviews / Video_Games_v1_00

 • Mô tả cấu hình : Tập dữ liệu bao gồm các bài đánh giá về các sản phẩm Amazon Video_Games_v1_00 trên thị trường Hoa Kỳ. Mỗi sản phẩm có phiên bản riêng như được chỉ định với nó.

 • Kích thước tải xuống : 453.19 MiB

 • Tách :

Tách ra Các ví dụ
'train' 1.785.997

amazon_us_reviews / Video_DVD_v1_00

 • Mô tả cấu hình : Tập dữ liệu bao gồm các bài đánh giá về các sản phẩm Amazon Video_DVD_v1_00 trên thị trường Hoa Kỳ. Mỗi sản phẩm có phiên bản riêng như được chỉ định với nó.

 • Kích thước tải xuống : 1.41 GiB

 • Tách :

Tách ra Các ví dụ
'train' 5,069,140

amazon_us_reviews / Video_v1_00

 • Mô tả cấu hình : Tập dữ liệu bao gồm các bài đánh giá về các sản phẩm Amazon Video_v1_00 trên thị trường Hoa Kỳ. Mỗi sản phẩm có phiên bản riêng như được chỉ định với nó.

 • Kích thước tải xuống : 132.49 MiB

 • Tách :

Tách ra Các ví dụ
'train' 380.604

amazon_us_reviews / Toys_v1_00

 • Mô tả cấu hình : Tập dữ liệu bao gồm các bài đánh giá về các sản phẩm Amazon Toys_v1_00 trên thị trường Hoa Kỳ. Mỗi sản phẩm có phiên bản riêng như được chỉ định với nó.

 • Kích thước tải xuống : 799.61 MiB

 • Tách :

Tách ra Các ví dụ
'train' 4.864.249

amazon_us_reviews / Tools_v1_00

 • Mô tả cấu hình : Tập dữ liệu bao gồm các bài đánh giá về các sản phẩm Amazon Tools_v1_00 trên thị trường Hoa Kỳ. Mỗi sản phẩm có phiên bản riêng như được chỉ định với nó.

 • Kích thước tải xuống : 318.32 MiB

 • Tách :

Tách ra Các ví dụ
'train' 1.741.100

amazon_us_reviews / Sports_v1_00

 • Mô tả cấu hình : Tập dữ liệu bao gồm các bài đánh giá về các sản phẩm của Amazon Sports_v1_00 trên thị trường Hoa Kỳ. Mỗi sản phẩm có phiên bản riêng như được chỉ định với nó.

 • Kích thước tải xuống : 832.06 MiB

 • Tách :

Tách ra Các ví dụ
'train' 4.850.360

amazon_us_reviews / Software_v1_00

 • Mô tả cấu hình : Tập dữ liệu bao gồm các đánh giá về các sản phẩm Amazon Software_v1_00 trên thị trường Hoa Kỳ. Mỗi sản phẩm có phiên bản riêng như được chỉ định với nó.

 • Kích thước tải xuống : 89.66 MiB

 • Tách :

Tách ra Các ví dụ
'train' 341,931

amazon_us_reviews / Shoes_v1_00

 • Mô tả cấu hình : Tập dữ liệu bao gồm các bài đánh giá về các sản phẩm Amazon Shoes_v1_00 trên thị trường Hoa Kỳ. Mỗi sản phẩm có phiên bản riêng như được chỉ định với nó.

 • Kích thước tải xuống : 612.50 MiB

 • Tách :

Tách ra Các ví dụ
'train' 4.366.916

amazon_us_reviews / Pet_Products_v1_00

 • Mô tả cấu hình : Tập dữ liệu bao gồm các bài đánh giá về các sản phẩm Amazon Pet_Products_v1_00 trên thị trường Hoa Kỳ. Mỗi sản phẩm có phiên bản riêng như được chỉ định với nó.

 • Kích thước tải xuống : 491.92 MiB

 • Tách :

Tách ra Các ví dụ
'train' 2.643.619

amazon_us_reviews / Personal_Care_Appliances_v1_00

 • Mô tả cấu hình : Tập dữ liệu bao gồm các bài đánh giá về các sản phẩm Amazon Personal_Care_Appliances_v1_00 trên thị trường Hoa Kỳ. Mỗi sản phẩm có phiên bản riêng như được chỉ định với nó.

 • Kích thước tải xuống : 16.82 MiB

 • Tách :

Tách ra Các ví dụ
'train' 85,981

amazon_us_reviews / PC_v1_00

 • Mô tả cấu hình : Tập dữ liệu bao gồm các bài đánh giá về các sản phẩm Amazon PC_v1_00 trên thị trường Hoa Kỳ. Mỗi sản phẩm có phiên bản riêng như được chỉ định với nó.

 • Kích thước tải xuống : 1.41 GiB

 • Tách :

Tách ra Các ví dụ
'train' 6.908.554

amazon_us_reviews / Outdoors_v1_00

 • Mô tả cấu hình : Tập dữ liệu bao gồm các bài đánh giá về các sản phẩm Amazon Outdoors_v1_00 trên thị trường Hoa Kỳ. Mỗi sản phẩm có phiên bản riêng như được chỉ định với nó.

 • Kích thước tải xuống : 428.16 MiB

 • Tách :

Tách ra Các ví dụ
'train' 2.302.401

amazon_us_reviews / Office_Products_v1_00

 • Mô tả cấu hình : Tập dữ liệu bao gồm các bài đánh giá về các sản phẩm Amazon Office_Products_v1_00 trên thị trường Hoa Kỳ. Mỗi sản phẩm có phiên bản riêng như được chỉ định với nó.

 • Kích thước tải xuống : 488.59 MiB

 • Tách :

Tách ra Các ví dụ
'train' 2.642.434

amazon_us_reviews / Musical_Inticments_v1_00

 • Mô tả cấu hình : Tập dữ liệu bao gồm các bài đánh giá về các sản phẩm Amazon Musical_Inticments_v1_00 trên thị trường Hoa Kỳ. Mỗi sản phẩm có phiên bản riêng như được chỉ định với nó.

 • Kích thước tải xuống : 184.43 MiB

 • Tách :

Tách ra Các ví dụ
'train' 904.765

amazon_us_reviews / Music_v1_00

 • Mô tả cấu hình : Tập dữ liệu bao gồm các bài đánh giá về các sản phẩm Amazon Music_v1_00 trên thị trường Hoa Kỳ. Mỗi sản phẩm có phiên bản riêng như được chỉ định với nó.

 • Kích thước tải xuống : 1.42 GiB

 • Tách :

Tách ra Các ví dụ
'train' 4.751.577

amazon_us_reviews / Mobile_Electronics_v1_00

 • Mô tả cấu hình : Tập dữ liệu bao gồm các bài đánh giá về các sản phẩm Amazon Mobile_Electronics_v1_00 trên thị trường Hoa Kỳ. Mỗi sản phẩm có phiên bản riêng như được chỉ định với nó.

 • Kích thước tải xuống : 21.81 MiB

 • Tách :

Tách ra Các ví dụ
'train' 104,975

amazon_us_reviews / Mobile_Apps_v1_00

 • Mô tả cấu hình : Tập dữ liệu bao gồm các bài đánh giá về các sản phẩm Amazon Mobile_Apps_v1_00 trên thị trường Hoa Kỳ. Mỗi sản phẩm có phiên bản riêng như được chỉ định với nó.

 • Kích thước tải xuống : 532.11 MiB

 • Tách :

Tách ra Các ví dụ
'train' 5.033.376

amazon_us_reviews / Major_Appliances_v1_00

 • Mô tả cấu hình : Tập dữ liệu bao gồm các bài đánh giá về các sản phẩm Amazon Major_Appliances_v1_00 trên thị trường Hoa Kỳ. Mỗi sản phẩm có phiên bản riêng như được chỉ định với nó.

 • Kích thước tải xuống : 23.23 MiB

 • Tách :

Tách ra Các ví dụ
'train' 96,901

amazon_us_reviews / Lu vali_v1_00

 • Mô tả cấu hình : Tập dữ liệu bao gồm các đánh giá về các sản phẩm Amazon Lu Hành lý_v1_00 trên thị trường Hoa Kỳ. Mỗi sản phẩm có phiên bản riêng như được chỉ định với nó.

 • Kích thước tải xuống : 57.53 MiB

 • Tách :

Tách ra Các ví dụ
'train' 348.657

amazon_us_reviews / Lawn_and_Garden_v1_00

 • Mô tả cấu hình : Tập dữ liệu bao gồm các đánh giá về các sản phẩm Amazon Lawn_and_Garden_v1_00 trên thị trường Hoa Kỳ. Mỗi sản phẩm có phiên bản riêng như được chỉ định với nó.

 • Kích thước tải xuống : 464.22 MiB

 • Tách :

Tách ra Các ví dụ
'train' 2.557.288

amazon_us_reviews / Kitchen_v1_00

 • Mô tả cấu hình : Tập dữ liệu bao gồm các đánh giá về các sản phẩm Amazon Kitchen_v1_00 trên thị trường Hoa Kỳ. Mỗi sản phẩm có phiên bản riêng như được chỉ định với nó.

 • Kích thước tải xuống : 887.63 MiB

 • Tách :

Tách ra Các ví dụ
'train' 4.880.466

amazon_us_reviews / Jewelry_v1_00

 • Mô tả cấu hình : Tập dữ liệu bao gồm các bài đánh giá về các sản phẩm Amazon Jewelry_v1_00 trên thị trường Hoa Kỳ. Mỗi sản phẩm có phiên bản riêng như được chỉ định với nó.

 • Kích thước tải xuống : 235.58 MiB

 • Tách :

Tách ra Các ví dụ
'train' 1.767.753

amazon_us_reviews / Home_Improvement_v1_00

 • Mô tả cấu hình : Tập dữ liệu bao gồm các bài đánh giá về các sản phẩm Amazon Home_Improvement_v1_00 trên thị trường Hoa Kỳ. Mỗi sản phẩm có phiên bản riêng như được chỉ định với nó.

 • Kích thước tải xuống : 480.02 MiB

 • Tách :

Tách ra Các ví dụ
'train' 2.634.781

amazon_us_reviews / Home_Entertainment_v1_00

 • Mô tả cấu hình : Tập dữ liệu bao gồm các bài đánh giá về các sản phẩm Amazon Home_Entertainment_v1_00 trên thị trường Hoa Kỳ. Mỗi sản phẩm có phiên bản riêng như được chỉ định với nó.

 • Kích thước tải xuống : 184.22 MiB

 • Tách :

Tách ra Các ví dụ
'train' 705,889

amazon_us_reviews / Home_v1_00

 • Mô tả cấu hình : Tập dữ liệu bao gồm các bài đánh giá về các sản phẩm Amazon Home_v1_00 trên thị trường Hoa Kỳ. Mỗi sản phẩm có phiên bản riêng như được chỉ định với nó.

 • Kích thước tải xuống : 1.01 GiB

 • Tách :

Tách ra Các ví dụ
'train' 6.221.559

amazon_us_reviews / Health_Personal_Care_v1_00

 • Mô tả cấu hình : Tập dữ liệu bao gồm các đánh giá về các sản phẩm Amazon Health_Personal_Care_v1_00 trên thị trường Hoa Kỳ. Mỗi sản phẩm có phiên bản riêng như được chỉ định với nó.

 • Kích thước tải xuống : 964.34 MiB

 • Tách :

Tách ra Các ví dụ
'train' 5.331.449

amazon_us_reviews / Grocery_v1_00

 • Mô tả cấu hình : Tập dữ liệu bao gồm các bài đánh giá về các sản phẩm Amazon Grocery_v1_00 trên thị trường Hoa Kỳ. Mỗi sản phẩm có phiên bản riêng như được chỉ định với nó.

 • Kích thước tải xuống : 382.74 MiB

 • Tách :

Tách ra Các ví dụ
'train' 2.402.458

amazon_us_reviews / Gift_Card_v1_00

 • Mô tả cấu hình : Tập dữ liệu bao gồm các bài đánh giá về các sản phẩm Amazon Gift_Card_v1_00 trên thị trường Hoa Kỳ. Mỗi sản phẩm có phiên bản riêng như được chỉ định với nó.

 • Kích thước tải xuống : 11.57 MiB

 • Tách :

Tách ra Các ví dụ
'train' 149.086

amazon_us_reviews / Furniture_v1_00

 • Mô tả cấu hình : Tập dữ liệu bao gồm các bài đánh giá về các sản phẩm của Amazon Furniture_v1_00 trên thị trường Hoa Kỳ. Mỗi sản phẩm có phiên bản riêng như được chỉ định với nó.

 • Kích thước tải xuống : 142.08 MiB

 • Tách :

Tách ra Các ví dụ
'train' 792.113

amazon_us_reviews / Electronics_v1_00

 • Mô tả cấu hình : Tập dữ liệu bao gồm các bài đánh giá về các sản phẩm của Amazon Electronics_v1_00 trên thị trường Hoa Kỳ. Mỗi sản phẩm có phiên bản riêng như được chỉ định với nó.

 • Kích thước tải xuống : 666.45 MiB

 • Tách :

Tách ra Các ví dụ
'train' 3.093.869

amazon_us_reviews / Digital_Video_Games_v1_00

 • Mô tả cấu hình : Tập dữ liệu bao gồm các bài đánh giá về các sản phẩm Amazon Digital_Video_Games_v1_00 trên thị trường Hoa Kỳ. Mỗi sản phẩm có phiên bản riêng như được chỉ định với nó.

 • Kích thước tải xuống : 26.17 MiB

 • Tách :

Tách ra Các ví dụ
'train' 145.431

amazon_us_reviews / Digital_Video_Download_v1_00

 • Mô tả cấu hình : Tập dữ liệu bao gồm các bài đánh giá về các sản phẩm Amazon Digital_Video_Download_v1_00 trên thị trường Hoa Kỳ. Mỗi sản phẩm có phiên bản riêng như được chỉ định với nó.

 • Kích thước tải xuống : 483.49 MiB

 • Tách :

Tách ra Các ví dụ
'train' 4.057.147

amazon_us_reviews / Digital_Software_v1_00

 • Mô tả cấu hình : Tập dữ liệu bao gồm các đánh giá về các sản phẩm Amazon Digital_Software_v1_00 trên thị trường Hoa Kỳ. Mỗi sản phẩm có phiên bản riêng như được chỉ định với nó.

 • Kích thước tải xuống : 18.12 MiB

 • Tách :

Tách ra Các ví dụ
'train' 102.084

amazon_us_reviews / Digital_Music_Purchase_v1_00

 • Mô tả cấu hình : Tập dữ liệu bao gồm các bài đánh giá về các sản phẩm Amazon Digital_Music_Purchase_v1_00 trên thị trường Hoa Kỳ. Mỗi sản phẩm có phiên bản riêng như được chỉ định với nó.

 • Kích thước tải xuống : 241.82 MiB

 • Tách :

Tách ra Các ví dụ
'train' 1.688.884

amazon_us_reviews / Digital_Ebook_Purchase_v1_00

 • Mô tả cấu hình : Tập dữ liệu bao gồm các bài đánh giá về các sản phẩm Amazon Digital_Ebook_Purchase_v1_00 trên thị trường Hoa Kỳ. Mỗi sản phẩm có phiên bản riêng như được chỉ định với nó.

 • Kích thước tải xuống : 2.51 GiB

 • Tách :

Tách ra Các ví dụ
'train' 12.520.722

amazon_us_reviews / Camera_v1_00

 • Mô tả cấu hình : Tập dữ liệu bao gồm các bài đánh giá về các sản phẩm Amazon Camera_v1_00 trên thị trường Hoa Kỳ. Mỗi sản phẩm có phiên bản riêng như được chỉ định với nó.

 • Kích thước tải xuống : 422.15 MiB

 • Tách :

Tách ra Các ví dụ
'train' 1.801.974

amazon_us_reviews / Books_v1_00

 • Mô tả cấu hình : Tập dữ liệu bao gồm các bài đánh giá về các sản phẩm Amazon Books_v1_00 trên thị trường Hoa Kỳ. Mỗi sản phẩm có phiên bản riêng như được chỉ định với nó.

 • Kích thước tải xuống : 2.55 GiB

 • Tách :

Tách ra Các ví dụ
'train' 10.319.090

amazon_us_reviews / Beauty_v1_00

 • Mô tả cấu hình : Tập dữ liệu bao gồm các bài đánh giá về các sản phẩm Amazon Beauty_v1_00 trên thị trường Hoa Kỳ. Mỗi sản phẩm có phiên bản riêng như được chỉ định với nó.

 • Kích thước tải xuống : 871.73 MiB

 • Tách :

Tách ra Các ví dụ
'train' 5.115.666

amazon_us_reviews / Baby_v1_00

 • Mô tả cấu hình : Tập dữ liệu bao gồm các bài đánh giá về các sản phẩm Amazon Baby_v1_00 trên thị trường Hoa Kỳ. Mỗi sản phẩm có phiên bản riêng như được chỉ định với nó.

 • Kích thước tải xuống : 340.84 MiB

 • Tách :

Tách ra Các ví dụ
'train' 1.752.932

amazon_us_reviews / Automotive_v1_00

 • Mô tả cấu hình : Tập dữ liệu bao gồm các bài đánh giá về các sản phẩm Amazon Automotive_v1_00 trên thị trường Hoa Kỳ. Mỗi sản phẩm có phiên bản riêng như được chỉ định với nó.

 • Kích thước tải xuống : 555.18 MiB

 • Tách :

Tách ra Các ví dụ
'train' 3.514.942

amazon_us_reviews / Apparel_v1_00

 • Mô tả cấu hình : Tập dữ liệu bao gồm các bài đánh giá về các sản phẩm Amazon Apparel_v1_00 trên thị trường Hoa Kỳ. Mỗi sản phẩm có phiên bản riêng như được chỉ định với nó.

 • Kích thước tải xuống : 618.59 MiB

 • Tách :

Tách ra Các ví dụ
'train' 5.906.333

amazon_us_reviews / Digital_Ebook_Purchase_v1_01

 • Mô tả cấu hình : Tập dữ liệu bao gồm các bài đánh giá về các sản phẩm Amazon Digital_Ebook_Purchase_v1_01 trên thị trường Hoa Kỳ. Mỗi sản phẩm có phiên bản riêng như được chỉ định với nó.

 • Kích thước tải xuống : 1.21 GiB

 • Tách :

Tách ra Các ví dụ
'train' 5.101.693

amazon_us_reviews / Books_v1_01

 • Mô tả cấu hình : Tập dữ liệu bao gồm các bài đánh giá về các sản phẩm Amazon Books_v1_01 trên thị trường Hoa Kỳ. Mỗi sản phẩm có phiên bản riêng như được chỉ định với nó.

 • Kích thước tải xuống : 2.51 GiB

 • Tách :

Tách ra Các ví dụ
'train' 6.106.719

amazon_us_reviews / Books_v1_02

 • Mô tả cấu hình : Tập dữ liệu bao gồm các bài đánh giá về các sản phẩm Amazon Books_v1_02 trên thị trường Hoa Kỳ. Mỗi sản phẩm có phiên bản riêng như được chỉ định với nó.

 • Kích thước tải xuống : 1.24 GiB

 • Tách :

Tách ra Các ví dụ
'train' 3.105.520