amazon_reviews_multi

مراجع:

all_languages

استخدم الأمر التالي لتحميل مجموعة البيانات هذه في TFDS:

ds = tfds.load('huggingface:amazon_reviews_multi/all_languages')
  • وصف :
We provide an Amazon product reviews dataset for multilingual text classification. The dataset contains reviews in English, Japanese, German, French, Chinese and Spanish, collected between November 1, 2015 and November 1, 2019. Each record in the dataset contains the review text, the review title, the star rating, an anonymized reviewer ID, an anonymized product ID and the coarse-grained product category (e.g. books, appliances, etc.) The corpus is balanced across stars, so each star rating constitutes 20% of the reviews in each language.

For each language, there are 200,000, 5,000 and 5,000 reviews in the training, development and test sets respectively. The maximum number of reviews per reviewer is 20 and the maximum number of reviews per product is 20. All reviews are truncated after 2,000 characters, and all reviews are at least 20 characters long.

Note that the language of a review does not necessarily match the language of its marketplace (e.g. reviews from amazon.de are primarily written in German, but could also be written in English, etc.). For this reason, we applied a language detection algorithm based on the work in Bojanowski et al. (2017) to determine the language of the review text and we removed reviews that were not written in the expected language.
  • الترخيص : من خلال الوصول إلى مجموعة مراجعات Amazon متعددة اللغات ("مجموعة المراجعات")، فإنك توافق على أن مجموعة المراجعات هي إحدى خدمات أمازون الخاضعة لشروط استخدام Amazon.com ( https://www.amazon.com/gp/help/ customer/display.html/ref=footer_cou?ie=UTF8&nodeId=508088 ) وتوافق على الالتزام بها، مع الشروط الإضافية التالية:

بالإضافة إلى حقوق الترخيص الممنوحة بموجب شروط الاستخدام، تمنحك أمازون أو موفري المحتوى التابعين لها ترخيصًا محدودًا وغير حصري وغير قابل للتحويل وغير قابل للترخيص من الباطن وقابل للإلغاء للوصول إلى مجموعة المراجعات واستخدامها لأغراض البحث الأكاديمي. لا يجوز لك إعادة بيع أو إعادة نشر أو استخدام أي استخدام تجاري لمجموعة المراجعات أو محتوياتها، بما في ذلك استخدام مجموعة المراجعات للأبحاث التجارية، مثل الأبحاث المتعلقة بعقد تمويل أو استشارة، أو تدريب داخلي، أو أي علاقة أخرى يتم من خلالها تحقيق النتائج. يتم توفيرها مقابل رسوم أو تسليمها إلى منظمة ربحية. لا يجوز لك (أ) ربط أو ربط محتوى في مجموعة المراجعات بأي معلومات شخصية (بما في ذلك حسابات عملاء أمازون)، أو (ب) محاولة تحديد هوية مؤلف أي محتوى في مجموعة المراجعات. إذا انتهكت أيًا من الشروط المذكورة أعلاه، فسيتم إنهاء ترخيصك للوصول إلى مجموعة المراجعات واستخدامها تلقائيًا دون المساس بأي من الحقوق أو التعويضات الأخرى التي قد تكون لدى أمازون.

  • الإصدار : 1.0.0
  • الإنشقاقات :
ينقسم أمثلة
'test' 30000
'train' 1200000
'validation' 30000
  • سمات :
{
    "review_id": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "product_id": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "reviewer_id": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "stars": {
        "dtype": "int32",
        "id": null,
        "_type": "Value"
    },
    "review_body": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "review_title": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "language": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "product_category": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    }
}

دي

استخدم الأمر التالي لتحميل مجموعة البيانات هذه في TFDS:

ds = tfds.load('huggingface:amazon_reviews_multi/de')
  • وصف :
We provide an Amazon product reviews dataset for multilingual text classification. The dataset contains reviews in English, Japanese, German, French, Chinese and Spanish, collected between November 1, 2015 and November 1, 2019. Each record in the dataset contains the review text, the review title, the star rating, an anonymized reviewer ID, an anonymized product ID and the coarse-grained product category (e.g. books, appliances, etc.) The corpus is balanced across stars, so each star rating constitutes 20% of the reviews in each language.

For each language, there are 200,000, 5,000 and 5,000 reviews in the training, development and test sets respectively. The maximum number of reviews per reviewer is 20 and the maximum number of reviews per product is 20. All reviews are truncated after 2,000 characters, and all reviews are at least 20 characters long.

Note that the language of a review does not necessarily match the language of its marketplace (e.g. reviews from amazon.de are primarily written in German, but could also be written in English, etc.). For this reason, we applied a language detection algorithm based on the work in Bojanowski et al. (2017) to determine the language of the review text and we removed reviews that were not written in the expected language.
  • الترخيص : من خلال الوصول إلى مجموعة مراجعات Amazon متعددة اللغات ("مجموعة المراجعات")، فإنك توافق على أن مجموعة المراجعات هي إحدى خدمات أمازون الخاضعة لشروط استخدام Amazon.com ( https://www.amazon.com/gp/help/ customer/display.html/ref=footer_cou?ie=UTF8&nodeId=508088 ) وتوافق على الالتزام بها، مع الشروط الإضافية التالية:

بالإضافة إلى حقوق الترخيص الممنوحة بموجب شروط الاستخدام، تمنحك أمازون أو موفري المحتوى التابعين لها ترخيصًا محدودًا وغير حصري وغير قابل للتحويل وغير قابل للترخيص من الباطن وقابل للإلغاء للوصول إلى مجموعة المراجعات واستخدامها لأغراض البحث الأكاديمي. لا يجوز لك إعادة بيع أو إعادة نشر أو استخدام أي استخدام تجاري لمجموعة المراجعات أو محتوياتها، بما في ذلك استخدام مجموعة المراجعات للأبحاث التجارية، مثل الأبحاث المتعلقة بعقد تمويل أو استشارة، أو تدريب داخلي، أو أي علاقة أخرى يتم من خلالها تحقيق النتائج. يتم توفيرها مقابل رسوم أو تسليمها إلى منظمة ربحية. لا يجوز لك (أ) ربط أو ربط محتوى في مجموعة المراجعات بأي معلومات شخصية (بما في ذلك حسابات عملاء أمازون)، أو (ب) محاولة تحديد هوية مؤلف أي محتوى في مجموعة المراجعات. إذا انتهكت أيًا من الشروط المذكورة أعلاه، فسيتم إنهاء ترخيصك للوصول إلى مجموعة المراجعات واستخدامها تلقائيًا دون المساس بأي من الحقوق أو التعويضات الأخرى التي قد تكون لدى أمازون.

  • الإصدار : 1.0.0
  • الإنشقاقات :
ينقسم أمثلة
'test' 5000
'train' 200000
'validation' 5000
  • سمات :
{
    "review_id": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "product_id": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "reviewer_id": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "stars": {
        "dtype": "int32",
        "id": null,
        "_type": "Value"
    },
    "review_body": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "review_title": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "language": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "product_category": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    }
}

أون

استخدم الأمر التالي لتحميل مجموعة البيانات هذه في TFDS:

ds = tfds.load('huggingface:amazon_reviews_multi/en')
  • وصف :
We provide an Amazon product reviews dataset for multilingual text classification. The dataset contains reviews in English, Japanese, German, French, Chinese and Spanish, collected between November 1, 2015 and November 1, 2019. Each record in the dataset contains the review text, the review title, the star rating, an anonymized reviewer ID, an anonymized product ID and the coarse-grained product category (e.g. books, appliances, etc.) The corpus is balanced across stars, so each star rating constitutes 20% of the reviews in each language.

For each language, there are 200,000, 5,000 and 5,000 reviews in the training, development and test sets respectively. The maximum number of reviews per reviewer is 20 and the maximum number of reviews per product is 20. All reviews are truncated after 2,000 characters, and all reviews are at least 20 characters long.

Note that the language of a review does not necessarily match the language of its marketplace (e.g. reviews from amazon.de are primarily written in German, but could also be written in English, etc.). For this reason, we applied a language detection algorithm based on the work in Bojanowski et al. (2017) to determine the language of the review text and we removed reviews that were not written in the expected language.
  • الترخيص : من خلال الوصول إلى مجموعة مراجعات Amazon متعددة اللغات ("مجموعة المراجعات")، فإنك توافق على أن مجموعة المراجعات هي إحدى خدمات أمازون الخاضعة لشروط استخدام Amazon.com ( https://www.amazon.com/gp/help/ customer/display.html/ref=footer_cou?ie=UTF8&nodeId=508088 ) وتوافق على الالتزام بها، مع الشروط الإضافية التالية:

بالإضافة إلى حقوق الترخيص الممنوحة بموجب شروط الاستخدام، تمنحك أمازون أو موفري المحتوى التابعين لها ترخيصًا محدودًا وغير حصري وغير قابل للتحويل وغير قابل للترخيص من الباطن وقابل للإلغاء للوصول إلى مجموعة المراجعات واستخدامها لأغراض البحث الأكاديمي. لا يجوز لك إعادة بيع أو إعادة نشر أو استخدام أي استخدام تجاري لمجموعة المراجعات أو محتوياتها، بما في ذلك استخدام مجموعة المراجعات للأبحاث التجارية، مثل الأبحاث المتعلقة بعقد تمويل أو استشارة، أو تدريب داخلي، أو أي علاقة أخرى يتم من خلالها تحقيق النتائج. يتم توفيرها مقابل رسوم أو تسليمها إلى منظمة ربحية. لا يجوز لك (أ) ربط أو ربط محتوى في مجموعة المراجعات بأي معلومات شخصية (بما في ذلك حسابات عملاء أمازون)، أو (ب) محاولة تحديد هوية مؤلف أي محتوى في مجموعة المراجعات. إذا انتهكت أيًا من الشروط المذكورة أعلاه، فسيتم إنهاء ترخيصك للوصول إلى مجموعة المراجعات واستخدامها تلقائيًا دون المساس بأي من الحقوق أو التعويضات الأخرى التي قد تكون لدى أمازون.

  • الإصدار : 1.0.0
  • الإنشقاقات :
ينقسم أمثلة
'test' 5000
'train' 200000
'validation' 5000
  • سمات :
{
    "review_id": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "product_id": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "reviewer_id": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "stars": {
        "dtype": "int32",
        "id": null,
        "_type": "Value"
    },
    "review_body": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "review_title": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "language": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "product_category": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    }
}

وفاق

استخدم الأمر التالي لتحميل مجموعة البيانات هذه في TFDS:

ds = tfds.load('huggingface:amazon_reviews_multi/es')
  • وصف :
We provide an Amazon product reviews dataset for multilingual text classification. The dataset contains reviews in English, Japanese, German, French, Chinese and Spanish, collected between November 1, 2015 and November 1, 2019. Each record in the dataset contains the review text, the review title, the star rating, an anonymized reviewer ID, an anonymized product ID and the coarse-grained product category (e.g. books, appliances, etc.) The corpus is balanced across stars, so each star rating constitutes 20% of the reviews in each language.

For each language, there are 200,000, 5,000 and 5,000 reviews in the training, development and test sets respectively. The maximum number of reviews per reviewer is 20 and the maximum number of reviews per product is 20. All reviews are truncated after 2,000 characters, and all reviews are at least 20 characters long.

Note that the language of a review does not necessarily match the language of its marketplace (e.g. reviews from amazon.de are primarily written in German, but could also be written in English, etc.). For this reason, we applied a language detection algorithm based on the work in Bojanowski et al. (2017) to determine the language of the review text and we removed reviews that were not written in the expected language.
  • الترخيص : من خلال الوصول إلى مجموعة مراجعات Amazon متعددة اللغات ("مجموعة المراجعات")، فإنك توافق على أن مجموعة المراجعات هي إحدى خدمات أمازون الخاضعة لشروط استخدام Amazon.com ( https://www.amazon.com/gp/help/ customer/display.html/ref=footer_cou?ie=UTF8&nodeId=508088 ) وتوافق على الالتزام بها، مع الشروط الإضافية التالية:

بالإضافة إلى حقوق الترخيص الممنوحة بموجب شروط الاستخدام، تمنحك أمازون أو موفري المحتوى التابعين لها ترخيصًا محدودًا وغير حصري وغير قابل للتحويل وغير قابل للترخيص من الباطن وقابل للإلغاء للوصول إلى مجموعة المراجعات واستخدامها لأغراض البحث الأكاديمي. لا يجوز لك إعادة بيع أو إعادة نشر أو استخدام أي استخدام تجاري لمجموعة المراجعات أو محتوياتها، بما في ذلك استخدام مجموعة المراجعات للأبحاث التجارية، مثل الأبحاث المتعلقة بعقد تمويل أو استشارة، أو تدريب داخلي، أو أي علاقة أخرى يتم من خلالها تحقيق النتائج. يتم توفيرها مقابل رسوم أو تسليمها إلى منظمة ربحية. لا يجوز لك (أ) ربط أو ربط محتوى في مجموعة المراجعات بأي معلومات شخصية (بما في ذلك حسابات عملاء أمازون)، أو (ب) محاولة تحديد هوية مؤلف أي محتوى في مجموعة المراجعات. إذا انتهكت أيًا من الشروط المذكورة أعلاه، فسيتم إنهاء ترخيصك للوصول إلى مجموعة المراجعات واستخدامها تلقائيًا دون المساس بأي من الحقوق أو التعويضات الأخرى التي قد تكون لدى أمازون.

  • الإصدار : 1.0.0
  • الإنشقاقات :
ينقسم أمثلة
'test' 5000
'train' 200000
'validation' 5000
  • سمات :
{
    "review_id": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "product_id": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "reviewer_id": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "stars": {
        "dtype": "int32",
        "id": null,
        "_type": "Value"
    },
    "review_body": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "review_title": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "language": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "product_category": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    }
}

الاب

استخدم الأمر التالي لتحميل مجموعة البيانات هذه في TFDS:

ds = tfds.load('huggingface:amazon_reviews_multi/fr')
  • وصف :
We provide an Amazon product reviews dataset for multilingual text classification. The dataset contains reviews in English, Japanese, German, French, Chinese and Spanish, collected between November 1, 2015 and November 1, 2019. Each record in the dataset contains the review text, the review title, the star rating, an anonymized reviewer ID, an anonymized product ID and the coarse-grained product category (e.g. books, appliances, etc.) The corpus is balanced across stars, so each star rating constitutes 20% of the reviews in each language.

For each language, there are 200,000, 5,000 and 5,000 reviews in the training, development and test sets respectively. The maximum number of reviews per reviewer is 20 and the maximum number of reviews per product is 20. All reviews are truncated after 2,000 characters, and all reviews are at least 20 characters long.

Note that the language of a review does not necessarily match the language of its marketplace (e.g. reviews from amazon.de are primarily written in German, but could also be written in English, etc.). For this reason, we applied a language detection algorithm based on the work in Bojanowski et al. (2017) to determine the language of the review text and we removed reviews that were not written in the expected language.
  • الترخيص : من خلال الوصول إلى مجموعة مراجعات Amazon متعددة اللغات ("مجموعة المراجعات")، فإنك توافق على أن مجموعة المراجعات هي إحدى خدمات أمازون الخاضعة لشروط استخدام Amazon.com ( https://www.amazon.com/gp/help/ customer/display.html/ref=footer_cou?ie=UTF8&nodeId=508088 ) وتوافق على الالتزام بها، مع الشروط الإضافية التالية:

بالإضافة إلى حقوق الترخيص الممنوحة بموجب شروط الاستخدام، تمنحك أمازون أو موفري المحتوى التابعين لها ترخيصًا محدودًا وغير حصري وغير قابل للتحويل وغير قابل للترخيص من الباطن وقابل للإلغاء للوصول إلى مجموعة المراجعات واستخدامها لأغراض البحث الأكاديمي. لا يجوز لك إعادة بيع أو إعادة نشر أو استخدام أي استخدام تجاري لمجموعة المراجعات أو محتوياتها، بما في ذلك استخدام مجموعة المراجعات للأبحاث التجارية، مثل الأبحاث المتعلقة بعقد تمويل أو استشارة، أو تدريب داخلي، أو أي علاقة أخرى يتم من خلالها تحقيق النتائج. يتم توفيرها مقابل رسوم أو تسليمها إلى منظمة ربحية. لا يجوز لك (أ) ربط أو ربط محتوى في مجموعة المراجعات بأي معلومات شخصية (بما في ذلك حسابات عملاء أمازون)، أو (ب) محاولة تحديد هوية مؤلف أي محتوى في مجموعة المراجعات. إذا انتهكت أيًا من الشروط المذكورة أعلاه، فسيتم إنهاء ترخيصك للوصول إلى مجموعة المراجعات واستخدامها تلقائيًا دون المساس بأي من الحقوق أو التعويضات الأخرى التي قد تكون لدى أمازون.

  • الإصدار : 1.0.0
  • الإنشقاقات :
ينقسم أمثلة
'test' 5000
'train' 200000
'validation' 5000
  • سمات :
{
    "review_id": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "product_id": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "reviewer_id": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "stars": {
        "dtype": "int32",
        "id": null,
        "_type": "Value"
    },
    "review_body": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "review_title": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "language": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "product_category": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    }
}

جا

استخدم الأمر التالي لتحميل مجموعة البيانات هذه في TFDS:

ds = tfds.load('huggingface:amazon_reviews_multi/ja')
  • وصف :
We provide an Amazon product reviews dataset for multilingual text classification. The dataset contains reviews in English, Japanese, German, French, Chinese and Spanish, collected between November 1, 2015 and November 1, 2019. Each record in the dataset contains the review text, the review title, the star rating, an anonymized reviewer ID, an anonymized product ID and the coarse-grained product category (e.g. books, appliances, etc.) The corpus is balanced across stars, so each star rating constitutes 20% of the reviews in each language.

For each language, there are 200,000, 5,000 and 5,000 reviews in the training, development and test sets respectively. The maximum number of reviews per reviewer is 20 and the maximum number of reviews per product is 20. All reviews are truncated after 2,000 characters, and all reviews are at least 20 characters long.

Note that the language of a review does not necessarily match the language of its marketplace (e.g. reviews from amazon.de are primarily written in German, but could also be written in English, etc.). For this reason, we applied a language detection algorithm based on the work in Bojanowski et al. (2017) to determine the language of the review text and we removed reviews that were not written in the expected language.
  • الترخيص : من خلال الوصول إلى مجموعة مراجعات Amazon متعددة اللغات ("مجموعة المراجعات")، فإنك توافق على أن مجموعة المراجعات هي إحدى خدمات أمازون الخاضعة لشروط استخدام Amazon.com ( https://www.amazon.com/gp/help/ customer/display.html/ref=footer_cou?ie=UTF8&nodeId=508088 ) وتوافق على الالتزام بها، مع الشروط الإضافية التالية:

بالإضافة إلى حقوق الترخيص الممنوحة بموجب شروط الاستخدام، تمنحك أمازون أو موفري المحتوى التابعين لها ترخيصًا محدودًا وغير حصري وغير قابل للتحويل وغير قابل للترخيص من الباطن وقابل للإلغاء للوصول إلى مجموعة المراجعات واستخدامها لأغراض البحث الأكاديمي. لا يجوز لك إعادة بيع أو إعادة نشر أو استخدام أي استخدام تجاري لمجموعة المراجعات أو محتوياتها، بما في ذلك استخدام مجموعة المراجعات للأبحاث التجارية، مثل الأبحاث المتعلقة بعقد تمويل أو استشارة، أو تدريب داخلي، أو أي علاقة أخرى يتم من خلالها تحقيق النتائج. يتم توفيرها مقابل رسوم أو تسليمها إلى منظمة ربحية. لا يجوز لك (أ) ربط أو ربط محتوى في مجموعة المراجعات بأي معلومات شخصية (بما في ذلك حسابات عملاء أمازون)، أو (ب) محاولة تحديد هوية مؤلف أي محتوى في مجموعة المراجعات. إذا انتهكت أيًا من الشروط المذكورة أعلاه، فسيتم إنهاء ترخيصك للوصول إلى مجموعة المراجعات واستخدامها تلقائيًا دون المساس بأي من الحقوق أو التعويضات الأخرى التي قد تكون لدى أمازون.

  • الإصدار : 1.0.0
  • الإنشقاقات :
ينقسم أمثلة
'test' 5000
'train' 200000
'validation' 5000
  • سمات :
{
    "review_id": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "product_id": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "reviewer_id": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "stars": {
        "dtype": "int32",
        "id": null,
        "_type": "Value"
    },
    "review_body": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "review_title": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "language": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "product_category": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    }
}

ز

استخدم الأمر التالي لتحميل مجموعة البيانات هذه في TFDS:

ds = tfds.load('huggingface:amazon_reviews_multi/zh')
  • وصف :
We provide an Amazon product reviews dataset for multilingual text classification. The dataset contains reviews in English, Japanese, German, French, Chinese and Spanish, collected between November 1, 2015 and November 1, 2019. Each record in the dataset contains the review text, the review title, the star rating, an anonymized reviewer ID, an anonymized product ID and the coarse-grained product category (e.g. books, appliances, etc.) The corpus is balanced across stars, so each star rating constitutes 20% of the reviews in each language.

For each language, there are 200,000, 5,000 and 5,000 reviews in the training, development and test sets respectively. The maximum number of reviews per reviewer is 20 and the maximum number of reviews per product is 20. All reviews are truncated after 2,000 characters, and all reviews are at least 20 characters long.

Note that the language of a review does not necessarily match the language of its marketplace (e.g. reviews from amazon.de are primarily written in German, but could also be written in English, etc.). For this reason, we applied a language detection algorithm based on the work in Bojanowski et al. (2017) to determine the language of the review text and we removed reviews that were not written in the expected language.
  • الترخيص : من خلال الوصول إلى مجموعة مراجعات Amazon متعددة اللغات ("مجموعة المراجعات")، فإنك توافق على أن مجموعة المراجعات هي إحدى خدمات أمازون الخاضعة لشروط استخدام Amazon.com ( https://www.amazon.com/gp/help/ customer/display.html/ref=footer_cou?ie=UTF8&nodeId=508088 ) وتوافق على الالتزام بها، مع الشروط الإضافية التالية:

بالإضافة إلى حقوق الترخيص الممنوحة بموجب شروط الاستخدام، تمنحك أمازون أو موفري المحتوى التابعين لها ترخيصًا محدودًا وغير حصري وغير قابل للتحويل وغير قابل للترخيص من الباطن وقابل للإلغاء للوصول إلى مجموعة المراجعات واستخدامها لأغراض البحث الأكاديمي. لا يجوز لك إعادة بيع أو إعادة نشر أو استخدام أي استخدام تجاري لمجموعة المراجعات أو محتوياتها، بما في ذلك استخدام مجموعة المراجعات للأبحاث التجارية، مثل الأبحاث المتعلقة بعقد تمويل أو استشارة، أو تدريب داخلي، أو أي علاقة أخرى يتم من خلالها تحقيق النتائج. يتم توفيرها مقابل رسوم أو تسليمها إلى منظمة ربحية. لا يجوز لك (أ) ربط أو ربط محتوى في مجموعة المراجعات بأي معلومات شخصية (بما في ذلك حسابات عملاء أمازون)، أو (ب) محاولة تحديد هوية مؤلف أي محتوى في مجموعة المراجعات. إذا انتهكت أيًا من الشروط المذكورة أعلاه، فسيتم إنهاء ترخيصك للوصول إلى مجموعة المراجعات واستخدامها تلقائيًا دون المساس بأي من الحقوق أو التعويضات الأخرى التي قد تكون لدى أمازون.

  • الإصدار : 1.0.0
  • الإنشقاقات :
ينقسم أمثلة
'test' 5000
'train' 200000
'validation' 5000
  • سمات :
{
    "review_id": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "product_id": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "reviewer_id": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "stars": {
        "dtype": "int32",
        "id": null,
        "_type": "Value"
    },
    "review_body": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "review_title": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "language": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "product_category": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    }
}