swedish_Medical_ner

Người giới thiệu:

wiki

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:swedish_medical_ner/wiki')
  • Sự miêu tả :
SwedMedNER is a dataset for training and evaluating Named Entity Recognition systems on medical texts in Swedish.
It is derived from medical articles on the Swedish Wikipedia, Läkartidningen, and 1177 Vårdguiden.
  • Giấy phép : Giấy phép Công cộng Quốc tế Creative Commons Ghi công-Chia sẻ tương tự 4.0 (CC BY-SA 4.0) Xem http://creativecommons.org/licenses/by-sa/4.0/ để biết tóm tắt về giấy phép.

  • Phiên bản : 1.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 48720
  • Đặc trưng :
{
    "sid": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "sentence": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "entities": {
        "feature": {
            "start": {
                "dtype": "int32",
                "id": null,
                "_type": "Value"
            },
            "end": {
                "dtype": "int32",
                "id": null,
                "_type": "Value"
            },
            "text": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "type": {
                "num_classes": 3,
                "names": [
                    "Disorder and Finding",
                    "Pharmaceutical Drug",
                    "Body Structure"
                ],
                "names_file": null,
                "id": null,
                "_type": "ClassLabel"
            }
        },
        "length": -1,
        "id": null,
        "_type": "Sequence"
    }
}

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:swedish_medical_ner/lt')
  • Sự miêu tả :
SwedMedNER is a dataset for training and evaluating Named Entity Recognition systems on medical texts in Swedish.
It is derived from medical articles on the Swedish Wikipedia, Läkartidningen, and 1177 Vårdguiden.
  • Giấy phép : Giấy phép Công cộng Quốc tế Creative Commons Ghi công-Chia sẻ tương tự 4.0 (CC BY-SA 4.0) Xem http://creativecommons.org/licenses/by-sa/4.0/ để biết tóm tắt về giấy phép.

  • Phiên bản : 1.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 745753
  • Đặc trưng :
{
    "sid": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "sentence": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "entities": {
        "feature": {
            "start": {
                "dtype": "int32",
                "id": null,
                "_type": "Value"
            },
            "end": {
                "dtype": "int32",
                "id": null,
                "_type": "Value"
            },
            "text": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "type": {
                "num_classes": 3,
                "names": [
                    "Disorder and Finding",
                    "Pharmaceutical Drug",
                    "Body Structure"
                ],
                "names_file": null,
                "id": null,
                "_type": "ClassLabel"
            }
        },
        "length": -1,
        "id": null,
        "_type": "Sequence"
    }
}

1177

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:swedish_medical_ner/1177')
  • Sự miêu tả :
SwedMedNER is a dataset for training and evaluating Named Entity Recognition systems on medical texts in Swedish.
It is derived from medical articles on the Swedish Wikipedia, Läkartidningen, and 1177 Vårdguiden.
  • Giấy phép : Giấy phép Công cộng Quốc tế Creative Commons Ghi công-Chia sẻ tương tự 4.0 (CC BY-SA 4.0) Xem http://creativecommons.org/licenses/by-sa/4.0/ để biết tóm tắt về giấy phép.

  • Phiên bản : 1.0.0

  • Chia tách :

Tách ra Ví dụ
'train' 927
  • Đặc trưng :
{
    "sid": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "sentence": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "entities": {
        "feature": {
            "start": {
                "dtype": "int32",
                "id": null,
                "_type": "Value"
            },
            "end": {
                "dtype": "int32",
                "id": null,
                "_type": "Value"
            },
            "text": {
                "dtype": "string",
                "id": null,
                "_type": "Value"
            },
            "type": {
                "num_classes": 3,
                "names": [
                    "Disorder and Finding",
                    "Pharmaceutical Drug",
                    "Body Structure"
                ],
                "names_file": null,
                "id": null,
                "_type": "ClassLabel"
            }
        },
        "length": -1,
        "id": null,
        "_type": "Sequence"
    }
}