TFDS はCroissant 🥐 形式をサポートするようになりました。詳細については、ドキュメントをお読みください。

このページは Cloud Translation API によって翻訳されました。

databricks_dolly

説明:

databricks-dolly-15k databricks/dolly-v2-12bのトレーニングで使用される指示に従う記録のオープンソースデータセットです。このデータセットは、ブレーンストーミング、分類、クローズド QA、生成、情報抽出、オープン QA、および要約。

このデータセットは、クリエイティブコモンズ表示-継承 3.0 非移植ライセンスの条件に基づいて、学術的または商業的であるかを問わず、あらゆる目的に使用できます。

ホームページ: https://github.com/databrickslabs/dolly
ソースコード: tfds.datasets.databricks_dolly.Builder
バージョン:
- 1.0.0 (デフォルト): 初期リリース。
ダウンロードサイズ: 12.60 MiB
データセットのサイズ: 12.69 MiB
自動キャッシュ(ドキュメント): はい
分割:

スプリット	例
`'train'`	15,014

機能の構造:

FeaturesDict({
    'category': Text(shape=(), dtype=string),
    'context': Text(shape=(), dtype=string),
    'instruction': Text(shape=(), dtype=string),
    'response': Text(shape=(), dtype=string),
})

機能ドキュメント:

特徴	クラス	形	Dタイプ	説明
	特徴辞書
カテゴリー	文章		弦
コンテクスト	文章		弦
命令	文章		弦
応答	文章		弦

監視キー( as_supervised docを参照): None
図( tfds.show_examples ): サポートされていません。
例( tfds.as_dataframe ):

引用：

特に記載のない限り、このページのコンテンツはクリエイティブ・コモンズの表示 4.0 ライセンスにより使用許諾されます。コードサンプルは Apache 2.0 ライセンスにより使用許諾されます。詳しくは、Google Developers サイトのポリシーをご覧ください。Java は Oracle および関連会社の登録商標です。

最終更新日 2023-09-09 UTC。