スプレッドシート データを使用して ML モデルをトレーニングする

TensorFlow デシジョン フォレスト(TF-DF) を使用して、表形式のデータから機械学習モデルをトレーニング、評価、デプロイできます。 TF-DF は少量のコードしか必要とせず、数秒でトレーニングできるため、このプロセスは高速です。しかし、データがスプレッドシートにある場合、スプレッドシート内のデータを使用して機械学習モデルをトレーニングし、データを予測する最も簡単な方法は何ですか?

シンプルな ML ロゴ

Simple ML for Sheetsを使用して、ほとんどの ML 作業を Google スプレッドシートで直接行うことができます。シンプル ML の場合:

  1. コードを記述する必要はありません。
  2. トレーニングは、数秒でブラウザーでローカルに実行されます。
  3. Simple ML が生成したモデルを TensorFlow、Colab、または TF Serving にエクスポートできます。

Simple ML は、TensorFlow デシジョン フォレストと同じコードを使用してモデルをトレーニングするため、使いやすさのために品質を犠牲にすることはありません。

始めましょう

見てみましょう

たとえば、次の図は、 Palmer Penguins データセットのコピーを含むスプレッドシートを示しています。各行はペンギンを表します。列の値の一部が欠落していることに注意してください。 Google スプレッドシートの Simple ML アドオンを使用すると、機械学習を使用して欠損値を予測できます。

単純な ML が欠落している種を予測する "

内部では、 Predict Missing Valuesタスクは、指定された列 (この場合はの列) に値を含む行でモデルをトレーニングし、そのモデルを使用して欠損値を予測します。モデルを作成したり調整したりする必要はなく、入力機能がモデルによってどのように使用されるかを構成する必要もありません。Simple ML がすべてを処理します。

Simple ML でできること

Google スプレッドシートで Simple ML アドオンを有効にすると、欠損値を予測し、データの異常値を特定できます。 Simple ML は、スプレッドシートに新しい列を作成して、値と新しい値の信頼度を含めます。

これらのタスクを完了するために、Simple ML はバックグラウンドで ML モデルを作成し、スプレッドシートのデータでトレーニングします。モデルは、Google ドライブ フォルダーのsimple_ml_for_sheetsというフォルダーに保存されます。

モデルをトレーニングするデータの列を選択し、オプションでトレーニング アルゴリズムを選択することで、モデルをトレーニングすることもできます。

モデルがトレーニングされた後、それを使用して、指定された列のすべての値を予測するなどのタスクを実行できます

モデルを評価して理解することができます。

モデルをエクスポートして Colab で使用できます。

モデルの詳細を表示したり、Simple ML が作成したモデルの名前を変更したり削除したりできます。

シンプルな ML でデータを安全に保つ

Simple ML はスプレッドシート データを保持します。 Simple ML は既存のデータを上書きすることはありません。代わりに、予測値と予測の信頼確率を示す新しい列を作成します。これにより、誤ってデータを失うことはありません。

Simple ML のトレーニング操作はすべてブラウザで直接実行されます。つまり、データは完全に Google スプレッドシートに残ります。利点は次のとおりです。

  • プライバシー: データセットとモデルは、Google スプレッドシート以外の第三者 (Google ドライブ以外) には送信されません。
  • 応答性: トレーニングは瞬時に行われます (小さなデータセットの場合)。
  • 割り当て制限なし: マシンをトレーニングに使用しているため、必要な数のモデルを必要なだけトレーニングできます。

シンプルな ML は、スプレッドシートのデータでモデルをトレーニングします

Simple ML を使用すると、詳細を気にすることなくスプレッドシートで ML の機能を利用できます。あなたは全体像だけを気にする必要があります – それらの予測をどうするつもりですか?

ただし、ML モデルの開発と使用について詳しい開発者は、Simple ML を使用してモデルにアクセスできます。たとえば、モデルを手動でトレーニング、評価、適用、または分析したり、新しいモデルを作成するときにトレーニング アルゴリズムを選択したりできます。

Simple ML を使用して欠損値の予測などのタスクを実行すると、ML モデルが生成され、Google ドライブのsimple_ml_for_sheetsというフォルダーに保存されます。その後、そのモデルを使用して予測を行い、他のデータを分析できます。たとえば、保存したモデルを colab にアップロードして、それを使用するコードを記述して実行できます。

スプレッドシートでのシンプル ML の使用の詳細

開始するには、 ML for Sheets の入門チュートリアルをご覧ください。

Simple ML の使用方法の詳細については、 Simple ML for Sheetsのドキュメントをご覧ください。