TensorFlow 决策森林
import tensorflow_decision_forests as tfdf import pandas as pd # Load a dataset in a Pandas dataframe. train_df = pd.read_csv("project/train.csv") test_df = pd.read_csv("project/test.csv") # Convert the dataset into a TensorFlow dataset. train_ds = tfdf.keras.pd_dataframe_to_tf_dataset(train_df, label="my_label") test_ds = tfdf.keras.pd_dataframe_to_tf_dataset(test_df, label="my_label") # Train a Random Forest model. model = tfdf.keras.RandomForestModel() model.fit(train_ds) # Summary of the model structure. model.summary() # Evaluate the model. model.evaluate(test_ds) # Export the model to a SavedModel. model.save("project/model")
TensorFlow 决策森林 (TF-DF) 是一套先进的算法,可用于训练、应用和解释决策森林模型。该库包含一套 Keras 模型,并且支持分类、回归和排名。
TF-DF 是 Yggdrasil 决策森林 C++ 库的封装容器。使用 TF-DF 训练的模型兼容 Yggdrasil 决策森林模型,反之亦然。
遗憾的是,TF-DF 尚不支持 Mac (#16) 或 Windows (#3),我们正在努力开发。
关键词:决策森林, TensorFlow, 随机森林, 梯度提升树, CART, 模型解释。
社区
您可以使用以下资源:
贡献
欢迎大家为 TensorFlow 决策森林和 Yggdrasil 决策森林贡献代码。如果您要贡献代码,请务必查看开发者手册。