TensorFlow.js 模型

探索预训练模型,将计算机视觉、自然语言处理 (NLP) 和其他常见机器学习任务添加到 Web 应用和基于浏览器的应用中。

Vision

分析图片和视频中的特征。解锁浏览器中的全新实时体验。

图像分类

对 ImageNet 数据库中带标签的图像进行分类 (MobileNet)。

对象检测

定位和识别单个图像中的多个对象 (Coco SSD)。

语义分割

在浏览器中运行语义分割 (DeepLab)。

身体

通过来自 MediaPipe 等项目的模型检测面部、手部和人体的关键点及姿势,这些模型已针对 JavaScript 和 Node.js 进行优化。

简单的人脸检测

使用包含自定义编码器的单次检测器架构 (Blazeface) 检测图像中的人脸。

人脸特征点检测

预测 486 个 3D 人脸特征点,推断出人脸的近似面部几何图形。

姿势检测

统一的姿势检测 API,可使用三个模型之一实时地帮助检测非典型姿势和快速身体动作。

身体分割

实时区分人员和身体部位。

手部姿势检测

手掌检测器和基于手部骨架的手指跟踪模型。根据检测到的手预测 21 个 3D 手部关键点。

人像深度估测

估测单张人像图像的深度图。

文本

借助 BERT 和其他 Transformer 编码器架构的功能在 Web 应用中实现 NLP。

通过自然语言处理回答问题

使用 BERT 根据给定文本段落的内容回答问题。

文本恶意检测

为一条评论可能对整个会话产生的感知影响评分,最低分为“非常恶意”,最高分为“非常健康”(Toxicity)。

Universal Sentence Encoder

对文本进行嵌入式编码,以便用于情感分类和文本相似性等 NLP 任务 (Universal Sentence Encoder)。

音频

对音频进行分类,以便在 Web 应用中检测声音并触发操作。

语音指令识别

对 Speech Commands 数据集里时长为 1 秒的音频片段(语音指令)进行分类。

常规

查找更多开箱即用的 TensorFlow.js 模型。

KNN 分类器

使用 K 最近邻算法创建分类器的实用程序,可用于迁移学习。