开放识别

能够对画面中全量目标、关联属性和相关行为进行全量解析实时识别。
🔹支持20000+目标识别
🔹支持1000+属性识别
🔹支持300+行为识别

视觉问答

具备强大视图理解和视图描述能力,支持两种模式,满足客户不同应用模式。
🔹根据问题识别图中目标和行为
🔹对图像的内容进行理解和描述

认知推理

具备逻辑推理的能力,具备两种模式,满足客户不同的应用模式。
🔹基于常识逻辑推理
🔹基于场景理解和管理模式进行逻辑推理

迅速微调

具备迅速微调的能力,同时也提供了完善的微调工具链方便客户快速
实现行业化迁移和场景化强化。