苹果新AI模型：细节捕捉见长！

10-06 1010阅读 0评论

苹果新AI模型：细节捕捉见长！

苹果发布了深度感知专业版（Depth Pro）这一全新的人工智能模型，这一突破性的模型能够在不到一秒的时间内，根据单张2D图像生成详细的3D深度图。

该论文以《Sharp Monocular Metric Depth in Less Than a Second》为标题，在单目深度估计领域引发了重大关注。整个过程仅需使用一幅图像即可推断出深度信息。与Marigold、Depth Anything v2和Metric3D v2等其他模型相比，Depth Pro在细节捕捉方面表现出色，并且只需0.3秒即可生成清晰、高分辨率的深度图，在准确性和细节上超过了其他模型。

据论文介绍，该模型由Aleksei Bochkovskii和Vladlen Koltun团队领导，声称Depth Pro是同类型中生成速度最快、最准确的系统之一。

Depth Pro在传统GPU上可以在0.3秒内生成高分辨率的深度图，创建的图片共有225万像素，并具有卓越的清晰度，能够捕捉到头发和植物等其他方法常常忽略的细节。更特别的是，它能够估测相对深度和绝对深度的能力被称为“度量深度”（Metric depth）。这意味着即使没有特定领域数据集上的广泛训练，该模型也可以做出准确预测。这对增强现实（AR）等应用来说至关重要。

目前，Depth Pro已经在GitHub平台上开源，并鼓励开发者在机器人技术、制造业和医疗保健等领域进一步探索它的潜力。

参考地址：[链接]

Hugging Face平台

补充说明：

[链接]

相关阅读

发表评论取消回复

评论列表（暂无评论，1010人围观）

还没有评论，来说两句吧...

目录[+]