6D 姿态数据集为机器人抓取性能设定新标准
来自日本芝浦工业大学的研究人员开发了一个新型 6D 姿态数据集,旨在提高工业环境中机器人抓取的准确性和适应性。该数据集集成了 RGB 和深度图像,显示出在动态环境中提高执行拾取和放置任务的机器人精度的巨大潜力。
本文引用地址:https://www.eepw.com.cn/article/202505/470745.htm准确的对象姿态估计是指机器人确定物体的位置和方向的能力。这对于机器人技术至关重要,特别是在制造和物流等行业中至关重要的拾取和放置任务中。随着机器人越来越多地被赋予复杂的操作任务,它们精确确定物体六个自由度(6D 姿态)的位置和方向的能力变得至关重要。这种能力确保了机器人能够以可靠和安全的方式与物体交互。然而,尽管深度学习取得了进展,6D 姿态估计算法的性能在很大程度上取决于它们所训练的数据的质量。
由日本千叶理工学院工程学院副教授潘宣潭及其团队领导的一项新研究,以及来自越南河内工业大学的阮仲武博士、杜从越先生和裴尚兰博士,越南河内科技大学副教授戴泰 Việt,介绍了一个精心设计的数据库,旨在提高 6D 姿态估计算法的性能。该数据库通过提供一个全面的资源,解决了机器人抓取和自动化研究中的一个主要差距,使机器人能够在现实世界环境中以更高的精度和适应性执行任务。这项研究于 2024 年 11 月 23 日在线发布,并于 2024 年 12 月发表在《工程成果》期刊第 24 卷上。
副教授潘宣潭感叹道:“我们的目标是创建一个不仅推进研究,而且解决工业机器人自动化实际挑战的数据库。我们希望它成为研究人员和工程师的有价值资源。”
研究团队创建了一个不仅满足研究社区需求,而且适用于实际工业环境的数据库。他们使用 Intel RealSenseTM 深度 D435 摄像头捕获了高质量的 RGB 和深度图像,并对每个图像进行了标注,包括物体的 6D 位姿数据(旋转和位移)。该数据库具有各种形状和尺寸,并添加了数据增强技术,以确保其在不同环境条件下的通用性。这种方法使该数据库非常适合广泛的机器人应用。
“我们的数据库经过精心设计,适用于工业领域。通过包含形状和环境变量不同的物体,它不仅为研究人员提供了宝贵的资源,也为在动态和复杂条件下工作的工程师提供了资源,”谭副教授补充道。
该数据集使用最先进的深度学习模型 EfficientPose 和 FFB6D 进行评估,分别达到了 97.05% 和 98.09% 的准确率。高准确率证明该数据集提供了可靠和精确的姿态信息,这对于机器人操作、制造业的质量控制以及自动驾驶等应用至关重要。这些算法在该数据集上的优异表现突出了改进需要精度的机器人系统的潜力。
唐副教授表示,“虽然我们的数据集包括矩形棱柱、梯形和圆柱等基本形状,但将其扩展以包含更多复杂和不规则的物体将使其更适用于实际场景。” 此外,他补充道,“虽然 Intel RealSenseTM 深度 D435 相机提供了出色的深度和 RGB 数据,但数据集对它的依赖可能会限制没有相同设备的 researchers 的可访问性。”
尽管存在这些挑战,研究人员对数据集的影响持乐观态度。结果清楚地表明,精心设计的数据集可以显著提高 6D 姿态估计算法的性能,使机器人能够以更高的精度和效率执行更复杂的任务。
"这些成果值得付出努力!",副教授谭兴奋地喊道。展望未来,团队计划通过纳入更多种类的物体和自动化部分数据收集过程来扩展数据集,以提高其效率和可访问性。这些努力旨在进一步提高数据集的适用性和实用性,使依赖机器人自动化的研究人员和行业受益。
评论