标签:强化学习 role neu 定位 abi 直接 应用 cat 位置
1.3D Deformable Object Manipulation Using Deep Neural Networks
摘要:由于其高二维性,可变形对象操纵是机器人技术中的一个难题。在本文中,我们提出了一种基于深度神经网络的控制器,以伺服控制具有未知变形特性的可变形物体的位置和形状。特别是,使用在线学习策略,使用多层神经网络在机器人末端执行器的运动与对象的变形测量??之间进行映射。此外,我们引入了一种新颖的功能来描述可视化维修中使用的可变形对象的变形。此功能直接从3D点云中提取,而不是像以前的工作一样从2D图像中提取。另外,我们对可变形物体执行同步跟踪和重构,以解决可变形物体操纵期间的局部观察问题。我们验证了我们的算法和控制器在一组可变形对象操作任务上的性能,并证明了我们的方法可以针对具有多种目标设置的通用可变形对象实现有效且准确的伺服控制。
2.3D Shape Control of Linear Deformable Objects by Robot Manipulator
机器人操纵器对线性可变形物体的3D形状控制
3.A Capability-Aware Role Allocation Approach to Industrial Assembly Tasks
工业装配任务的能力感知角色分配方法
基于精益制造原理的工业机器人单元的部署可以开发快速可重新配置的装配线,在此装配线中,人员和机器人代理可以协作完成共同的任务。为了确保共同努力的有效协调,必须根据定义的指标将每个任务分解为一系列原子动作,这些原子动作可以分配给单个代理,也可以分配给更多代理的组合。尽管任务分配是一个普遍的问题,并且在其他领域也进行了深入讨论,但在涉及混合人机团队的工业场景中,人们的工作投入却较少,尤其是在异构代理之间分配任务时应考虑的因素在协作制造方案中。在本文中,我们研究了工业装配过程中快速可重配置系统的任务分配问题中应考虑的代理特征。首先,我们引入一组指标,即任务复杂性,业务代表灵巧性和业务代表工作量,以评估相对于一项任务的业务代表绩效。其次,我们提出了一种离线分配算法,该算法结合了性能指标,以将任务最佳地分配给团队代理。最后,我们在金属结构的概念验证协作组装中验证框架。结果表明,工作负载是根据代理的特定物理能力和技能水平通过代理共享的。对12个健康参与者的拟议协作框架的主观分析也验证了使用的直观性和改进的性能。
4.A Comparison of Action Spaces for Learning Manipulation Tasks
学习操纵任务的动作空间比较
设计强化学习(RL)问题,可以产生精细而精确的操作策略,需要仔细选择奖励功能,状态和动作空间。将RL应用于操纵任务的许多先前工作已经根据关节空间比例微分(PD)控制器的直接关节扭矩或参考位置定义了动作空间。实际上,通常可以通过利用基于模型的控制器来增加其他结构,该控制器同时支持机械手的动态定位和精确定位。在本文中,我们评估了动态操纵任务的动作空间选择如何影响样本的复杂性以及学习策略的最终质量。我们比较了三个任务(钉插入,锤击和推动),四个动作空间(扭矩,关节PD,逆动力学和阻抗控制)的学习性能,并使用了两种现代强化学习算法(近距离策略优化和软演员临界) )。我们的结果为以下假设提供了支持:学习任务空间阻抗控制器的参考可以大大减少在所有任务和算法中实现良好性能所需的样本数量。
标签:强化学习 role neu 定位 abi 直接 应用 cat 位置
原文地址:https://www.cnblogs.com/feifanrensheng/p/14167698.html