策略梯度方法是强大的强化学习算法,并且已被证明可以解决许多复杂的任务。然而,这些方法也是数据无效的,受到高方差梯度估计的影响,并且经常陷入局部最优。这项工作通过将最近改进的非政策数据的重用和参数空间的探索与确定性行为政策相结合来解决这些弱点。由此产生的目标适用于标准的神经网络优化策略,如随机梯度下降或随机梯度哈密顿蒙特卡罗。通过重要性抽样对以前的推出进行大量提高数据效率,而随机优化方案有助于逃避局部最优。我们评估了一系列连续控制基准测试任务的建议方法。结果表明,该算法能够使用比标准策略梯度方法更少的系统交互成功可靠地学习解决方案。
translated by 谷歌翻译
我们介绍Scratchy--一种模块化,轻便的机器人,专为低预算竞争考勤而设计。它的底座主要由标准的4040铝合金轮毂构成,机器人由无刷直流电机上的四个麦克纳姆轮驱动。结合激光测距仪,我们使用估计的测距 - 由编码器计算 - 用于使用粒子滤波器创建地图。 RGB-Dcamera用于物体检测和姿势估计。此外,还可以选择使用6自由度手臂来抓取估计姿势的物体,通常用于操纵任务。机器人可以在不到一个小时的时间内组装成两个手提行李或一个更大的行李箱。因此,它为参加欧洲机器人联盟或RoboCup等机器人比赛的学生团队提供了巨大的优势。因此,这可以保证参与所需的资金,这通常是一个难以克服的障碍,一个很大的障碍。该软件和其他硬件描述可在以下网址获得:https://github.com/homer-robotics/scratchy。
translated by 谷歌翻译
我们提出基于矩的变分推理作为一个灵活的框架,用于平滑潜在马尔可夫跳跃过程的平滑。我们的方法的主要成分是将潜在过程的所有转换的集合划分为类。这允许根据从所选分区自然产生的一组力矩函数来表示近似和精确后验过程之间的Kullback-Leibler散度。为了说明分区的可能选择,我们考虑在应用程序中经常出现的特殊类型的跳过程。然后,我们将结果扩展到参数推断,并在几个示例中演示该方法。
translated by 谷歌翻译
我们在卷积神经网络(CNN)中显示隐式滤波器级稀疏性表现,其使用批量归一化和ReLU激活,并且利用自适应梯度下降技术和L2正则化或权重衰减来训练。通过广泛的实证研究(Mehta et al。,2019),我们假设了稀疏化过程背后的机制,并发现与文献中提出的某些过滤器稀疏化启发式相关联。选择性特征的出现和随后的修剪被认为是有贡献的机制之一,导致特征稀疏性比某些明确的稀疏/修剪方法更好或更好。在本研讨会文章中,我们总结了我们的研究结果,并指出了选择性特征化的推论,这些推论也可以用作过滤修剪的启发式方法。
translated by 谷歌翻译
最近关于神经网络的对抗性脆弱性的研究已经表明,对于对抗性攻击而言训练得更强大的大小单双倍投公式表现出比非强健对应物更可解释的显着性图。我们的目标是通过考虑输入图像和效果图之间的对齐来量化这种行为。我们假设,当决策边界的距离增加时,对齐也是如此。在线性大小单双倍投公式的情况下,这种连接是严格正确的。我们通过基于使用局部Lipschitz正则化训练的大小单双倍投公式的实验来确认这些理论发现,并确定神经网络的线性特性削弱了这种关系。
translated by 谷歌翻译
内窥镜伪影是促进中空器官疾病的诊断和治疗的核心挑战。精确检测特定伪像,如像素饱和度,运动模糊,镜面反射,气泡和碎片,对于高质量的帧恢复至关重要,对于实现可靠的计算机辅助工具以改善患者护理至关重要。目前,由于视频帧中存在大量的多类伪像,目前大多数内窥镜检查视频尚未进行分析。通过内窥镜伪影检测(EAD 2019)的挑战,我们通过解决内窥镜框架伪影的准确识别和定位来解决这一关键瓶颈问题,从而能够对不可用的视频帧进行进一步的关键定量分析,例如镶嵌和3D重建,这对于提供改善的患者护理至关重要。本文总结了挑战任务,并描述了在EAD 2019挑战中建立的数据集和评估标准。
translated by 谷歌翻译
鱼眼摄像机通常用于获得大视场监视,增强现实以及特别是汽车应用。尽管普遍存在,但很少有公共数据集用于详细评估鱼眼图像上的计算机视觉算法。我们发布了第一个广泛的鱼眼汽车数据集WoodScape,它以1906年发明了鱼眼摄像机的罗伯特·伍德的名字命名.WoodScape包括四个环视摄像机和一些任务,包括分割,深度估计,3D边界框检测和污染检测。实例级别的40个类的语义标注为10,000多个图像提供,并为超过100,000个图像提供其他任务的注释。我们希望鼓励社区适应鱼眼摄像机的计算机视觉大小单双倍投公式,而不是天真的整改。
translated by 谷歌翻译
在本文中,我们使用最先进的机器学习技术提供了基于眼周的预测(通常称为性别分类)的综合分析。为了反映更具挑战性的场景,其中可能从未知的源(即传感器)获得眼周图像,在由几个近红外(NIR)和可见波长(VW)图像数据库组成的融合集上训练卷积神经网络。在每个频谱内的交叉传感器场景中,实现了大约85%的平均分类精度。当跨谱进行性别预测时,获得约82%的平均分类准确度。最后,多光谱性别预测产生的平均分类准确度为83%。与提出的工作相比,获得的结果提供了更准确地估计从眼周区域预测受试者的xx的可行性。
translated by 谷歌翻译
深刻学习的卓越表现是不可否认的,在广泛的任务中取得了令人瞩目的成果。然而,这些大小单双倍投公式的输出置信度通常没有很好地校准,这对于对决策的信心对于带来信任和可靠性(例如,自动驾驶或医疗诊断)至关重要的应用来说可能是一个问题。对于在最后一层使用softmax的大小单双倍投公式,温度调节(TS)是一种最先进的校准方法,具有较低的时间和存储器复杂性以及证明的有效性.TS依赖于T参数来重新调整和校准softmax层的值使用标记的数据集来确定该参数的值。我们提出了一种不受监督的温度调节(UTS)方法,该方法不依赖于标记的样本来校准大小单双倍投公式,例如,允许使用一部分测试样本来校准预训练的进入推理模式之前的大小单双倍投公式。我们为悉尼科技大学提供理论依据,并评估其在广泛的深度大小单双倍投公式和数据集上的有效性。我们还对UTS在皮肤病变检测中的校准结果进行了验证,这是一个问题,即校准良好的输出可以在准确决策中发挥重要作用。
translated by 谷歌翻译
大小单双倍投公式 用于无监督表示学习的最先进方法可以训练标准卷积神经网络的前几层,但是它们不如针对更深层的监督学习那么好。这可能是由于浅层的一般性和相对简单的性质;然而,这些方法被应用于数百万张图像,由于未标记的数据收集起来很便宜,因此可扩展性被宣传为主要优势。在本文中,我们质疑这种做法,并询问是否真的需要这么多图像才能容忍无监督学习效果最好的图层。我们的主要结果是,一些甚至单个图像以及强大的数据增强功能足以使性能几乎达到饱和。具体来说,我们提供了三种不同的自我监督特征学习方法(BiGAN,RotNet,DeepCluster)与训练图像数量(1,10,1000)的分析,并表明我们只使用公共网络的前两个卷积层的准确性。单个未标记的训练图像,并获得其他层的竞争结果。我们进一步研究和可视化学习表示作为哪个(单个)图像用于训练的功能。我们的结果也可以通过浅层不同网络捕获哪种类型的信息。
translated by 谷歌翻译