策略梯度方法是强大的强化学习算法,并且已被证明可以解决许多复杂的任务。然而,这些方法也是数据无效的,受到高方差梯度估计的影响,并且经常陷入局部最优。这项工作通过将最近改进的非政策数据的重用和参数空间的探索与确定性行为政策相结合来解决这些弱点。由此产生的目标适用于标准的神经网络优化策略,如随机梯度下降或随机梯度哈密顿蒙特卡罗。通过重要性抽样对以前的推出进行大量提高数据效率,而随机优化方案有助于逃避局部最优。我们评估了一系列连续控制基准测试任务的建议方法。结果表明,该算法能够使用比标准策略梯度方法更少的系统交互成功可靠地学习解决方案。
translated by 谷歌翻译
深度高斯过程(DGP)可以模拟复杂的边缘密度以及复杂的映射。非高斯边缘对于模拟真实世界数据是必不可少的,并且可以通过将相关变量结合到大小单双倍投公式来从DGP生成。先前关于DGP大小单双倍投公式的工作已经引入了加性和使用变分推理,其中使用稀疏高斯过程和平均场高斯的组合用于近似后验。加性噪声衰减信号,并且高斯形式的变分布可能导致后验不准确。我们将噪声变量作为潜在协变量,并提出一种新颖的重要性加权目标,它利用分析结果并提供一种权衡计算的机制以提高准确性。我们的研究结果表明,重要加权目标在实践中运作良好,并且始终优于经典变分推理,尤其是对于更深层次的大小单双倍投公式。
translated by 谷歌翻译
差异隐私关注预测质量,同时测量对信息包含在数据中的个人的隐私影响。我们考虑与引起结构化稀疏性的规则制定者的差异私人风险最小化问题。已知这些正则化器是凸的,但它们通常是不可微分的。我们分析了标准的不同私有算法,例如输出扰动,Frank-Wolfe和目标扰动。输出扰动是一种差异私有算法,众所周知,它可以很好地降低强凸的风险。以前的工作已经导出了与维度无关的超额风险界限。在本文中,我们假设一类特定的凸但非光滑正则化器,它们导致广义线性大小单双倍投公式的结构化稀疏性和损失函数。我们还考虑差异私有Frank-Wolfeal算法来优化风险最小化问题的双重性。我们得出这两种算法的过度风险界限。两个边界都取决于双范数的单位球的高斯宽度。我们还表明,风险最小化问题的客观扰动等同于双优化问题的输出扰动。这是在差异隐私的背景下分析风险最小化问题的双重优化问题的第一部作品。
translated by 谷歌翻译
在这项工作中,我们解决了在困难的成像条件下找到可靠的像素级对应的问题。我们提出了一种方法,其中单个卷积神经网络起双重作用:它同时是一个密集的特征描述符和一个特征检测器。通过将检测推迟到后期阶段,基于早期检测低水平结构,获得的关键点比传统的关键点更稳定。我们表明,可以使用从现成的大规模SfM重建中提取的像素对应来训练该大小单双倍投公式,而无需任何进一步的注释。所提出的方法在困难的亚琛日夜定位数据集和InLocindoor定位基准测试中获得最先进的性能,以及用于图像匹配和3D重建的其他基准标记的竞争性能。
translated by 谷歌翻译
与DSLR相机相比,智能手机相机具有更小的传感器,这限制了它们的空间分辨率;较小的孔径,限制了它们的光收集能力;和更小的像素,这降低了它们的信噪比。使用滤色器阵列(CFA)需要去马赛克,这进一步降低了分辨率。在本文中,我们使用多帧超分辨率算法取代传统的去帧在单帧和连拍摄影管道中的应用,该算法直接从CFA原始图像的突发中创建完整的RGB图像。我们利用手持式摄影中典型的自然手震,获得一小段偏移的原始帧。然后对齐并合并这些帧以在每个像素位置处形成具有红色,绿色和蓝色值的单个图像。这种方法不包括显式去掩蔽步骤,用于增加图像分辨率和提高信号噪声比。我们的算法对于具有挑战性的场景条件具有鲁棒性:局部运动,遮挡或场景变化。它在大规模生产的手机上以每12百万像素RAW输入突发帧100毫秒运行。具体来说,该算法是Super-Res Zoom功能的基础,以及Night Sight模式中的默认合并方法(无论是否缩放) onGoogle的旗舰手机。
translated by 谷歌翻译
大小单双倍投公式 虽然人类分析领域的许多个人任务最近都接受了深度学习方法的准确性提升,但由于缺乏数据,多任务学习大多被忽略。正在发布新的合成数据集,用合成生成的数据填补这一空白。在这项工作中,通过利用这些数据集,在多任务场景中分析静态图像中的四个相关人工分析任务。具体来说,我们研究了2D / 3D姿态估计,身体部位分割和全身深度估计的相关性。这些任务是通过众所周知的Stacked Hourglass模块学习的,因此任务特定流的数据与其他流共享信息。 maingoal将分析如何共同训练这四个相关任务可以有利于个人任务,以实现更好的概括。新发布的SUREAL数据集上的结果显示,所有四个任务都受益于多任务方法,但具有不同的任务组合:虽然组合所有四个任务最大程度地提高了2D姿态估计,但2D姿势改善了3D姿态和全身深度估计。另一方面,2D零件分割可以受益于2D姿势,但不受益于3D姿势。在所有情况下,正如预期的那样,在那些显示出空间分布,外观和形状的更多可变性的人体部位上实现了最大的改进。手腕和脚踝。
translated by 谷歌翻译
我们提出了一种基于立体的密集映射算法,用于大规模动态城市环境。与其他现有方法相比,我们同时分别构建静态背景,移动对象和可能移动但当前静止的对象,这对于高级移动机器人任务(例如拥挤环境中的路径规划)是理想的。我们使用实例感知语义分割和稀疏场景流将对象分类为背景,移动或潜在移动,从而确保系统能够对具有从静态到动态的潜在过渡的对象建模,例如停放的汽车。给定从视觉里程计算估计的相机姿势,通过融合从立体声输入计算的深度图,分别重建背景和(可能)移动物体。除了视觉里程计,稀疏场景流也用于估计检测到的移动物体的3D运动,以便准确地重建它们。进一步开发了一种地图修剪技术,以提高重建精度并减少内存消耗,从而提高可扩展性。我们在着名的KITTI数据集上彻底评估我们的系统。我们的系统能够在大约2.5Hz的PC上运行,主要瓶颈是实例感知语义分段,这是我们希望在未来工作中解决的限制。源代码可从项目网站(http://andreibarsan.github.io/dynslam)获得。
translated by 谷歌翻译
这项研究的目的是引入一个全面的步态数据库,包括93名在两个不同时段在两个终点之间行走的人类,并使用两个智能手机记录他们的步态数据,一个连接到右侧,另一个连接在腰部左侧。该数据被收集在内部以供基于深度学习的方法使用,该方法需要足够的时间点。记录包括年龄,性别,吸烟,每日运动时间,身高和体重的元数据。此数据集是公开可用的。
translated by 谷歌翻译
空中交通管制是一种在高度动态和随机环境中的实时安全关键决策过程。在今天的航空实践中,非人类空中交通管制员监视并指挥许多飞机飞越指定的空域部门。随着空中交通复杂性的快速增长(商用客机)和低空(无人机和eVTOL飞机)空域,需要一个自动空中交通管制系统来适应高密度空中交通并确保飞机之间的安全分离。我们提出了一个深层的多智能体强化学习框架,能够识别和解决具有多个交叉点和合并点的高密度,随机和动态航路区域中的飞机之间的冲突。提出的框架利用了一个行为者 - 评论者大小单双倍投公式,A2C结合了近端政策优化(PPO)的损失函数来帮助稳定学习过程。此外,我们使用集中式学习,分散式执行方案,其中一个神经网络被环境中的所有代理学习和共享。我们表明,我们的框架既可扩展又高效,可以为大量的入局飞机提供极高的流量吞吐量和安全保障。我们通过BlueSky环境中的广泛模拟来评估我们的大小单双倍投公式。结果表明,在极端高密度的空中交通情景中,我们的框架能够分别解决交叉点和合并点处所有冲突的99.97%和100%。
translated by 谷歌翻译
对抗性的例子是机器学习大小单双倍投公式的普遍现象,对于其他统计上准确的大小单双倍投公式,对输入引导分类的看似难以察觉的扰动。我们提出了年龄测量框架,借鉴了多种重建文献中的工具,分析了对抗性实例的高维几何。特别强调了维度的重要性:对于嵌入高维空间的低维数据流形,有很多方向。对手的例子是学习决策边界的自然结果,它可以很好地对低维数据流形进行分类,但是对于歧管的分类不正确。使用我们的几何框架,我们证明对抗训练是样本效率低下的,并且显示了足够的采样条件,其中最近邻分类器和基于球的对抗训练是稳健的。最后,我们介绍了Voronoiconstraints的对抗训练,它用训练集中的Voronoi单元格foreach点替换了标准球约束。我们展示了使用Voronoiconstraints进行对抗性训练可以产生强大的大小单双倍投公式,这些大小单双倍投公式可以显着提高MNIST的最新技术水平,并且在CIFAR-10上具有竞争力。
translated by 谷歌翻译