我们提出了两种基于新的可学习三角测量方法的多视图3D人体姿态估计的新颖解决方案,该方法结合了来自多个2D视图的3D信息。第一(基线)解是基本的可微分的代数三角测量,其中增加了从输入图像估计的置信度。第二种解决方案基于来自中间2D骨干特征图的体积聚集的新方法。然后通过3D卷积来精确聚集的体积,其产生最终的3D关节热图并且允许先前对人体姿势建模。至关重要的是,这两种方法都是端到端可区分的,这使我们能够直接优化目标指标。我们展示了跨数据集的解决方案的可转移性,并显着改善了Human3.6M数据集上的多视图技术水平。 Videodemonstration,注释和其他材料将发布在我们的项目页面(https://saic-violet.github.io/learnable-triangulation)。
translated by 谷歌翻译
量子断层摄影术目前无处不在,用于测试量子信息处理设备的任何实现。从测量数据中分离和处理重建的各种复杂程序得到了很好的发展,并且得益于描述状态准备和测量装置的大小单双倍投公式的精确知识。然而,物理大小单双倍投公式受到内在限制,因为实际测量操作符和试验状态不能精确地知道。这种情况不可避免地导致状态准备和测量(SPAM)错误降低重建性能。在这里,我们开发实验性地实现基于机器学习的协议,减少SPAMerrors。我们训练了一个监督神经网络来过滤实验数据,从而揭示了表征原始状态的测量概率和没有SPAM误差的理想实验装置的显着模式。我们将神经网络状态重建协议与通过过程层析成像处理SPAM错误的协议以及具有理想化测量的SPAM不可知协议进行了比较。平均重建保真度显示分别增强10%和27%。所提出的方法适用于依赖于图像的大量量子实验。
translated by 谷歌翻译
源代码审查是手动的,耗时且昂贵的。 Humaninvolvement应该专注于分析程序的最相关方面,例如逻辑和可维护性,而不是修改样式,语法或格式化缺陷。一些具有linting功能的工具可以自动格式化代码并报告支持的编程语言的各种样式违规。它们基于领域专家编写的规则,因此,它们的配置通常很乏味,并且对于给定的一组规则来说,覆盖所有可能的极端情况是不切实际的。一些基于机器学习的解决方案,但它们仍然是无法解释的黑盒子。本文介绍了STYLE-ANALYZER,这是一种新的开源工具,可以使用决策树林大小单双倍投公式自动修复代码格式化,该大小单双倍投公式适用于每个代码库,完全不受监督。 STYLE-ANALYZER建立在我们新颖的辅助代码审查框架Lookout之上。它准确地挖掘了每个分析的Git存储库的格式化风格,并用紧凑的人类可读规则表达了找到的格式模式。然后,STYLE-ANALYZER可以以代码审查注释的形式建议样式不一致性修复。我们评估了STYLE-ANALYZER的输出质量和实际相关性,证明它可以高精度地生成原始样式,在19个流行的Java程序项目上测量,并且通过显示它在修复真实样式错误方面产生了有希望的结果。 STYLE-ANALYZER包含一个Web应用程序,用于可视化规则的触发方式。我们在GitHub上发布STYLE-ANALYZER作为可重复使用和可扩展的开源软件包,以造福社区。
translated by 谷歌翻译
以前关于情绪识别的研究表明,结合听觉,视觉和转录文本等几种形式的共同效应可以评估说话者的情感状态。其中,语言形态对评估表达的情绪至关重要。然而,手动转换的口头文本实际上不能作为系统的输入给出。 Weargue认为,在训练和评估阶段使用地面实况转录会导致与真实世界条件相比在性能上存在显着差异,因为语音文本必须在运行中被识别并且可能包含语句识别错误。在本文中,我们提出了一种将自动语音识别(ASR)输出与用于情感识别的字符级重复神经网络相结合的方法。此外,我们进行了多个实验,研究人体机器人相互作用的情绪识别,这是对ASR系统具有挑战性的噪声现实场景。与仅使用声学模态感知识别相比,Wequantify改进。我们通过在二元情绪分类任务中实现73.6%的准确度来证明这种方法在多模态情感语料库(MOSI)中的有效性,超过先前报告的仅使用声学输入的结果。此外,我们在MOSI数据集上设置了一个新的最佳性能(80.4%的准确率,2%的绝对改进)。
translated by 谷歌翻译
我们提出了一个简单的定理来描述任意采样范式下SGD的收敛性。我们的定理描述了SGD的无限变量阵列的收敛性,每个变量与管理用于形成小批量的数据选择规则的非特定概率法相关联。这是第一次进行这样的分析,并且之前的文献中从未明确考虑过SGD的大多数变体。我们的分析依赖于最近引入的预期光滑度的概念,并且不依赖于随机梯度方差的均匀约束。 。通过将我们的定理专门用于不同的小批量策略,例如替换和独立采样的采样,我们得出了作为小批量大小的函数的步长的表达式。有了这个,我们还可以确定优化总体复杂性的小批量大小,并明确显示随着最小增长评估的随机梯度的方差,最佳小批量大小也是如此。对于零方差,最佳小批量大小为1。此外,我们证明了有洞察力的切换规则,它描述了何时应该从一个常数切换到一个递减的步长制度。
translated by 谷歌翻译
我们寻求基于特定化学性质自动化分子设计。我们的主要贡献是使用SMILES的新的无文本语法和额外的屏蔽逻辑组合生成保证化学有效的SMILES字符串的简单方法;并将分子特性优化作为强化学习问题,特别是应用于变压器模式体系结构的最佳批策略梯度。这种方法使用每个原子更为简单的大小单双倍投公式步骤,从而能够产生更大的分子,并且能够显着提高先进的基线水平。将强化学习应用于具有自定义上下文无关语法以及强制非局部约束的自定义无上下文语法的组合适用于在局部和非局部约束的混合下对图结构的任何优化。
translated by 谷歌翻译
我们提出了一种新的几何正则化原理,用于基于关于它们的发散的先验知识来重建矢量场。作为这个一般概念的一个重要例子,我们专注于矢量场建模血流模式,血流模式应该在动脉中发散并在静脉中收敛。我们表明,这种先前忽略的正则化约束可以显着提高血管树重建的质量,特别是在非零散度集中的分支周围。我们的发散先验对于解决由标准血管过滤器产生的流动取向中的(二元)符号模糊性是至关重要的,例如, FRANGI。我们的血管树中心线重建将发散约束与稳健的曲率正则化相结合。我们的无监督方法可以在合成和真实3D体积上重建具有接近毛细管细节的完整血管树。
translated by 谷歌翻译
从航拍图像中检测建筑物和其他物体在城市规划和地图制作中具有各种应用。从航空影像中进行自动建筑物检测是一项具有挑战性的任务,因为它易于改变照明条件,阴影和遮挡。卷积神经网络(CNNs)是针对这些变体中的一些而做出的,尽管它们无法区分简单和困难的例子。我们通过使用CNN架构DenseNet训练RGB-D图像的检测算法以获得分段掩模。首先,通过应用称为Bootstrapping的统计重新采样技术来改善大小单双倍投公式的性能,并证明保留了更多信息性示例。其次,所提出的方法仅利用原始训练数据的六分之一优于非自助训练,并且在我们的航空影像数据集上获得了95.10%的精确回忆收支平衡。
translated by 谷歌翻译
使用深度卷积网络执行图像处理的系统已经实现了非凡的真实感。基于对抗性鉴别器的感知损失和损失是这些进步背后的两个主要学习目标类别。在这项工作中,我们展示了如何将这两个想法以原则和非加法的方式组合在一起,用于未对齐的图像翻译任务。这是通过生成对抗性学习框架内的歧视者网络的特殊架构来实现的。我们称之为感知鉴别器的新体系结构将预先训练的深度分类网络的卷积部分嵌入鉴别器网络中。得到的体系结构可以在未对齐的图像数据集上进行训练,同时受益于感知损失的鲁棒性和效率。我们通过一系列定性和定量比较来展示新架构的优点,并与基线方法和未对齐图像转换的最新框架进行比较。
translated by 谷歌翻译
深度学习方法被积极地用于脑病变分割。最受欢迎的大小单双倍投公式之一是DeepMedic,它是为胶质瘤和缺血性中风等相对较大的病变进行分割而开发的。在我们的工作中,我们考虑适用于立体定向放射外科的脑肿瘤分割,这限制了典型的病变大小。目标体积的这些差异导致大量假阴性(特别是对于小病变)以及DeepMedic的假阳性数量增加。我们提出了一种新的采样程序,以提高小病灶的网络性能。我们使用了一个来自立体定向放射外科中心的6年数据集。为了评估这一点,我们对三种最常见的脑肿瘤进行了实验:转移,脑膜瘤,神经鞘瘤。除了交叉验证之外,我们还在保留测试装置上评估了质量,该测试装置比火车测试装置收集了几年。实验结果显示两种情况均有实质性改善。
translated by 谷歌翻译