机器学习正在从艺术和科学转变为可供每个开发人员使用的技术。在不久的将来,每个平台上的每个应用程序都将包含训练有素的大小单双倍投公式,以编码开发人员无法创作的基于数据的决策。这提出了一个重要的工程挑战,因为目前数据科学和建模在很大程度上与标准软件开发过程脱钩。这种分离使得在应用程序内部的机器学习能力不必要地变得困难,并且进一步阻碍了开发人员将MLin置于首位。在本文中,我们介绍了ML .NET,这是一个在过去十年中在Microsoft开发的框架,用于应对在大型软件应用程序中轻松发布机器学习大小单双倍投公式的挑战。我们提出了它的架构,并阐明了形成它的应用程序需求。具体而言,我们引入了DataView,它是ML .NET的核心数据抽象,它可以有效地,一致地捕获完整的预测管道,并在训练和推理生命周期中进行。我们结束了论文,对ML .NET进行了令人惊讶的有利的性能研究,与更多的接受者相比,并讨论了一些经验教训。
translated by 谷歌翻译
深度图像分类大小单双倍投公式的最新进展为改善相关计算机视觉任务中的最新性能提供了巨大的潜力。然而,当前GPU的严格的存储限制阻碍了向语义分割的过渡。卷积反向支持所需的特征映射高速缓存的范围甚至对形状尺寸大的Pascal图像提出了重大挑战,同时当源分辨率在百万像素范围内时需要仔细的架构考虑。为了解决这些问题,我们提出了一种新颖的基于DenseNet的梯形式架构,该架构具有高建模能力和非常精益的上采样数据路径。 Wealso建议通过利用DenseNet特征提取器的固有空间效率来大幅减少特征映射缓存的范围。与竞争对手相比,这些大小单双倍投公式可提供高性能,参数更少,并允许在商品硬件上以百万像素分辨率进行培训。所呈现的实验结果优于Cityscapes,Pascal VOC2012,CamVid和ROB 2018数据集上的预测准确性和执行速度的最新技术。源代码将在出版时发布。
translated by 谷歌翻译
众所周知,单眼三维物体检测是一种具有挑战性的视觉任务,因为缺少深度信息;尝试使用单独的仅图像方法恢复深度会导致不稳定和噪声的深度估计,从而损害3D检测。在本文中,我们提出了一种基于关键点的新方法,用于从单个RGB图像进行3D对象检测和定位。我们围绕图像中的2D关键点检测构建了多分支大小单双倍投公式,并使用概念上简单的几何推理方法进行补充。我们的网络以端到端的方式执行,同时并相互依赖地估计2D特征,例如2D边界框,关键点和方向,以及场景中的完整3D姿势。我们融合不同分支的输出,在训练期间应用重投影一致性损失。对具有挑战性的KITTI数据集基准测试的实验评估表明,我们的网络在其他单眼3D探测器中实现了最先进的结果。
translated by 谷歌翻译
本文介绍了一种算法,用于规划安全和最佳路线的运输设施,其中无限制的运动方向在具有障碍物的区域内行进。论文解释了使用船舶作为这种运输设施的示例的算法。本文还提供了针对该问题的severalexisting解决方案的调查。该方法采用进化算法来规划若干局部最优路线和平行遗传算法,以通过优化上述一组路径来创建最终路线。假设最佳路线是具有最低到达时间的路线,则针对到达时间优化路线。也可以对路线应用额外的限制。
translated by 谷歌翻译
该技术要求在每个图像对之间预先估计对极几何。它利用相机运动所暗示的约束,以便对输入多样性的参数应用闭合形式的校正。而且,示出了通过部分仿射协变检测器(例如,AKAZE或SIFT)获得的旋转和标度可以通过所提出的算法完成为完全仿射帧。它验证了合成实验和公开可用的真实世界数据集,其方法总是改进评估的仿射协变特征检测器的输出。作为副产品,比较这些检测器并报告获得最准确的仿射帧的检测器。为了证明适用性,我们表明所提出的技术作为预处理步骤提高了相机装备,表面法线和同位素估计的姿态估计的准确性。
translated by 谷歌翻译
本文提出了一种半条件归一化流大小单双倍投公式forsemi-supervised learning。该大小单双倍投公式使用标记和未标记数据,允许对象和标签上的联合分布的显式大小单双倍投公式。大小单双倍投公式的半条件体系结构允许我们有效地计算未标记对象的边际可能性的值和梯度。大小单双倍投公式的条件部分基于提出的条件耦合层。我们演示了不同数据集上半监督分类问题大小单双倍投公式的性能。该大小单双倍投公式优于基于MNIST数据集上的变分自动编码器的基线方法。
translated by 谷歌翻译
大小单双倍投公式 我们旨在使用医学术语来增强临床名称 - 实体识别(NER)的监督大小单双倍投公式的性能。为了用法语评估我们的系统,我们为5种类型的临床建立了一个语料库。我们使用基于术语的系统作为基线,基于UMLS和SNOMED。然后,我们评估了biGRU-CRF,以及使用基于术语的系统的预测作为biGRU-CRF的特征的混合系统。在InEnglish中,我们评估了i2b2-2009药物名称识别药物挑战中的NER系统,其中包含8,573个实体,用于268个文档。在法国,我们建立了APcNER,这是一份包含5个实体(药物名称,标志或症状,疾病或病症,诊断程序或实验室测试和治疗程序)的147个文件的语料库。我们使用针对NER的F-measure的精确和部分匹配定义来评估每个NER系统。 APcNER包含4,837个实体,需要28个小时进行注释,注释器间协议对于完全匹配的药物名称(85%)是可接受的,并且对于非完全匹配的其他实体类型(> 70%)是可接受的。对于i2b2-2009和APcNER的药物名称识别,biGRU-CRF比基于术语的系统表现更好,精确匹配F-测量值分别为91.1%和73%以及81.9%和75%。此外,混合系统的表现优于biGRU-CRF,其非对称F-测量值为92.2%,而91.1%(i2b2-2009)和88.4%对比81.9%(APcNER)。在APcNER语料库中,5个实体上混合系统的微观平均F-度量在精确匹配中为69.5%,在非精确匹配中为84.1%。 APcNER是一个法语语料库,用于五种实体的临床NER,涵盖各种各样的文档类型。扩展监督大小单双倍投公式,使用术语轻松获得,特别是在低实体制度中,以及在i2b2-2009语料库中建立的最先进的结果。
translated by 谷歌翻译
在本文中,我们解决了利用许多可移动物体进行视觉引导的重新布置规划的问题,即,找到一系列动作以将一组物体从初始布置移动到期望的布置,同时直接依赖于来自相机的视觉输入。我们引入了一种有效且可扩展的重排规划方法,解决了大多数现有方法的基本限制,这些方法不能很好地扩展对象的数量。这种提高的效率使我们能够在闭环中使用规划,通过可视工作空间分析来构建一个可以重现的强大重排框架从错误和外部扰动。这项工作的贡献有三个方面。首先,我们开发了类似AlphaGo的重排计划策略,使用重排计划示例训练的apolicy提高蒙特卡罗树搜索(MCTS)的效率。我们凭经验证明,所提出的方法可以很好地适应对象的数量。其次,为了展示计划器在真实机器人上的效率,我们采用了最先进的无校准视觉识别系统,该系统输出单个物体的位置并对其进行扩展以估计包含多个物体的工作空间的状态。第三,我们通过在真实的UR-5机器人手臂上进行几项实验来验证整个管道,解决了具有多个可移动物体的重排计划问题,并且仅需要几秒钟的计算来计算计划。我们还凭经验证明机器人可以成功地从工作空间中的错误和扰动中恢复。我们工作的源代码和预训练大小单双倍投公式可以通过以下网址获得://github.com/ylabbe/rearrangement-planning
translated by 谷歌翻译
用于视觉相似性的度量学习主要采用二元监督来指示一对图像是否属于同一类。这样的二元指示符仅覆盖图像关系的有限子集,并且不足以表示由诸如对象姿势,图像标题和场景图形之类的连续和/或结构化标签描述的图像之间的语义相似性。受此启发,我们提出了一种使用连续标签进行深度metriclearning的新方法。首先,我们提出了一种新的三元组丢失,它允许在学习的度量空间中保留标签空间中的距离比率。因此,建议的损失使我们的大小单双倍投公式能够学习相似程度而不仅仅是顺序。此外,我们设计了一个三重挖掘策略,适用于连续标签的度量学习。我们使用人体姿势,房间布局和图像标题的连续标签来解决三种不同的图像检索任务,并展示了与以前的方法相比,我们的方法的卓越性能。
translated by 谷歌翻译
同态加密的目标是加密数据,使得另一方可以对其进行操作而不明确地暴露于原始数据的内容。我们引入了一个关于自然语言数据的隐私保护转换的想法,受到同态加密的启发。我们的主要工具是{\ em obfuscation},依赖于自然语言的属性。具体而言,使用旨在保留原始句子的语法关系的神经大小单双倍投公式对给定文本进行模糊处理,以便可以解析混淆句子而不是原始句子。该大小单双倍投公式适用于wordlevel,并通过将每个单词更改为具有类似语法角色的新单词来学习分别对每个单词进行模糊处理。与强随机基线相比,我们的大小单双倍投公式加密的文本可以在三个语法分析器(两个依赖和一个辅助解析器)上获得更好的性能。与原始单词相比,取代单词具有相似的句法属性,但具有不同的语义含义。
translated by 谷歌翻译