我们提出了两种基于新的可学习三角测量方法的多视图3D人体姿态估计的新颖解决方案,该方法结合了来自多个2D视图的3D信息。第一(基线)解是基本的可微分的代数三角测量,其中增加了从输入图像估计的置信度。第二种解决方案基于来自中间2D骨干特征图的体积聚集的新方法。然后通过3D卷积来精确聚集的体积,其产生最终的3D关节热图并且允许先前对人体姿势建模。至关重要的是,这两种方法都是端到端可区分的,这使我们能够直接优化目标指标。我们展示了跨数据集的解决方案的可转移性,并显着改善了Human3.6M数据集上的多视图技术水平。 Videodemonstration,注释和其他材料将发布在我们的项目页面(https://saic-violet.github.io/learnable-triangulation)。
translated by 谷歌翻译
当数据非线性嵌入高维空间时,现有的内在维度估计方法通常是不可靠的。在这项工作中,我们表明,对未知支持的几何性质的显式计算导致对内在维数的标准最大似然估计的多项式校正。用于扁平歧管。所提出的算法(GeoMLE)通过对不同大小的邻域的距离最近邻居的标准MLE的回归来实现校正。此外,所提出的方法还有效地处理了歧管的非均匀采样的情况。我们在不同的合成和真实世界数据集上进行了大量实验。结果表明,我们的算法实现了最先进的性能,同时具有计算效率和数据中的噪声。
translated by 谷歌翻译
关联数据消费的一大挑战是为可供非技术用户使用的数据创建可视和自然的语言界面。 Ontodia提供对图解数据探索的支持,在此出版物中结合维基数据集展示。我们提出了关于探索和查询关联数据实体的自然语言界面的改进。该方法使用分布式语义大小单双倍投公式来查找与Ontodia中的用户输入相关的运行属性。评估了各种单词嵌入类型和大小单双倍投公式设置,结果表明,使用在视觉数据探索方面的经验可以从提出的方法中受益。
translated by 谷歌翻译
在本文中,我们提出了一种强大的顺序学习策略,用于训练大规模推荐系统(RS)而非主要以点击形式的隐式反馈。我们的方法依赖于最小化成对排名的连续项目块,这些项目由一系列未被点击的项目构成,其后面是每个用户点击的项目。如果给定用户,连续块的数量低于或高于在训练集中的块数分布上估计的某些给定阈值,则丢弃参数更新。这是为了防止某些目标项目的点击次数异常,这主要是由于僵尸程序造成的;或很少的用户交互。两种情况都会影响RS的决策,并暗示向用户显示的项目分布的转变。我们提供了一个理论分析,表明在排序损失是凸的情况下,损失与所提出的算法的最小重量序列之间的偏差是有界的。此外,五个大规模集合的实验结果证明了所提出的算法相对于现有技术方法的效率,这两种方法都涉及不同的测量和计算时间。
translated by 谷歌翻译
我们描述了以下分布式估计问题的通信复杂性。 Alice和Bob观察到$ \ rho $ -correlated单位方差(Gaussian或$ \ pm1 $ binary)随机变量的无数iid副本,其中$ \ rho \ in [-1,1] $。通过交互式交换$ k $位,Bob想要产生$ \ hat \ rho $ $ $ rho $。我们证明了最佳的可能性(通过交互协议$ \ Pi $和estimator $ \ hat \ rho $优化)满足$ \ inf _ {\ Pi,\ hat \ rho} \ sup_ \ rho \ mathbb {E} [| \ rho - \ hat \ rho | ^ 2] = \ Theta(\ tfrac {1} {k})$。此外,我们表明,最好的unbiasedestimator实现了$ 1 + o(1)\的性能超过{2k \ ln 2} $。因此,奇怪的是,将通信限制为$ k $位会导致(顺序)类似的最小估计误差,因为限制为$ k $样本。我们的结果还暗示了Gap-Hamming问题的信息复杂性的$ \ Omega(n)$下限,为此我们展示了直接的信息理论证明。值得注意的是,实现(几乎)最佳性能的协议是单向的(非交互式)。对于单向协议,我们也证明了$ \ Omega(\ tfrac {1} {k})$绑定,即使$ \ rho $仅限于任何小的openub-interval $ [ - 1,1] $(即a局部极小极大下限)。 %我们不知道在交互式设置中这种本地行为是否仍然存在。我们的证明技术依赖于对称的强数据处理不等式,来自信息理论互动共同随机性提取的各种增强技术,以及(对于局部下界)对奥斯坦 - 乌伦贝克半群轨迹的Wasserstein连续性的奥托 - 维拉尼估计。
translated by 谷歌翻译
在这项工作中,我们研究了使用机器学习(ML)技术从发电机终端总线上可用的测量重建发电机大小单双倍投公式的方法。目标是开发一个在线训练并能够快速预测计算的仿真器。基于可用的开源动态生成器大小单双倍投公式生成的合成数据说明了该训练。开发并测试了两种ML技术:(a)标准vectorauto-regression(VAR)大小单双倍投公式; (b)新颖的定制长期短期记忆(LSTM)深度学习大小单双倍投公式。建立并分析了计算轻但线性AR大小单双倍投公式与强大但计算要求的LSTM大小单双倍投公式之间的重建能力之间的权衡。
translated by 谷歌翻译
当可以在多项式时间内计算其分区函数值(统计推断)时,我们称Ising大小单双倍投公式易于处理。易处理性还意味着能够在多项式时间内对该大小单双倍投公式的配置进行采样。可追溯性的概念扩展了平面零场映射大小单双倍投公式的基本情况。我们的出发点是描述基本案例计算分区函数的算法并有效地进行抽样。为了推导算法,我们使用等效的线性过渡来在扩展的双图上完美匹配计数和采样。然后,我们将易处理的推理和采样算法扩展到大小单双倍投公式,其三元组件是平面或$ O(1)$ size的图形。特别是,它产生了多项式时间推断和$ K_ {33} $(次要)自由拓扑的零场Ising大小单双倍投公式的采样算法 - 具有可能无界属的平面图的推广。
translated by 谷歌翻译
我们应用数值方法结合有限差分时域(FDTD)模拟,利用新颖的多保真高斯过程方法,利用五维参数空间上的多目标品质因数优化等离子体镜面滤色器的传输特性。我们将这些结果与传统的无导数全局搜索算法进行比较,例如(单保真)高斯过程优化方案和粒子群优化 - 纳米光子学社区中常用的方法,这是在Lumerical商业光子学软件中实现的。我们在几个预先收集的现实数据集上展示了各种数值优化方法的性能,并表明通过廉价模拟适当地交易廉价信息源,可以更有效地优化具有固定预算的传输属性。
translated by 谷歌翻译
考虑一个Euclidean $ k $ -means或$ k $ -medians聚类的实例。通过投影到随机$ O(\ log(k / \ varepsilon)/ \ varepsilon ^ 2)$ - 维子空间,确定最优解的成本保持高达$(1+ \ varepsilon)$ 。此外,每个聚类的成本都保存在$(1+ \ varepsilon)$内。更一般地,我们的结果适用于满足温和的亚高斯尾条件的任何维度缩减图。我们在维度上的界限几乎是最优的。此外,我们的结果适用于Euclidean $ k $ -clustering,其距离提高到任何$ p $的$ p $ -th幂。对于$ k $ -means,我们的结果解决了Cohen,Elder,Musco,Musco和Persu提出的公开问题(STOC 2015);对于$ k $ -medians,它回答了Kannan提出的问题。
translated by 谷歌翻译
我们研究了深度神经网络(DNN)训练过程中的信息流和内部表征的演变,旨在揭示信息瓶颈理论的压缩方面。理论上提出DNN训练包括快速拟合阶段,然后是较慢的压缩阶段,其中输入$ X $和内部表示$ T $之间的互信息$ I(X; T)$减少。几篇论文观察了不同DNN大小单双倍投公式上估计的互信息的压缩,但这些网络上的真实$ I(X; T)$可证明是恒定的(离散的$ X $)或无限的(连续的$ X $)。这项工作解释了理论和实验之间的差异,并阐明了这些过去的工作实际测量的内容。为此,我们引入了一个辅助(嘈杂)DNN框架,其中$ I(X; T)$是一个有意义的数量依赖于网络的参数。这种noisyframework在性能和学习表示方面都被证明是原始(确定性)DNN的良好代理。然后我们在嘈杂的DNN中开发$ I(X; T)$的精确估计,并观察压缩不变大小单双倍投公式。通过将噪声DNN中的$ I(X; T)$与信息理论通信问题联系起来,我们证明压缩是由来自同一类的输入的隐藏表示的渐进聚类驱动的。在嘈杂和确定性DNN中直接监视隐藏表示的聚类的几种方法用于表示在$ T $空间中形成有意义的聚类。最后,我们回到过去作品中使用的$ I(X; T)$的估计量,并证明虽然它无法捕获真实(空洞)的互信息,但它确实可以作为聚类的一种衡量标准。这澄清了过去对压缩的观察,并将隐藏表征的几何聚类隔离为真实的兴趣现象。
translated by 谷歌翻译