当前位置 : 经济|法律 - 法律论文 → 文章正文

    超大规模图计算在阿里巴巴的应用都有哪些?四篇KDD oral论文抢先看(附论文下

    来源:本站整理| 作者:佚名 | 时间:2018-09-07 12:24:30

      SPARC 的灵感来自课程学习。课程学习范式模仿人类的认知过程:基础模型从任务的简单方面训练到基于预定课程的更难的方面。

      虽然这个概念已经应用于许多不同的情况,但试错设计很难在现实世界中应用。然而,一种新的学习范式通过使用自定进度的调节器最小化损失函数来自动学习课程。这被称为自定进度学习。研究小组建立在这种自定进度学习的之上,将其应用于稀有类别分析的场景,缺少标记的例子,以便逐步并同时学习稀有类别嵌入表示和表征模型。SPARC 同时学习图形嵌入并以互利的方式预测稀有类别示例。该框架能够在给定网络(例如不同网络大小)中对不平衡类资格进行建模。SPARC 能够从少量标记的稀有类别示例中学习,从而最大限度地降低标签成本。此外,使用 SPARC 的面向类别的表示能够在嵌入空间中广泛地分离多数类和少数类,这些类在网络拓扑和特征方面是不可分割的。

      为了测试 SPARC 在该领域的有效性,研究人员收集了来自书目协作网络,NLP 网络和社交网络的数据集。该算法按照以下标准与两个无监督网络嵌入算法 DeepWalk 和 LINE 以及另一个半监督框架 PLANETOID 进行了比较:分类准确性,发现的稀有类别示例的百分比和正在检索的真实罕见示例的比率。

      在大多数情况下,SPARC 在所有数据集和评估指标上的表现优于竞争最先进的方法。虽然半监督嵌入网络在分离类别时表现优于无监督方法,但 SPARC 在聚类罕见示例方面表现优异,并且能够仅使用一个标记为罕见类别的示例进行训练。此外,SPARC 更强大,误差小于比较方法。

      Web 平台最吸引人的功能之一是用户与他人联系的能力。例如,在社交上,用户甚至可能不必在平台推荐新连接之前主动搜索朋友。在这些网络平台的表面下面是用户之间庞大的连接网络,并且该网络的大部分依赖于「语义邻近搜索」:将网络中的对象作为查询并根据语义关系对其他对象进行排名。语义邻近搜索查看诸如,就业地点和学校等特征,以确定通过这些连接隐含的语义关系。从那里,搜索将用户作为查询并询问哪些其他用户可能是邻居,同事或同学,相应地对他们进行排名。然后,这些排名用于支持诸如社交上的推荐连接,参考书目网络上的顾问/者连接以及在电子商务平台上链接用户身份等功能。

      然而,语义邻近搜索并不完美。异构列表上的语义关系并不总是明确的,并且对象之间可能缺少链接。先前对语义接近度的研究已经尝试测量与连接查询对象和目标对象的径的语义接近度。但是,这些径在建模中是弱耦合的,每个径都是单独处理的。它们的输出仅在最后阶段汇总,了模型形成对象之间相互依赖关系的完整画面的能力。阿里巴巴的技术团队与来自浙江大学和新加坡高级数字科学中心的研究人员合作,开发了交互式径嵌入(IPE),以更强地耦合语义邻近搜索径,找到用户之间的联系,这些联系可能会被当前基线忽视。

    上一页  [1] [2] [3] [4] [5]  下一页


合作伙伴: 开心笑话
Copyright 2010-2012 大戏院论文网 All Rights Reserved. 如需合作请联系站长
技术支持:FXT