当前位置 : 经济|法律 - 法律论文 → 文章正文

    超大规模图计算在阿里巴巴的应用都有哪些?四篇KDD oral论文抢先看(附论文下

    来源:本站整理| 作者:佚名 | 时间:2018-09-07 12:24:30

      阿里巴巴的研究团队介绍了交互径的概念,同时处理多条径并在它们之间添加依赖关系。结果,这些径被认为是强耦合的。然后将这些交互式径嵌入到低维向量中,该向量可以捕获用户之间的语义关系的全部范围。

      从那里开始,研究人员利用了一种无循环的改组机制。不希望图形结构中的循环,因为它们使得两个节点更难以彼此到达。这种机制改变了径的顺序,以消除不同的循环并最大化径效率。然后,门控循环单元(GRU)架构嵌入交互径,并允许每个 GRU 模拟来自其他 GRU 的相互依赖性。最后,交互径结构嵌入输出被聚合为单个向量,然后可以用于估计语义关系接近度。

      为了测试 IPE 在该领域的有效性,阿里巴巴的技术团队寻找不同类型的异构网络,如 LinkedIn,Facebook,DBLP 和淘宝。在实验中,IPE 和其他几个语义用户搜索基线的任务是根据每个网络特有的特征集定义不同类型的关系。研究人员为每个测试查询用户和每个所需的语义关系构建了理想的排名。他们将这种理想排名与各种最先进的语义用户搜索算法生成的排名进行了比较。在所有这些测试中,IPE 不仅在竞争基线方面表现优异,而且在自身的降级版本方面也表现优异,通常显着。这验证了交互径结构,并为扩展 IPE 以处理异构网络中的属性和动态以进行语义邻近搜索打开了大门。

      电子商务时代正在移动互联网用户的快速增长。主要的电子商务公司现在每天都会看到数十亿的移动访问实例,并且隐藏在这些记录中的是有价值的用户行为特征,例如购物偏好和浏览模式。但是,为了从庞大的数据集中提取此信息,需要将记录链接到相应的移动设备,这一过程称为移动访问记录解析(MARR)。MARR 面临两大挑战:

      根据国际电信联盟(ITU)的一份新报告,2017 年全球移动互联网用户(非用户)数量达到 77.4 亿。随着移动电话取代台式电脑成为最广泛使用的数字平台,移户偏好的特征他们的访问记录中的行为模式变得非常重要。与传统的博客相比,移动访问记录主要依赖于 cookie 来用户行为,因此可以更清晰地了解访问记录中具有各种 ID 的互联网用户。这些 ID 包括:

      IMEI 和 IMSI 分别是一个智能手机和手机号码的标识符。另一方面,UTDID 与这两个基于硬件的标识符完全不同,因为它由阿里巴巴(中国的跨国电子商务公司)生成和使用,用于设备识别。利用这些 ID,可以将访问记录映射到相应的移动电话或应用程序,从而生成更高质量的用户配置文件。将访问记录映射到移动电话或应用程序似乎是一件简单的事情,因为可以使用诸如 IMEI,IMSI 和 UTDID 之类的 ID 来唯一地识别设备和应用程序。但是,从实际应用中收集的数据远非完美。将丢失属性值,噪声(有问题和性)ID 和 ID 转换问题。ID Shift 转换的一种方式是当设备在安装新 SIM 卡时获得新的 IMSI。

    上一页  [1] [2] [3] [4] [5]  下一页


合作伙伴: 开心笑话
Copyright 2010-2012 大戏院论文网 All Rights Reserved. 如需合作请联系站长
技术支持:FXT