不可发布违法信息,一旦发现永久封号,欢迎向我们举报!
百科|常识分享
分享各种百科|日常
18信息网 > 餐饮行业新闻资讯 > 百科|常识 >  北京大学团队获 WWW 2022 唯一最佳学生论文奖 年货怎么选?江西省市场监管局专家团队为您答疑解惑


  • 【莆田鞋厂家分类】
  • 【奢侈大牌包包厂家分类】
  • 【潮牌奢侈服饰鞋子厂家分类】
  • 【名表厂家分类】

厂家货源分类区域

北京大学团队获 WWW 2022 唯一最佳学生论文奖 年货怎么选?江西省市场监管局专家团队为您答疑解惑

发布时间:2024-09-16 13:37:16  来源:互联网整理  浏览:   【】【】【

北京大学团队获 WWW 2022 唯一最佳学生论文奖 年货怎么选?江西省市场监管局专家团队为您答疑解惑 

北京大学团队获 WWW 2022 唯一最佳学生论文奖

图1 获奖证书以及官方宣传

4月29日晚,国际万维网顶会WWW-2022(The Web Conference,简称WWW)公布了本届会议的最佳论文。以北京大学计算机学院崔斌教授博士生张文涛为第一作者的论文“可扩展的图神经结构搜索系统 (PaSca: a Graph Neural Architecture Search System under the Scalable Paradigm)”斩获大会唯一的最佳学生论文奖(Best Student Paper Award)。

WWW官方Award链接:https://www2022.thewebconf.org/awards/

WWW(现改名为 TheWebConf)会议是计算机和互联网领域历史最为悠久同时最为权威的顶级学术会议之一,被中国计算机学会列为A类推荐国际学术会议。本次会议共收到1822篇论文投稿,最终录用 323 篇,录用率为 17.7%。

本次会议仅评选出一篇最佳论文奖和一篇最佳学生论文奖,获奖论文首先被会议“系统和基础设施”方向推荐为最佳论文进入到大会最佳论文候选(共11篇),并在最终评比中获最佳学生论文奖。获奖论文是北京大学DAIR实验室与腾讯机器学习平台部Angel Graph团队共同完成,这是WWW成立30多年以来,中国学术研究机构第2次获得最佳学生论文奖。

论文链接:https://dl.acm.org/doi/10.1145/3485447.3511986

系统链接:https://github.com/PKU-DAIR/SGL

1

内容简介

图神经网络模型在多个图任务上都取得了最佳效果,并受到了学术界和工业界的广泛关注。然而,现有的图神经网络系统有如下图所示的两个瓶颈。一方面,受限于单机场景下的存储和计算开销以及分布式场景下的通信开销,大多数基于消息传播机制(Neural Message Passing,NMP)的图神经网络模型可扩展性较低,很难直接用于现实生活中的大规模图数据。

如图2所示,以典型的基于消息传播机制的GraphSAGE模型为例,分布式场景下的高昂通讯代价限制了图神经网络的可扩展性。此外,如图3所示,现有的图神经网络系统需要用户针对特定图数据和图任务编写代码和训练流程,然而设计网络结构也需要经验丰富的专家,建模成本很高。

图2 图神经网络的可扩展性瓶颈

图3 图神经网络的建模瓶颈

本论文研究了大规模图学习过程中面临的图模型可扩展性低以及建模门槛高两个问题,进而提出了一套能自动化建模超大规模图网络的可扩展图学习系统。具体来说,本文提出了一个新颖的图神经网络建模范式,并基于该范式设计了一个超过15万种网络结构的可扩展图网络设计空间,为图神经网络可扩展性的相关研究指明了一个新的方向和路线。此外,本文还实现并开源了一套多目标(如模型预测效果和资源占用)自动化图神经结构搜索系统,来支持更简单和更高效的大规模图学习。

2

系统目标

区别于现有的大规模图神经网络系统,本文提出的PaSca是一个端到端的系统。如图4所示,系统的输入有两部分组成:1)图数据 2)搜索目标(预测性能、内存占用、训练以及预测效率等)。给定这两个输入,系统能自动化地在预定义的可扩展图网络搜索空间进行高效地搜索,并输出能兼容多个搜索目标的可扩展图神经网络模型。

图4 系统目标概览

3

系统设计与方法

3.1 可扩展性图神经网络建模范式

图5 两种建模范式的对比

如图5所示,现有的图神经网络模型大都遵循如上图所示的消息传递机制。此外,为了兼容主流的图神经网络模型,相应的图神经网络系统也使用基于消息传递机制的系统抽象。然而,基于消息传播机制的图模型在每个batch训练过程中都需要进行聚合和更新操作。当图节点数据分布在不同机器上时,频繁的聚合操作会导致高昂的通信开销。区别于现有的消息传递机制,本文提出的Scalable Paradigm(SGAP)将消息聚合操作和更新操作分离,定义了可扩展性图神经网络建模的新范式:前处理—训练—后处理,消息聚合操作只存在于前处理和后处理中,极大地降低了分布式场景下的通信开销。

3.2 自动化搜索系统

本文提出的自动化搜索系统包含两个模板,分别是搜索引擎以及分布式验证引擎。如图6所示,在每一次迭代中,搜索引擎都会从搜索空间中推荐相应的可扩展图神经网络结构,之后评估引擎训练图网络模型并返回模型的验证结果。

图6 PaSca自动化搜索系统架构图

搜索引擎的主要目标是找到在SGAP建模范式下能同时兼容多个搜索目标的可扩展图神经网络结构。如表1所示,它首先定义了一个包含15万种不同网络结构的搜索空间,并基于贝叶斯优化来实现网络结构的推荐。在每次迭代中,推荐服务器会建模观测到的网络结构与优化目标值之间的关系,并推荐能最好地平衡多个优化目标的网络结构。最后,它基于验证引擎返回的观测结果来更新历史信息。

表1 基于SGAP的网络结构搜索空间

验证引擎的主要是用来高效评估被推荐的模型性能。对于前处理和后处理阶段,图数据聚合器会将图数据划分并存储到多台机器上。对于任意节点,当它的第i-阶消息计算完成之后,工作节点会拉取它的邻居信息并计算它下一阶的信息。在训练阶段,每个工作节点都可以用批训练的方式基于参数服务器来实现网络参数的更新。

4

实验效果

本文在十个真实的数据集上进行实验,实验主要是为了说明:

1)基于SGAP的图神经网络建模范式具有高可扩展性;

2)PaSca系统搜索出来的网络能很好地平衡多个搜索目标,并取得良好的预测性能。

图7 可扩展性分析

本文比较了基于SGAP范式建模的PaSca-APPNP模型以及基于NMP范式建模的GraphSAGE模型在分布式场景下的可扩展性。固定总的批处理大小并增加工作节点的数目,如图7所示,实验发现PaSca-APPNP能够获得更接近理想情况下的加速比。

图8 搜索结果的帕累托平面

如图8所示,实验展示了PaSca系统在Cora数据集的搜索结果的帕累托平面。本文从中挑选了3个代表性的模型,分别命名为PaSca-V1, PaSca-V2和PaSca-V3。这些代表性模型能兼容不同的优化目标,比如PaSca-V3取得了最小的分类误差但是比PaSca-V2的预测时间更久。

图9 搜索结果的训练时间与预测性能对比

如图9所示,本文实验测试了搜索出来的代表性模型在实际Industry数据集上的预测性能和训练时间。可以看到PaSca-V2和PaSca-V3的预测效果都优于JK-Net,但是训练时间更短。此外,如表2所示,本文在八个数据集上测试搜索出来的代表性模型的预测性能。实验发现,基于SGAP建模范式的图神经网络模型能够取得和其他范式下模型相当甚至更好的预测性能。另外,搜索出来的PaSca-V3始终取得了最好的模型预测性能。

表2 搜索结果的预测性能

5

系统应用

Angel Graph图计算团队目前负责论文成果在腾讯内部的技术落地。获奖论文的相关成果已实现于Angel Graph系统并部署于腾讯公司太极机器学习平台,广泛应用于金融风控和社交网络推荐等业务,代表性业务落地场景如下:

1)微信公众号文章视频推荐场景点击率提升1.6%;

2)PCG平台与内容事业群内容风控场景恶意识别覆盖率提升10%;

3)微信运营平台中心社交反欺诈场景欺诈账号识别覆盖率提升20%;

4)全民K歌个人主页用户相似推荐场景人均关注提升2.397%。

6

总结

图神经网络模型在多个图任务上都取得了最佳效果,并受到了学术界和工业界的广泛关注。然而,大多数图神经网络模型可扩展性较低,很难直接用于现实生活中的大规模图数据。此外,设计针对特定图数据和图任务的神经网络结构也需要经验丰富的专家,建模成本很高。

为此,本文提出了一个非常新颖的图神经网络建模范式,并基于该范式设计了一个可扩展的图神经结构搜索空间,为图神经网络可扩展性的相关研究指明了一个新的方向和路线。此外,本文还实现并开源了一套多目标(如模型预测效果和资源占用)自动化图神经结构搜索系统,搜索出来的代表性模型在预测性能、效率以及可扩展性方面都取得了较好的平衡。PaSca系统能帮助研究者更好地探索可扩展的图神经网络结构,极大地促进了图神经网络从学术研究走向实际落地。

7

团队介绍

北京大学数据与智能实验室(Data And Intelligence Research Lab at Peking Univeristy,PKU-DAIR实验室)由北京大学计算机学院崔斌教授领导,长期从事数据库系统、大数据管理与分析、人工智能等领域的前沿研究,在理论和技术创新以及系统研发上取得多项成果,已在国际顶级学术会议和期刊发表学术论文100余篇,发布多个开源项目。

课题组同学曾数十次获得包括CCF优博、北大优博、微软学者、苹果奖学金、谷歌奖学金等荣誉。PKU-DAIR实验室持续与工业界展开卓有成效的合作,与腾讯、阿里巴巴、苹果、微软、百度、快手、中兴通讯等多家知名企业开展项目合作和前沿探索,解决实际问题,进行科研成果的转化落地。本论文得到了国家自然科学基金重点项目和北京大学-腾讯协同创新实验室等资助。

腾讯Angel Graph图计算团队目前主要维护腾讯自研的高性能图计算框架,Angel Graph吸收了Angel参数服务器、Spark以及PyTorch优势,使得传统图计算、图表示学习和图神经网络“三位一体”,实现了高性能、高可靠、易用的大规模分布式图计算框架。

发布于:广东


年货怎么选?江西省市场监管局专家团队为您答疑解惑

大江网/大江新闻客户端讯 (谭红、熊铮)报道:又是一年春节即将来到,您家的年货开始置办了吗?种类繁多的年货该如何选购?有哪些注意事项呢?江西省市场监督管理局专家团队为您答疑解惑,快收下这份“年货食品选购宝典”吧!

年货置办须知

购买年货应选择持有有效食品经营许可证、营业执照的食品经营场所;线上购买年货,应选择正规电商平台。

购买预包装食品时,首先应查看包装封口是否完整紧密,有无破损、胀袋等问题;然后再认真阅读包装上的食品标签,着重关注以下内容:

配料表及营养成分表:食品原辅料有哪些?油、盐、糖含量高不高?尤其是给减肥者和慢性病患者挑选时更要注意。

储存条件及保质期:查看食品生产日期及保质期,同时关注选购的食品该在什么条件下储藏,是室温阴凉处、冷藏还是冷冻?

生产厂家:仔细查看食品包装上有无厂名、厂址、生产许可证号等规范标注内容;进口食品必须标注中文标识。

如何选购果蔬

果蔬常温储藏过久易造成营养流失、萎蔫失水、甚至腐烂变质,因此可选择多品种、少分量地分次购买。一个三口之家每天的蔬菜购买量应在1-1.5公斤并分配在一日三餐中;每周的水果购买量应在4-5公斤,同时应经常更新购买种类,每周果蔬的种类应在10种以上。

同时,要按照果蔬特性选择适当储存方式。如大白菜、圆白菜、洋葱、土豆、甘薯等可以在室温阴凉处储藏一周以上;苹果、梨、橙子等可在室温存放1周以上;猕猴桃、葡萄等则适合冷藏;香蕉、芒果、木瓜等热带水果宜在十几摄氏度的温度下储存。

如何选购坚果及炒货制品

瓜子、花生、开心果、核桃、巴旦木……这些坚果炒货被称为年货界的“中流砥柱”。它们水分含量低,可室温长时间储藏,但应注意防潮,防止吸潮后发霉。这些食品油脂含量高,较易发生氧化,一旦发现有哈喇味,说明产品已经变质,不可食用。儿童食用坚果时不可嬉笑打闹,避免发生坚果卡住气管的情况。

如何选购海鲜、肉类等冷链食品

海鲜、肉类等冷链食品储藏极为重要。若生的肉类、鱼类和海鲜储藏不当,不仅导致新鲜度下降,还可能导致致病菌滋生,进而引发疾病。因此,购买后24h内要烹调的,可放入0-4℃的冷藏室储藏;不急于烹饪的,应分装在保鲜袋中及时冷冻储藏。熟的肉类、鱼类不能放在室温下,应及时冷藏;超过两三天不食用者也需冷冻储藏。同时,食物储藏要注意生熟分区。

疫情期间,不购买来源信息不明的冷链食品,购买进口冷链食品后,应及时消杀。

如何选购腌腊肉制品

腌腊肉制品也是众多家庭春节常备的年货。大部分腌腊肉制品需要烹饪后才能食用,腌腊肉制品脂肪含量偏高,蛋白质含量丰富,且加工过程处于暴露环境。因此,要注意其腐败风险,购买后应放置于通风、阴凉、干燥的环境下,尽量低温贮存。

腌腊肉制品盐分含量高,脂肪氧化产物较多,应做到少吃不贪口。

温馨提示

春节期间年货采购,应根据自身家庭的消费量及贮存条件,理性选择食品品种与数量,保证食品贮存时的卫生质量,防止食品过期变质。[db:内容]?

责任编辑:
热门阅读排行
© 18信息网