梦见吃饺子近日,从第26届ACM国际多会议(ACM Multimedia)传来喜讯,由王智慧副教授、李豪杰教授指导的大连理工大学-立命馆大学国际信息与软件学院2015级本科生次元政同学的论文“基于条件对抗网络的深度用户引导线稿上色方法”被大会全文录用。ACM Multimedia是中国计算机学会认定的计算机图形学与多领域的A类会议(国际上极少数的会议,鼓励我国学者去突破),今年会议的录取率为27.5%,将于10月下旬在韩国首尔举办。这是我校迄今为止第一次本科生的研究被该会议录取。
近年来,生成对抗网络模型在许多生成任务上都取得了巨大的成功,但是其可控性和过拟合问题仍然没有得到有效解决。次元政发表的论文主要解决数字内容生成领域的用户引导线稿上色问题,即针对一幅线稿,提取其内在的语义信息,并依照用户的颜色提示和网络参数,对线稿进行语义级别上色。论文提出了一种全新的基于局部特征网络和条件WGAN-GP的深度生成对抗模型框架,所设计的神经网络完全利用简单合成的数据进行训练并在真实数据上依然有很好性能,其性能明显优于传统的对抗网络算法和已有的商业化方法。
次元文的发表得益于学院提供的国际化教学和科研,学院大力教授实验室对本科生,次元政加入数字实验室后,获得科研团队的专业指导,结合已有研究基础和想法,确立了用户引导线稿上色为研究目标,为此在短时间内他阅读了生成网络模型领域的上百篇前沿论文,寒假期间为争分夺秒跑实验,在最后攻关阶段更是废寝忘食,常常每天只睡3小时。功夫不负有心人,次元政的论文最终被ACM Multimedia录用。