中国科学院大学郝然教授访谈
2019年6月15日,专委秘书处采访了中国科学院大学国家优秀青年科学基金获得者赫然教授。下面是采访实录。
赫教授,您在图像模式识别理论研究方面取得了一些成果,获得了国家优秀青年科学基金、北京市首届杰出青年科学基金等多项人才项目资助。特别在损失函数(或最优值函数)等价优化基础上的稀疏学习、信息理论学习和生成对抗学习三个方面做出很多优秀工作。您能否向我们介绍一下您如何选择现在的研究方向?以及怎么沿着当前的研究方向慢慢做深的?
模式识别是一个智能任务,是人工智能的重要组成部分。正是在人脸识别和物体分类等经典模式识别问题的深度突破和广泛应用推动了人工智能的快速发展。但另一方面,模式识别基础理论的研究依旧薄弱。初次接触科研,我的导师推荐给我“先见森林,后见树木”的思想。在接触信息理论学习和稀疏学习的初期,我花了半年左右时间仔细阅读了信息理论的经典教材,并且旁听了中国科学院数学所开设的数学课程。这些学习使我对相关研究领域有了较全面的了解,并打下了一定的数学基础。因此,在博士期间以及职业生涯刚刚开始的时期,我主要研究了一簇常用的最优值函数。从共轭函数角度分析了他们之间的区别和联系,提出了它们的半二次展开方式和优化方法,进而建立了信息理论学习和稀疏学习的统一半二次框架,为一些图像模式识别问题的研究提供了不同的解决思路,并取得了一些成果。
随着存储能力和计算能力不断提升,如何使现有理论和深度学习技术相结合,以更低的成本创造出更高的价值,是模式识别领域亟待解决的挑战之一。2014年goodfellow等提出了生成对抗网络,它可以通过对抗博弈的策略从低维白噪声生成高维图像。这促进了生成式机器学习模型的飞速发展,为图像模式分析的研究带来了新的思路。图像生成,一方面可以给人类视觉带来更美好、随心的体验,另一方面可以推动模式分类模型在小样本学习上的发展。人脸图像生成技术是图像生成的一个重要分支,相比于自然场景图像,人脸具有更稳定的拓扑结构,更便于在深度学习技术上进行验证;恰巧我们团队在人脸方向已经有了一些探索,生成模型又与信息理论学习密不可分,之前研究的最优值函数也可以广泛应用于深度学习。综合以上两方面原因,我们选择了人脸图像生成(合成)作为课题组的一个重要研究方向,并在国内较早地实现百万像素(1024分辨率)的人脸图像无条件生成和人脸图像属性变换。由于大规模人脸图像生成的理论和方法研究涉及到很多研究领域的多方面内容,并且人脸图像生成又有着众多具体应用场景,因此我们本着“目标有限、重点突出”的原则,结合华为、百度、地平线等公司的应用需求,从“生成对抗网络理论”以及“高维图像生成方法”两个方面深入研究人脸图像生成。
您在国际顶级期刊和会议上发表了学术论文140篇,其中第一作者ieee tpami论文4篇、ieee tip论文3篇、ieee tnnls论文2篇、ieee cvpr论文3篇并被多次引用,在您取得的这些成果中,有哪些工作让您印象特别深刻?
做研究一定要有严谨的科研态度与习惯,它不是与生俱来的,或者一朝一夕可以养成的,需要经历长期培养和自我规范。对于学术论文的写作,要不断从失败中汲取教训,从而实现锻炼和提升。例如,初次投稿计算机视觉及模式识别领域顶尖期刊ieee tpami时,我经历了四次论文小修(minor),历时1年半才最终被接收。这真的是一次十分磨人耐性的修改经历,但同时更加提醒了我“做科研要非常严谨,语言表达要准确”。自那以后,这句话也常被我挂在嘴边,用来督促自己和学生。
科研项目的申请对于广大科研工作者,尤其是刚刚步入科研行业的青年科技工作者,其重要性不言而喻。您获得了很多国家级和省部级项目,科研项目的选题和撰写应该注意哪些问题?能否分享一下您在申请科研项目的成功经验?
科研项目的选题首先要结合自身的研究方向和研究兴趣,切不可做“墙头草”人云亦云;其次,要淡泊名利,以解决国家和社会面临的重要问题为目标,敢于进行学术界的前沿性探索。此外,项目申请书的结构与写作也是十分重要的,尽量做到结构清晰、图文并茂、高度凝练,并听取不同领域专家的意见,反复修改校正。每一次写完项目申请书,我们会请学生仔细校对,一方面检查申请书是否还存在文字错误,另一方面也让学生了解未来的工作重点,共同探讨更好的尊龙凯时官方入口的解决方案和技术路线。
您近年多次被受邀到一些国际学术机构进行学术访问和交流,并作相关主题报告,如美国马里兰大学(计算机视觉权威学者、ieee fellow、多届iccv和cvpr大会主席larry davis教授),美国普林斯顿大学(信息理论权威学者、ieee tit前主编、美国三院院士vincent poor教授)等。请您分享一下如何做好学术报告,特别在这个方面是如何训练您的学生的?
我们主要以谭铁牛院士的pe3c模型(passiona