2022年7月16日和7月17日上午,美国密苏里大学哥伦比亚分校许东教授应伟德BETVlCTOR1946邀请,以线上腾讯会议的形式为计算机科学与技术公司的老师和同学们作了题为“Current Trends in Self-supervised Learning”的学术报告。
许东老师是美国密苏里大学哥伦比亚分校电气工程与计算机科学系特聘教授,同时担任Christopher S. Bond生命科学中心研究员和信息技术专业主任。许东老师于2007-2016年担任计算机系主任,2017-2020年担任信息技术项目主任。许东老师于1995年博士毕业于伊利诺伊大学香槟分校,在美国国家癌症研究所做了两年的博士后工作。在加入密苏里大学之前,许东老师一直是橡树岭国家实验室的科学家。30年来,许东老师在计算生物学和生物信息学的多个领域进行了研究,包括:单细胞数据分析、蛋白质结构预测与建模、蛋白质翻译后修饰、蛋白质定位预测、计算系统生物学、生物信息系统和生物信息学在人类、微生物和植物中的应用等。自2012年以来,许东老师的研究重点为深度学习在生物信息学中的应用。许东老师现已累计发表400余篇论文,被引用21,000余次。并于2015年入选美国科学促进会(AAAS)会士,2020年入选美国医学与生物工程研究院(AIMBE)会士。
近年来,自我监督学习 (SSL) 通过利用大量未标记数据集获得有意义的语义表示,取得了令人瞩目的成功。SSL采用自定义伪标签作为监督策略,通过学习显著提高下游任务的性能。在本次报告中,许东教授由浅入深的带领大家回顾了三种主要的SSL方法,即自我预测、对比学习和减少冗余,许东老师也提供了各个方法的相关详细信息和比较,包括对比学习方法(PIRL,SimCLR,MoCo),基于聚类的方法(DeepCluster,SwAV),基于知识蒸馏的方法(BYOL,SimSiam),减少冗余方法(Barlow Twins,VICReg)和多模态学习方法(DCCA,CLIP)。
在报告的最后,许东教授给出了自监督学习与监督学习性能上直观的比较,说明了自监督学习更优的原因,从不同角度对现有的自监督学习的模型进行了分类并指出了未来自监督学习的发展方向以及目前所遇到的挑战。在讲座中及讲座后的讨论时间里,许东教授悉心回答了老师和同学们的问题。首日超过300位同学和老师参加了本次报告,并受到了公司师生的一致好评。