2019年11月15日上午,澳大利亚麦考瑞大学的杨坚教授应伟德BETVlCTOR1946邀请,在计算机楼A521作了题为“Twitter中的主题派生”的学术报告。
杨坚,澳大利亚麦考瑞大学伟德BETVlCTOR1946教授,科研副经理,澳洲计算机专委会财务长和秘书长。她是服务计算领域CCF-B级会议ICSOC的创始人之一,常年担任steering chair一职。此外,她也是多个国际会议的PC member,如 ICDE, CAiSE, ER, CoopIS, ICSOC, BPM, ICWS, SCC, WISE等。
随着社交媒体迅速崛起及其用户量的不断膨胀,社交平台上时时产出大量富有明确或隐含价值的信息,成为当今学界研究者们眼中的金矿。主题派生是一个推断推文(tweet)主题的过程。在报告中,杨教授以其团队对于推特主题派生的具体研究工作为例,与现场师生分享了其研究成果和研究经验。她首先将推文(tweets)分组到同一主题上,其次列出推文集和(tweets)中最重要的单词来表征其中最重要的主题,最终得到每一条推文的主题。基于社交网络的大数据分析的相关研究有很多,但现存的分析方法一般都是采用推文内容的各种语义特征(semantic features),大多忽略了推文之间的交互作用。杨坚教授及其研究小组提出了一种新颖的主题推导方法,考虑了推文之间的交互作用(interactions),同时还考虑了用户的行为(actions)和推文的内容(contents)。特别地,主题是通过在推文的交互特征和语义特征上联合执行两步矩阵分解得到的。杨坚教授及其课题组对一段时间内收集到的推文进行了大量实验检测,表明所提出的方法始终优于其他先进的主题推导方法,如LDA、NMF和TNMF等模型。同时,他们的实验还表明,推文之间的交互可以显著缓解由推文的短文本性质造成的稀疏性问题。
最后,杨坚教授针对其团队的研究方法与其他研究方法进行了比较分析,并与现场师生进行交流。报告赢得了在场师生的广泛共鸣,多名师生踊跃提问,与杨教授进行了多方面的交流,取得了良好的互动效果。