欢迎访问南京邮电大学计算机学院、软件学院、网络空间安全学院!   |  联系我们
首页 > 学术交流 > 文章详情

青年博士论坛预告9月6日(周三) 9:00-12:00

来源: 计算机学院 | 发表时间: 2017-09-01 | 浏览次数: 535

时间:96(周三) 9:00-12:00

地点:仙林校区计算机学科楼327会议室

  

  

报告人:刘斌

题目:贝叶斯矩阵张量分析及其应用

摘要:

矩阵、张量分析是传统的线性代数应用到机器学习领域的重要方向,是缺失值预测(矩阵补全,例如协同过滤)、降维(矩阵分解,例如PCA或者NMF)等领域的理论基础。本文将从两个角度出发介绍一些矩阵张量分析的工作。首先将介绍把矩阵分析应用到多标签学习和基因数据分析的工作。另一方面,传统的矩阵、张量分析主要是基于机器学习的判别模型,如何结合生成模型,用概率的角度重新认识矩阵和张量分析受到越来越多的关注。这里将介绍如何使矩阵、张量补全问题结合贝叶斯学习,分别提出一种概率矩阵补全算法,并将其应用到邻接矩阵缺失值预测(链路预测)和一种基于变分自编码的张量CANDECOMP/PARAFAC分解模型用于张量补全。

报告人简介:

2008年毕业于辽宁工业大学计算数学专业获得理学学士学位,2011年毕业于电子科技大学计算机专业获得工学硕士学位。曾于2011年至2012年就职华为技术有限公司。2013年起就读于电子科技大学计算机学院,攻读博士学位。2016年作为国家建设高水平公派联合培养博士身份,赴加拿大英属哥伦比亚大学进行学术交流。研究方向为矩阵、张量分析,贝叶斯学习及其在生物信息学上的应用,研究成果发表在计算机领域主流的国际期刊(Neural NetworksPattern Recognition Letters)和会议上(IJCNN, Globecom, ICC, MASS, ACML),并在获得2014Globecom最佳论文提名以及2016ACML最佳学生论文第二名。曾担任AAAI 2016/2017, CCPR 2016, ICHI 2015子审稿人,国际期刊International Journal of Bioinformatics Research and ApplicationsICONIP 2017 审稿人。

  

报告人:姚亚洲

题目:多样化高质量图像数据集的自动构建

摘要:

构建人工标注的图像数据集需要耗费大量的人力和时间。为了降低人工标注的成本,利用网络图像自动化的构建图像数据集越来越引起人们的关注。然而,现有自动化方法构建的图像数据集往往具有较弱的域适应能力,通常也被称之为“数据集偏差问题”。为了缓解这一问题,我们提出了一个自动化的通用图像数据集构建框架,可以在确保多样性和准确性的同时而不需要人工标注。为了验证所提出方法的有效性,我们构建了100个类别的图像数据集WSID-100(Web-supervised Image Dataset-100)。实验显示,相比与其他弱监督和网络监督方法所生成的数据,我们方法所生成的数据在图像分类,跨数据集泛化和目标检测等几个任务上性能有显著的提升。我们已经在网站上发布了我们的数据集,我们希望WSID-100数据集的多样性和准确性能够促进机器学习,计算机视觉和其他相关领域的发展。除此之外,我们还提供了一个基准数据集去评估各种算法在训练数据含有少量噪声情形下的性能和鲁棒性,并提供了一个评估各个算法在滤除噪声和选择有用数据任务中性能的基准平台。

报告人简介:

悉尼科技大学大数据技术中心的在读博士研究生,将于20187月毕业。在此之前,分别于20106月和20136月在南京师范大学获得学士与硕士学位,从20139月到20146月,在南京理工大学计算机科学与工程学院攻读博士学位,导师是唐振民教授。在国家留学基金委的支持下,从20147月开始在悉尼科技大学攻读博士学位,导师是张健教授。我的研究兴趣包括大数据分析,社交媒体处理,机器学习。已在IEEE Transactions on Multimedia (CCF-B), Neurocomputing, ACM International Conference on Multimedia(CCF-A), IEEE International Conference on Multimedia and Expo(CCF-B) 等期刊和会议上发表论文5篇,并有2篇期刊论文在审。

  

报告人:陈彬

题目:研究工作报告

摘要:

软件技术、复杂系统和智能技术是信息技术领域研究的重点和热点。研究工作主要包括:(1)软件系统。研究软件建模理论和方法,包括建模理念、语言和工具,系统功能、结构和行为的分析方法,软件架构及设计模式的技术,模型验证的机制等。软件开发的成败往往决定于复杂多变的需求,并需要良好的描述框架和开发过程来引导,因此研究了需求工程和体系结构的相关方法和技术。(2)复杂系统。软件发展的一个趋势是越来越复杂,由简单系统演化为复杂系统。研究了复杂性的处理技术,包括分解、分类、视图、抽象等,可以应用到复杂系统的开发,实现复杂问题简单化。复杂系统在功能和行为上还具有“涌现”、“演化”等复杂性特征,结构上面临“越复杂越容易全面崩溃”的挑战,因此研究了复杂网络、MAS等相关理论和方法。(3)智能技术。软件发展的另一个趋势是越来越智能,成为人类智能外化的手段。智能技术的目标是使机器能像人一样思考,像人一样听懂、看懂,像人一样运动。其中“像人一样思考”是基本的智能技术研究范畴,包括两个主要方面:1)问题是什么?如何求解问题?2)问题求解方法是如何得到的?因此研究了知识表示、智能算法以及机器学习等内容。

报告人简介:

博士,副教授。1998年至2008年在理工大学攻读本科、硕士和博士学位。自2005年开始从事本科和研究生的课程教学工作。长期从事软件技术、复杂系统和智能技术的理论研究和工程实践。参与国家“863”课题、国家自然科学基金等科研项目十余项。以第一作者发表学术论文二十余篇。

  

  

  

  

  


报告人:徐康

题目:社交媒体中短文本情感分析的研究

摘要:

目前社交媒体中用户生成博文(例如,微博和短评论)不断增加,这些内容中包含了大量情感相关的话题,例如民众对社会中发生各种事件的正面和负面的意见。情感分析工作的目的正是研究民众对于不同的产品、时间、组织等对象的情感和意见。其中,情感主题模型可以同时挖掘文本中包含的话题及其对应的情感极性。但是,现有的情感/主题模型只适用于挖掘长文本中情感相关的话题,不能处理像微博文本这样的短文本。本报告主要介绍研究社交媒体中短文本中情感相关主题的挖掘。社交媒体中短文本挖掘的难点主要在于文本中上下文语境稀疏。为了解决这个问题,提出利用社交媒体中短文本的结构信息聚合微博短文本,例如微博发布的时间、用户以及短文本中包含的Hashtag信息。首先提出了一种基于时间和用户信息的情感/主题模型(TUS-LDA),该模型将同一时间段或者相同用户发布的微博文本聚合成虚拟文档,这种聚合方法可以缓解上下文稀疏的问题。同时,也设计了TUS-LDA 的模型推断方法以及融合情感先验知识的方法。在TUS-LDA的基础上,又引入了微博中的Hahstag信息(显式的Hashtag和隐式的Hashtag),并且提出STMP模型。最后展示TUS-LDASTMP 模型抽取出的情感相关的话题。

报告人简介:

男,南京市溧水区人。2007年至2011年本科就读于南京信息工程大学,2011年至2013年硕士就读于上海东华大学。20139月起就读于东南大学计算机科学与工程学院软件工程专业,导师为漆桂林教授。博士期间的主要的研究内容包括情感分析、文本分析、主题模型、知识图谱以及事件抽取等。基于上述这些研究的内容,已经发表了6篇论文,其中4篇一作(CCF B类会议 ECAICCF C类的杂志 IDA、国内知识图谱会议CCKS和国内的语言学会议CCL)和两篇非一作的会议(CCF A类的AAAICCF B类的ISWC)。另有两篇SCI杂志和两篇会议文章在审。同时,也参加一些学术会议和期刊的审稿服务工作,包括CCF A类会议AAAIIJCAIB类会议ISWC的子审稿人,以及SCI期刊Knowledge-Based SystemDecision Support Systems的审稿人。博士期间(2014年)因参与“大规模医疗本体的构建和推理技术及其应用研究”项目在百度实习交流三个月。同时也因欧盟项目SemData的资助,在西班牙的马德里理工大学和德国的卡尔斯鲁厄理工学院交流学习5个月。同时,博士期间也参与实验室的项目,包括与华为合作的互联网分析项目,主要负责其中的事件抽取模块。