深圳大学西丽校区

学术讲座

【医学部】学术讲座--不平衡和多标签分类算法的研究

2019年03月15日

主讲嘉宾:澳门大学杜杰博士

时  间:2019年3月21日早上 9:30–10:30  

地  点:深圳大学西丽校区医学部A2-517室

主 持 人:雷柏英

主讲嘉宾简介:

    杜杰的研究方向是人工智能和机器学习,主要从事改进神经网络模型使其能更好地处理一些困难问题,比如不平衡数据的分类问题,多标签数据的分类问题,以及数据流的处理。博士期间有三篇文章发表在中科院1区的期刊上,包括Neural Networks, TNNLS  TCYB。同时还有两篇trans文章在审。近期还荣获澳门黄正义基金会奖学金。

 

讲座内容

不平衡和多标签数据广泛存在于我们的现实生活中,例如医疗大数据和社交媒体数据等。但现有的算法并不能很好地处理这些数据。因此,本研究旨在给研究者一些思路上的启发来更好地解决这些困难问题。具体如下:

1) 对不平衡数据的研究:发现真正影响小类(正类)准确率的并不是其数量少,而是其分布不够广;首次发现大类(负类)同样存在分布不够广而导致其分类准确率低的问题;设计并提出能解决上述问题的目标方程,并实际应用在一神经网络模型上;实验结果显示,相较于其他不平衡分类算法,准确率最多可提升14%,并且获得最好的统计分析结果。

2) 对多标签数据流的研究:通过改进一神经网络模型(极限学习机)的目标方程(并推导出新目标方程的闭合解和参数更新规则),使其能快速并有效地处理大规模多标签数据流。实验结果显示,相较于其他多标签数据流分类算法,新提出的算在Hamming Loss 和  F1-measure上都有很大的提升。