11月29日晚上7点,南开大学统计与数据科学学院李忠华副教授为我院带来了题为“Identification of outlying observations for large-dimensional data”的学术报告,报告由数理学院副院长(主持工作)刘浏教授主持。
李忠华副教授从统计过程控制理论的Phase I阶段中的高维数据异常点识别讲起,详细阐述了关于异常点识别的研究现状,以及目前已有方法的优缺点。李忠华副教授首先介绍了max-normal统计量,以及该统计量的一些渐近性质,随后介绍了通过重复迭代使用最小修剪最大法向距离(least trimmed max-normal distance,LTMD)方法得到一个干净的没有异常点的子集,并利用统计量的渐近性质对数据进行检验,得到了一个干净的子集,再利用干净的子集估计出均值和协方差矩阵,建立一个可以用于识别异常值的统计模型,最后通过计算模拟和实例分析展示了所建立模型的有效性和实用性。此次学术报告向大家展示了一个发现问题和解决问题的基本思路,让大家了解到了一些识别高维数据异常点的有效方法,激发了大家关于异常点识别的更多思考,有助于更深层次的统计研究。
最后,李忠华副教授细致地回答了与会师生们提出的各类问题,并就目前的研究工作与大家进行了分享交流。
