2023年4月24日下午,北京大学教授王汉生应南科大理学院统计与数据科学系系主任、讲席教授邵启满的邀请,做客理学院第112期科学大讲堂,带来题为“A Sequential Addressing Subsampling Method for Massive Data Analysis under Memory Constraint”的精彩讲座。此次讲座由邵启满主持。
讲座现场
近年来,大规模数据的出现给自动统计推断带来了挑战。特别是如果数据过多无法全部读入内存,则更为明显。因此,需要新的采样技术,可以直接从硬盘中对数据进行采样。王汉生在报告中提出并介绍了一种顺序寻址子采样方法(SAS),他表示相对于随机寻址子采样方法(RAS),新提出的这种SAS方法能够较好地节省时间成本。
此外,王汉生还介绍了基于SAS子样本所构建的估计器,例如样本均值,并研究了它们的性质。为此,王汉生进行了一系列模拟研究,以验证所提出的SAS估计器的有限样本性能,同时向在场师生比较展示了SAS和RAS方法之间的时间成本。
报告最后,王汉生列举了一些基于序列寻址子抽样方法对航空数据的分析的结果,认为这项研究具有比较广阔的发展前景。
王汉生解答师生提问
互动环节中,王汉生与在场师生展开了热烈讨论,并解答了师生关于分布式统计的相关问题。
讲座最后,邵启满为王汉生颁发理学院科学大讲堂荣誉证书并合影留念。
邵启满为王汉生颁发荣誉证书
人物档案
王汉生,北京大学光华管理学院商务统计与经济计量系,教授,博导。国家杰出青年基金获得者,教育部长江学者特聘教授,全国工业统计学教学研究会青年统计学家协会创始会长,美国统计学会(ASA)Fellow,国际统计协会(ISI)Elected Member。先后历任The Annals of Statistics、Computational Statistics & Data Analysis、Journal of Data Science、《经济管理学刊》等9个国际学术期刊副主编(Associate Editor / Editor)。国内外各种专业杂志上发表文章100+篇,并合著有英文专著共1本,(合)著中文教材4本。爱思唯尔中国高被引学者学者(数学类,2014—2019;应用经济学类:2020;统计学类:2021—2022)。