摘要: 【目的/意义】在大数据分析过程中,异常值探测是非常重要的一类分析方法。大数据分析中的异常值探测 是从海量、不完整的、有噪声的、随机的海量数据中发现与其它数据显著不同的或潜在有价值的信息和知识的过 程。对异常值探测方法及其应用进行系统梳理,以期为相关研究提供有益借鉴。【方法/过程】首先针对当前大数据 分析相关研究中常用的异常值探测方法进行分类梳理,并通过原理图来解释各种异常值探测方法的基本思想和原 理,然后结合相关算法给出大数据分析时异常值探测方法的实际应用,最后将各种异常值探测方法的特征进行对 比分析。【结果/结论】各种异常值探测算法在实际问题中应该根据其特点有选择地应用。指出未来研究方向包括: 对算法自身的研究和对应用领域的拓展。