用保护、网络入侵检测。孤立地进行恶意代码的检测和主机应用保护,对防御APT攻击来说是很难奏效的。简单来说,解决思路主要有以下几方面:首先,虽然APT的载体存在于大数据中,给APT检测和对抗带来了一系列困难,但是也可以利用大数据对APT进行一些检测和应对。如果有各层面、各阶段的全方位信息数据,即对任何交互行为都进玛瑙m
wg
et行检测,可以利用不同的数据找到不同的阶段进行APT分析其次是全流量分析,其核心是对全年的数据进行存储,在此基础上做宏观的分析、微观特定事件的检测。由于很多流量行为存在统计意义上的普适性规律,因此,要在大数据的情况下进行小样本的异常检测最后要解决大数据空间的不确定性问题。APT攻击是以分布式方式进行的,利用大数据组织、整理相关信息,提高截获攻击者攻击路径的概率。另一种可能是攻击目标是确定的,这种情况下将数据进行存储,形成所谓的历史模式数据,利用对历史模式数据进行重放来发现攻击线索。大数据的4个难题上述方法都是把相关的全部数据做完整的处理与分析。通常,大数据具有4个特征:体量大、速度快、数据格式和类型不同、数据真实精确volume、velocity、variety和veracity。这给数据存储带来一系列难点。对于APT而言,更多的是针对网络空间,而网络空间本身具有数据类型和数据格式不一样,日志信息的行为、内容、结构化各异的特点。利用大数据进行有效地监
f测,不仅可以用来解决APT攻击问题,也可以应用到其它相关领域。对于大数据来说存在着一些共性、普世性的东西,其中包括4个需要关注的难题:1数据的复杂性。大数据的规模已不再是导致复杂性的第一要素,比如连接网络的关系更复杂。由于一些数据包含了某些非法的行为,使得对数据复杂性的定义已经不能使用所谓的规模来定义,而是需要使用一些新的规则。要把数据复杂性解决好,就需要找到数据的传播路径。如何获得传播路径呢一个办法就是搜索,即把所有的可能路径都找出来,然后判定哪些是异常的、有问题的和恶意的。这种判定方法把所有的可能性存下来,然后再去做判定,必然会导致规模巨大。如果从中找到稳定的结构特征,如扩散行为、攻击行为等,就可以采取一系列步骤。利用大数据进行这样的计算,就是寻找结构规则性和网络重合模式,进而解决现有的难点。2计算的复杂性。当数据存在于整个空间的时候,它实际上是一个主体存在多个状态。网上的攻击行为出现后,将其存储下来进行分析,分析之后再获取网上的攻击行为r