近年来着重于研发邮件稽核技术的绿色运算(Green-Computing),已在核心引擎中纳入非结构化资料的探勘,也就是巨量机敏资料侦测技术(Multi- Pattern Matching,MPM),为下一步发展Big Data奠定基础。
绿色运算副总经理陈兆宁说明,稽核机制的应用情境会有许多实务上的特殊规则限制,像是同一封邮件的收件者不能同时存在有供应商与客户,以及收件者不得为竞争公司,诸如此类应用情境要求。对于高科技制造业,尤其是IC设计等强烈依赖智慧财产的行业而言,万一因误寄邮件而外泄机敏资料,损失或诉讼求偿金额之高往往直接危及企业营运,严重程度甚至可能超过APT攻击所导致的资料外泄。因此邮件稽核的事前防御与事后调阅能力更显重要。
以关键字搜寻来看,不外乎from、to、subject、body等栏位对应值,判断规则条件还可以被归纳计算。但是实务上应用相当多元,陈兆宁举例如供应商与客户,可以视为两种不同集合(辞典档),各自具有不同比对元素供前稽与搜寻使用,数量越多复杂程度越高,因此绿色运算基于既有搜寻引擎技术,进一步发展出MPM技术,以强化拦阻与搜寻能力。
「传统栏位值逐一比对方式,遇到需比对大量元素时显得相当没效率。MPM的做法是先建立字词资料并赋予分数区分权重,让邮件得以同时跟所有的字词资料作比对,如此一来,不管比对元素量多大都可同时进行。」陈兆宁说。
把邮件跟辞典档进行运算后,会得到:总出现次数、总辞数、总分数,三种结果。也就是关键字出现次数越多,分数越高。例如欲把关邮件只能寄给单一客户网域,只要把信件所有内容(含附加档)取出,跟重要网域的客户清单相互碰撞,结果若辞数大于二,即可直接拦截;若是单一邮件不得同时存在供应商与客户,以MPM的逻辑运算,供应商与客户各自拥有不同辞典档,只要邮件中所有内容经碰撞后,双方皆有分数即表示同时存在。
当邮件流经前稽核闸道器时,必须先经过邮件政策稽核引擎(Audit Engine),以MPM演算比对,若发现符合政策条件者,会在该邮件中贴上相对应的标签,一旦事后稽核需要调阅查找时,只要从标签云直接取出所有相关资料即可。如此一来,稽核管理才得以在日趋复杂的应用环境中发挥其效益。
原文网址: 网管人记者洪羿涟报导