一、传输层拦截
由于目前邮件协议比较“简单”,所以电子邮件地址很容易伪造。但我们可以通过用户认证的方式,禁止从某一个邮件服务器发出的伪造邮件。但是这种方法不能避免已经通过认证的用户向外发送垃圾
邮件。邮件服务器还可以提供Open Relay服务:无条件转发属于其他域的邮件。所以,关闭互联网上一切邮件服务器Open Relay的功能,对减少垃圾邮件的传播非常重要。
当一台开启了Open Relay的邮件服务器被垃圾邮件发送者发现时,它也会被加入一些公开的RBL(实时黑洞名单)当中,邮件服务器接受邮件时,可以检查这些邮件的发信地址和域是否在这些RBL当中。但是RBL有时也会包含一些合法的邮件服务器。因此,使用RBL的同时把常用的一些合法的邮件服务器加入到白名单当中。
二、指纹分析
从理论上来说,如果一个收件人收到垃圾邮件之后,提取其中的指纹特征并分享给其他收件人,那么其他收件人就可以根据这些数字指纹拒绝接收具有同样指纹特征的邮件。不幸的是,这些大批量发送的邮件也会包含细微的变化。例如,垃圾邮件一般都包括一个“退订(Unsubscribe)”链接。另外,收集指纹特征是一项极其耗费资源的工作,尤其是在邮件流量巨大的企业环境当中。
经过认真细致的分析,找到这些邮件当中共同的特征点,就可以把这些指纹特征收集整理成一个规模化的垃圾邮件特征库。
三、语义分析
垃圾邮件制造者的另一种办法就是使用以往常用的词汇。语义分析会根据这些词语出现的位置和环境分配一个权重。一旦整封邮件的内容分析完毕,这些权重将会相加得到一个最终的分值,如果这个分值超过某一个预设的阈值,这封邮件将被判断为垃圾邮件。
四、人工智能
神经网络是人工智能技术在软件中的实现,用来识别变化模式匹配。一个神经网络存在输入、输出和两者之间的连接。输入/输入节点代表那些需要分析的源数据。输入是邮件当中的所有词语,输出是电子邮件的分类。神经网络的准确性依赖于它是如何被“训练”的。在“训练”过程中,会有大量的输入/输出被送入网络,网络通过持续调整节点之间的连接权重来增加准确性。
五、统计分析
统计分析是通过分析大量已经正确分类的垃圾邮件和正常邮件,统计其中词语出现的频率从而生成一个关于可能性的权重数据库。通过分析累加一封邮件中出现的所有的词语的权重值,可以得到这封邮件的权重值,从而判断这封邮件是垃圾邮件的可能性有多大。尽管统计数据库中可能不会包含所有的词语,但是经过精确的“训练”,贝叶斯算法可以得到相当的准确率。
六、启发式分析
启发式分析是对邮件进行一系列的测试分析,然后将这些测试分析的结果综合和一个阈值比较,超过这个阈值就判断为垃圾邮件。启发式分析可以包括上面提到的所有方法,也会检查邮件的内容和属性。垃圾邮件也是不断变化的,需要更多的分析判断方法结合起来。因此执行多个分析过程对提高准确率非常重要。整个启发式分析的准确性依赖于组成它的多个分析过程的权重打分有效性和阈值机制。
七、中文的特殊性
由于中文的特殊性,使得邮件是由多个汉字而不是“词语+空格”组成的,在中文邮件的处理上,需要对这些方法做一些改革。首先,需要一个非常高效的机制对词语进行分隔和识别;其次,还需要有一个能够理解中文的辞典;同时,汉字还存在“简体”和“繁体”,存在GB2312、GB18030等多种编码方式。最好的办法就是把这些编码统一转换到一个统一的格式,然后进行统一处理。
基于业界最完整、精确的相关内容数据库以及用于精确内容识别的适应性推理技术,美讯智是信息安全领域惟一能够真正提供整体内容安全解决方案的公司,方案包括网页过滤、电子邮件过滤、即时信息过滤和间谍软件过滤。美讯智的整体内容安全解决方案具有配置灵活、功能丰富、可扩展性强的特点,能够满足来自信息安全市场的多种需求,业务延伸至世界的每一个角落。
美讯智的安全信息网关RiskFilter/SMG使用15层过滤措施,严格过滤垃圾邮件。美讯智的垃圾邮件过滤策略和指纹特征库由内容安全专家小组维护并每日更新,过滤效果达到准确率高于98%,误判率低于0.1%。在中国,每天有超过3千万个邮件账户正得到美讯智RiskFilter/SMG 的有效保护。
(出处:http://www.sheup.com)