首頁>>>技術(shù)>>>email

戰(zhàn)勝垃圾郵件的七種武器

2005/04/15

一、傳輸層攔截

  由于目前郵件協(xié)議比較“簡單”,所以電子郵件地址很容易偽造。但我們可以通過用戶認(rèn)證的方式,禁止從某一個郵件服務(wù)器發(fā)出的偽造郵件。但是這種方法不能避免已經(jīng)通過認(rèn)證的用戶向外發(fā)送垃圾郵件。郵件服務(wù)器還可以提供Open Relay服務(wù):無條件轉(zhuǎn)發(fā)屬于其他域的郵件。所以,關(guān)閉互聯(lián)網(wǎng)上一切郵件服務(wù)器Open Relay的功能,對減少垃圾郵件的傳播非常重要。

  當(dāng)一臺開啟了Open Relay的郵件服務(wù)器被垃圾郵件發(fā)送者發(fā)現(xiàn)時,它也會被加入一些公開的RBL(實(shí)時黑洞名單)當(dāng)中,郵件服務(wù)器接受郵件時,可以檢查這些郵件的發(fā)信地址和域是否在這些RBL當(dāng)中。但是RBL有時也會包含一些合法的郵件服務(wù)器。因此,使用RBL的同時把常用的一些合法的郵件服務(wù)器加入到白名單當(dāng)中。

二、指紋分析

  從理論上來說,如果一個收件人收到垃圾郵件之后,提取其中的指紋特征并分享給其他收件人,那么其他收件人就可以根據(jù)這些數(shù)字指紋拒絕接收具有同樣指紋特征的郵件。不幸的是,這些大批量發(fā)送的郵件也會包含細(xì)微的變化。例如,垃圾郵件一般都包括一個“退訂(Unsubscribe)”鏈接。另外,收集指紋特征是一項(xiàng)極其耗費(fèi)資源的工作,尤其是在郵件流量巨大的企業(yè)環(huán)境當(dāng)中。

  經(jīng)過認(rèn)真細(xì)致的分析,找到這些郵件當(dāng)中共同的特征點(diǎn),就可以把這些指紋特征收集整理成一個規(guī);睦]件特征庫。

三、語義分析

  垃圾郵件制造者的另一種辦法就是使用以往常用的詞匯。語義分析會根據(jù)這些詞語出現(xiàn)的位置和環(huán)境分配一個權(quán)重。一旦整封郵件的內(nèi)容分析完畢,這些權(quán)重將會相加得到一個最終的分值,如果這個分值超過某一個預(yù)設(shè)的閾值,這封郵件將被判斷為垃圾郵件。

四、人工智能

  神經(jīng)網(wǎng)絡(luò)是人工智能技術(shù)在軟件中的實(shí)現(xiàn),用來識別變化模式匹配。一個神經(jīng)網(wǎng)絡(luò)存在輸入、輸出和兩者之間的連接。輸入/輸入節(jié)點(diǎn)代表那些需要分析的源數(shù)據(jù)。輸入是郵件當(dāng)中的所有詞語,輸出是電子郵件的分類。神經(jīng)網(wǎng)絡(luò)的準(zhǔn)確性依賴于它是如何被“訓(xùn)練”的。在“訓(xùn)練”過程中,會有大量的輸入/輸出被送入網(wǎng)絡(luò),網(wǎng)絡(luò)通過持續(xù)調(diào)整節(jié)點(diǎn)之間的連接權(quán)重來增加準(zhǔn)確性。

五、統(tǒng)計(jì)分析

  統(tǒng)計(jì)分析是通過分析大量已經(jīng)正確分類的垃圾郵件和正常郵件,統(tǒng)計(jì)其中詞語出現(xiàn)的頻率從而生成一個關(guān)于可能性的權(quán)重?cái)?shù)據(jù)庫。通過分析累加一封郵件中出現(xiàn)的所有的詞語的權(quán)重值,可以得到這封郵件的權(quán)重值,從而判斷這封郵件是垃圾郵件的可能性有多大。盡管統(tǒng)計(jì)數(shù)據(jù)庫中可能不會包含所有的詞語,但是經(jīng)過精確的“訓(xùn)練”,貝葉斯算法可以得到相當(dāng)?shù)臏?zhǔn)確率。

六、啟發(fā)式分析

  啟發(fā)式分析是對郵件進(jìn)行一系列的測試分析,然后將這些測試分析的結(jié)果綜合和一個閾值比較,超過這個閾值就判斷為垃圾郵件。啟發(fā)式分析可以包括上面提到的所有方法,也會檢查郵件的內(nèi)容和屬性。垃圾郵件也是不斷變化的,需要更多的分析判斷方法結(jié)合起來。因此執(zhí)行多個分析過程對提高準(zhǔn)確率非常重要。整個啟發(fā)式分析的準(zhǔn)確性依賴于組成它的多個分析過程的權(quán)重打分有效性和閾值機(jī)制。

七、中文的特殊性

  由于中文的特殊性,使得郵件是由多個漢字而不是“詞語+空格”組成的,在中文郵件的處理上,需要對這些方法做一些改革。首先,需要一個非常高效的機(jī)制對詞語進(jìn)行分隔和識別;其次,還需要有一個能夠理解中文的辭典;同時,漢字還存在“簡體”和“繁體”,存在GB2312、GB18030等多種編碼方式。最好的辦法就是把這些編碼統(tǒng)一轉(zhuǎn)換到一個統(tǒng)一的格式,然后進(jìn)行統(tǒng)一處理。

  基于業(yè)界最完整、精確的相關(guān)內(nèi)容數(shù)據(jù)庫以及用于精確內(nèi)容識別的適應(yīng)性推理技術(shù),美訊智是信息安全領(lǐng)域惟一能夠真正提供整體內(nèi)容安全解決方案的公司,方案包括網(wǎng)頁過濾、電子郵件過濾、即時信息過濾和間諜軟件過濾。美訊智的整體內(nèi)容安全解決方案具有配置靈活、功能豐富、可擴(kuò)展性強(qiáng)的特點(diǎn),能夠滿足來自信息安全市場的多種需求,業(yè)務(wù)延伸至世界的每一個角落。

  美訊智的安全信息網(wǎng)關(guān)RiskFilter/SMG使用15層過濾措施,嚴(yán)格過濾垃圾郵件。美訊智的垃圾郵件過濾策略和指紋特征庫由內(nèi)容安全專家小組維護(hù)并每日更新,過濾效果達(dá)到準(zhǔn)確率高于98%,誤判率低于0.1%。在中國,每天有超過3千萬個郵件賬戶正得到美訊智RiskFilter/SMG的有效保護(hù)。

計(jì)算機(jī)世界網(wǎng)(www.ccw.com.cn)


相關(guān)鏈接:
300M附件不受限制 網(wǎng)絡(luò)通訊整合悄然升級 2005-03-30
AOL升級訂戶電郵服務(wù) 試圖爭奪雅虎MSN用戶 2005-03-03
微軟與印度兩公司合作 Hotmail將開始“移動” 2005-01-14
瑞典研制成功能發(fā)電子郵件的電子筆 2005-01-05
04年RIM銷售額翻倍 有意擴(kuò)大歐洲和亞洲市場 2004-12-23

分類信息:     文摘   技術(shù)_email_新聞   技術(shù)_email_文摘