Go 確保輸入過濾

2022-05-13 17:40 更新

過濾用戶數(shù)據(jù)是Web應(yīng)用安全的基礎(chǔ)。它是驗證數(shù)據(jù)合法性的過程。通過對所有的輸入數(shù)據(jù)進(jìn)行過濾，可以避免惡意數(shù)據(jù)在程序中被誤信或誤用。大多數(shù)Web應(yīng)用的漏洞都是因為沒有對用戶輸入的數(shù)據(jù)進(jìn)行恰當(dāng)過濾所引起的。

我們介紹的過濾數(shù)據(jù)分成三個步驟：

識別數(shù)據(jù)，搞清楚需要過濾的數(shù)據(jù)來自于哪里
過濾數(shù)據(jù)，弄明白我們需要什么樣的數(shù)據(jù)
區(qū)分已過濾及被污染數(shù)據(jù)，如果存在攻擊數(shù)據(jù)那么保證過濾之后可以讓我們使用更安全的數(shù)據(jù)

識別數(shù)據(jù)

“識別數(shù)據(jù)”作為第一步是因為在你不知道“數(shù)據(jù)是什么，它來自于哪里”的前提下，你也就不能正確地過濾它。這里的數(shù)據(jù)是指所有源自非代碼內(nèi)部提供的數(shù)據(jù)。例如:所有來自客戶端的數(shù)據(jù)，但客戶端并不是唯一的外部數(shù)據(jù)源，數(shù)據(jù)庫和第三方提供的接口數(shù)據(jù)等也可以是外部數(shù)據(jù)源。

由用戶輸入的數(shù)據(jù)我們通過Go非常容易識別，Go通過r.ParseForm之后，把用戶POST和GET的數(shù)據(jù)全部放在了r.Form里面。其它的輸入要難識別得多，例如，r.Header中的很多元素是由客戶端所操縱的。常常很難確認(rèn)其中的哪些元素組成了輸入，所以，最好的方法是把里面所有的數(shù)據(jù)都看成是用戶輸入。(例如r.Header.Get("Accept-Charset")這樣的也看做是用戶輸入,雖然這些大多數(shù)是瀏覽器操縱的)

過濾數(shù)據(jù)

在知道數(shù)據(jù)來源之后，就可以過濾它了。過濾是一個有點正式的術(shù)語，它在平時表述中有很多同義詞，如驗證、清潔及凈化。盡管這些術(shù)語表面意義不同，但它們都是指的同一個處理：防止非法數(shù)據(jù)進(jìn)入你的應(yīng)用。

過濾數(shù)據(jù)有很多種方法，其中有一些安全性較差。最好的方法是把過濾看成是一個檢查的過程，在你使用數(shù)據(jù)之前都檢查一下看它們是否是符合合法數(shù)據(jù)的要求。而且不要試圖好心地去糾正非法數(shù)據(jù)，而要讓用戶按你制定的規(guī)則去輸入數(shù)據(jù)。歷史證明了試圖糾正非法數(shù)據(jù)往往會導(dǎo)致安全漏洞。這里舉個例子：“最近建設(shè)銀行系統(tǒng)升級之后，如果密碼后面兩位是0，只要輸入前面四位就能登錄系統(tǒng)”，這是一個非常嚴(yán)重的漏洞。

過濾數(shù)據(jù)主要采用如下一些庫來操作：

strconv包下面的字符串轉(zhuǎn)化相關(guān)函數(shù)，因為從Request中的r.Form返回的是字符串，而有些時候我們需要將之轉(zhuǎn)化成整/浮點數(shù)，Atoi、ParseBool、ParseFloat、ParseInt等函數(shù)就可以派上用場了。
string包下面的一些過濾函數(shù)Trim、ToLower、ToTitle等函數(shù)，能夠幫助我們按照指定的格式獲取信息。
regexp包用來處理一些復(fù)雜的需求，例如判定輸入是否是Email、生日之類。

過濾數(shù)據(jù)除了檢查驗證之外，在特殊時候，還可以采用白名單。即假定你正在檢查的數(shù)據(jù)都是非法的，除非能證明它是合法的。使用這個方法，如果出現(xiàn)錯誤，只會導(dǎo)致把合法的數(shù)據(jù)當(dāng)成是非法的，而不會是相反，盡管我們不想犯任何錯誤，但這樣總比把非法數(shù)據(jù)當(dāng)成合法數(shù)據(jù)要安全得多。

區(qū)分過濾數(shù)據(jù)

如果完成了上面的兩步，數(shù)據(jù)過濾的工作就基本完成了，但是在編寫Web應(yīng)用的時候我們還需要區(qū)分已過濾和被污染數(shù)據(jù)，因為這樣可以保證過濾數(shù)據(jù)的完整性，而不影響輸入的數(shù)據(jù)。我們約定把所有經(jīng)過過濾的數(shù)據(jù)放入一個叫全局的Map變量中(CleanMap)。這時需要用兩個重要的步驟來防止被污染數(shù)據(jù)的注入：

每個請求都要初始化CleanMap為一個空Map。
加入檢查及阻止來自外部數(shù)據(jù)源的變量命名為CleanMap。

接下來，讓我們通過一個例子來鞏固這些概念，請看下面這個表單

<form action="/whoami" method="POST">
    我是誰:
    <select name="name">
        <option value="astaxie">astaxie</option>
        <option value="herry">herry</option>
        <option value="marry">marry</option>
    </select>
    <input type="submit" />
</form>

在處理這個表單的編程邏輯中，非常容易犯的錯誤是認(rèn)為只能提交三個選擇中的一個。其實攻擊者可以模擬POST操作，遞交name=attack這樣的數(shù)據(jù)，所以在此時我們需要做類似白名單的處理

r.ParseForm()
name := r.Form.Get("name")
CleanMap := make(map[string]interface{}, 0)
if name == "astaxie" || name == "herry" || name == "marry" {
    CleanMap["name"] = name
}

上面代碼中我們初始化了一個CleanMap的變量，當(dāng)判斷獲取的name是astaxie、herry、marry三個中的一個之后，我們把數(shù)據(jù)存儲到了CleanMap之中，這樣就可以確保CleanMap["name"]中的數(shù)據(jù)是合法的，從而在代碼的其它部分使用它。當(dāng)然我們還可以在else部分增加非法數(shù)據(jù)的處理，一種可能是再次顯示表單并提示錯誤。但是不要試圖為了友好而輸出被污染的數(shù)據(jù)。

上面的方法對于過濾一組已知的合法值的數(shù)據(jù)很有效，但是對于過濾有一組已知合法字符組成的數(shù)據(jù)時就沒有什么幫助。例如，你可能需要一個用戶名只能由字母及數(shù)字組成：

r.ParseForm()
username := r.Form.Get("username")
CleanMap := make(map[string]interface{}, 0)
if ok, _ := regexp.MatchString("^[a-zA-Z0-9].$", username); ok {
    CleanMap["username"] = username
}

總結(jié)

數(shù)據(jù)過濾在Web安全中起到一個基石的作用，大多數(shù)的安全問題都是由于沒有過濾數(shù)據(jù)和驗證數(shù)據(jù)引起的，例如前面小節(jié)的CSRF攻擊，以及接下來將要介紹的XSS攻擊、SQL注入等都是沒有認(rèn)真地過濾數(shù)據(jù)引起的，因此我們需要特別重視這部分的內(nèi)容。

以上內(nèi)容是否對您有幫助：

← Go 預(yù)防CSRF攻擊

Go 避免XSS攻擊 →

寫筆記

我要補充