很多小伙伴在剛開(kāi)始學(xué)習(xí)使用爬蟲(chóng)爬取網(wǎng)頁(yè)的時(shí)候都能夠爬取一個(gè)頁(yè)面完整內(nèi)容正確的html界面下來(lái)。小編剛開(kāi)始的時(shí)候也是如此,直到小編某天碰上了自家網(wǎng)站的數(shù)據(jù),才知道自己還是太年輕了。為什么呢?因?yàn)樾【幣赖降捻?yè)面一半是正常的html頁(yè)面和標(biāo)簽,另一半夾雜著奇怪的亂碼。今天我們就來(lái)講解一下爬蟲(chóng)爬到亂碼怎么辦吧!