App下載

python怎么執(zhí)行js代碼?

吃火鍋二級(jí)運(yùn)動(dòng)員 2021-08-12 15:49:22 瀏覽數(shù) (3150)
反饋

在做爬蟲分析的時(shí)候多多少少會(huì)接觸到頁(yè)面的js代碼(我們知道js控制頁(yè)面的行為,頁(yè)面的某些內(nèi)容要在特殊行為后才能展現(xiàn))。但是有些網(wǎng)站使用了js代碼混淆,整個(gè)js代碼極其混亂無法閱讀邏輯,這種情況我們就不能用python去重寫這樣的代碼了。那么我們要如何去處理這樣的js呢?沒錯(cuò),我們可以用最簡(jiǎn)單粗暴的方法來實(shí)現(xiàn),只要讓python執(zhí)行這些js代碼就可以了。那么怎么讓python執(zhí)行js代碼呢?接下來的這篇文章帶你了解。

什么是js代碼混淆?

正常代碼

我們現(xiàn)在看一段js代碼,代碼邏輯很簡(jiǎn)單,就是拼接時(shí)間返回。

function formatDate(now) {
    var now = new Date(1230999938);
    var year=now.getFullYear();
    var month=now.getMonth()+1;
    var date=now.getDate();
    var hour=now.getHours();
    var minute=now.getMinutes();
    var second=now.getSeconds();
    return year+"-"+month+"-"+date+" "+hour+":"+minute+":"+second;
}

    運(yùn)行一下這段代碼,如下圖所示。

運(yùn)行結(jié)果

混淆代碼

我隨便找了個(gè)在線的js代碼混淆網(wǎng)站。

js代碼

function formatDate(mz1){var KkkGDiH2=new window["x44x61x74x65"](1230999938);var tsk3=KkkGDiH2['x67x65x74x46x75x6cx6cx59x65x61x72']();var YMreyP4=KkkGDiH2['x67x65x74x4dx6fx6ex74x68']()+1;var Ozo5=KkkGDiH2['x67x65x74x44x61x74x65']();var QMYEc$eD6=KkkGDiH2['x67x65x74x48x6fx75x72x73']();var JfXVV_Akq7=KkkGDiH2['x67x65x74x4dx69x6ex75x74x65x73']();var $mP8=KkkGDiH2['x67x65x74x53x65x63x6fx6ex64x73']();return tsk3+"x2d"+YMreyP4+"x2d"+Ozo5+" "+QMYEc$eD6+"x3a"+JfXVV_Akq7+"x3a"+$mP8

    上面這個(gè)真的不是我瞎寫的,混淆之后就是這樣子的,不信看圖片。

代碼混淆

可能我們會(huì)有個(gè)疑問,js代碼都成這玩意了,還能執(zhí)行嗎? 答案是肯定的。即使js代碼非常亂,但還是可以執(zhí)行的,結(jié)果跟上面的是一樣的。

這就造成了一個(gè)問題,我們?cè)谧雠老x時(shí),如果需要,多多少少可能都要研究一下js代碼,然后進(jìn)行js解密一下,但是,但是,要是代碼都混淆成了這了,還怎么解?

一點(diǎn)邏輯都看不通了,基本上不可用Python按照js邏輯重寫出來了...

很巧,小編也是卡在這里...后來我就想,要是Python能執(zhí)行js代碼就好了,不用管函數(shù)里面的邏輯了,只拿函數(shù)返回值就好了。

Python第三方包Execjs

可能是吧,不止我一個(gè)人遇到了這種情況,所以大佬們就開發(fā)出來這種工具包,用于執(zhí)行js代碼。

安裝

在安裝之前,需要有node環(huán)境,這里就不舉栗子了,下一步下一步就好了。

pip3 install PyExecJS

執(zhí)行js

注:由于上述js代碼會(huì)生成window對(duì)象,并不能直接執(zhí)行成功,需要額外的其他輔助,這里簡(jiǎn)單的舉一下其他例子。

正常js代碼

function add(x, y) {
   return x + y;
}

Python執(zhí)行js代碼

import execjs

ctx = execjs.compile("""
function add(x, y) {
  return x + y;
}
""")
print(ctx.call("add", 1, 2))

執(zhí)行結(jié)果如下圖所示:

混淆js代碼

function add(bi1,Pl$2){return bi1+Pl$2}

Python執(zhí)行混淆js代碼

import execjs

ctx = execjs.compile("""
function add(bi1,Pl$2){return bi1+Pl$2}
""")
print(ctx.call("add", 1, 2))

執(zhí)行結(jié)果如下圖所示:

執(zhí)行結(jié)果

可以看到,即使再混淆,只要執(zhí)行的是js代碼,都是沒啥問題的。

上述拼接時(shí)間返回的js混淆代碼也是可以執(zhí)行的,但是它多了一個(gè)window對(duì)象,需要node安裝jsdom才行,由于網(wǎng)絡(luò)設(shè)置有問題,實(shí)在是下載不了舉例子,實(shí)在是抱歉。

或者使用selenium打開游覽器執(zhí)行再返回也行,當(dāng)然,速度更慢。

以上就是python執(zhí)行js代碼的方法的詳細(xì)內(nèi)容,更多python學(xué)習(xí)資料請(qǐng)關(guān)注W3Cschool其它相關(guān)文章!


0 人點(diǎn)贊