ECMAScript 6 二進制數組

2018-09-20 16:25 更新

二進制數組(ArrayBuffer對象、TypedArray視圖和DataView視圖)是JavaScript操作二進制數據的一個接口。這些對象早就存在,屬于獨立的規(guī)格(2011年2月發(fā)布),ES6將它們納入了ECMAScript規(guī)格,并且增加了新的方法。

這個接口的原始設計目的,與WebGL項目有關。所謂WebGL,就是指瀏覽器與顯卡之間的通信接口,為了滿足JavaScript與顯卡之間大量的、實時的數據交換,它們之間的數據通信必須是二進制的,而不能是傳統(tǒng)的文本格式。文本格式傳遞一個32位整數,兩端的JavaScript腳本與顯卡都要進行格式轉化,將非常耗時。這時要是存在一種機制,可以像C語言那樣,直接操作字節(jié),將4個字節(jié)的32位整數,以二進制形式原封不動地送入顯卡,腳本的性能就會大幅提升。

二進制數組就是在這種背景下誕生的。它很像C語言的數組,允許開發(fā)者以數組下標的形式,直接操作內存,大大增強了JavaScript處理二進制數據的能力,使得開發(fā)者有可能通過JavaScript與操作系統(tǒng)的原生接口進行二進制通信。

二進制數組由三類對象組成。

(1)ArrayBuffer對象:代表內存之中的一段二進制數據,可以通過“視圖”進行操作。“視圖”部署了數組接口,這意味著,可以用數組的方法操作內存。

(2)TypedArray視圖:共包括9種類型的視圖,比如Uint8Array(無符號8位整數)數組視圖, Int16Array(16位整數)數組視圖, Float32Array(32位浮點數)數組視圖等等。

(3)DataView視圖:可以自定義復合格式的視圖,比如第一個字節(jié)是Uint8(無符號8位整數)、第二、三個字節(jié)是Int16(16位整數)、第四個字節(jié)開始是Float32(32位浮點數)等等,此外還可以自定義字節(jié)序。

簡單說,ArrayBuffer對象代表原始的二進制數據,TypedArray視圖用來讀寫簡單類型的二進制數據,DataView視圖用來讀寫復雜類型的二進制數據。

TypedArray視圖支持的數據類型一共有9種(DataView視圖支持除Uint8C以外的其他8種)。

數據類型字節(jié)長度含義對應的C語言類型
Int818位帶符號整數signed char
Uint818位不帶符號整數unsigned char
Uint8C18位不帶符號整數(自動過濾溢出)unsigned char
Int16216位帶符號整數short
Uint16216位不帶符號整數unsigned short
Int32432位帶符號整數int
Uint32432位不帶符號的整數unsigned int
Float32432位浮點數float
Float64864位浮點數double

注意,二進制數組并不是真正的數組,而是類似數組的對象。

很多瀏覽器操作的API,用到了二進制數組操作二進制數據,下面是其中的幾個。

  • File API
  • XMLHttpRequest
  • Fetch API
  • Canvas
  • WebSockets

ArrayBuffer對象

概述

ArrayBuffer對象代表儲存二進制數據的一段內存,它不能直接讀寫,只能通過視圖(TypedArray視圖和DataView視圖)來讀寫,視圖的作用是以指定格式解讀二進制數據。

ArrayBuffer也是一個構造函數,可以分配一段可以存放數據的連續(xù)內存區(qū)域。

var buf = new ArrayBuffer(32);

上面代碼生成了一段32字節(jié)的內存區(qū)域,每個字節(jié)的值默認都是0。可以看到,ArrayBuffer構造函數的參數是所需要的內存大小(單位字節(jié))。

為了讀寫這段內容,需要為它指定視圖。DataView視圖的創(chuàng)建,需要提供ArrayBuffer對象實例作為參數。

var buf = new ArrayBuffer(32);
var dataView = new DataView(buf);
dataView.getUint8(0) // 0

上面代碼對一段32字節(jié)的內存,建立DataView視圖,然后以不帶符號的8位整數格式,讀取第一個元素,結果得到0,因為原始內存的ArrayBuffer對象,默認所有位都是0。

另一種TypedArray視圖,與DataView視圖的一個區(qū)別是,它不是一個構造函數,而是一組構造函數,代表不同的數據格式。

var buffer = new ArrayBuffer(12);

var x1 = new Int32Array(buffer);
x1[0] = 1;
var x2 = new Uint8Array(buffer);
x2[0]  = 2;

x1[0] // 2

上面代碼對同一段內存,分別建立兩種視圖:32位帶符號整數(Int32Array構造函數)和8位不帶符號整數(Uint8Array構造函數)。由于兩個視圖對應的是同一段內存,一個視圖修改底層內存,會影響到另一個視圖。

TypedArray視圖的構造函數,除了接受ArrayBuffer實例作為參數,還可以接受普通數組作為參數,直接分配內存生成底層的ArrayBuffer實例,并同時完成對這段內存的賦值。

var typedArray = new Uint8Array([0,1,2]);
typedArray.length // 3

typedArray[0] = 5;
typedArray // [5, 1, 2]

上面代碼使用TypedArray視圖的Uint8Array構造函數,新建一個不帶符號的8位整數視圖??梢钥吹?,Uint8Array直接使用普通數組作為參數,對底層內存的賦值同時完成。

ArrayBuffer.prototype.byteLength

ArrayBuffer實例的byteLength屬性,返回所分配的內存區(qū)域的字節(jié)長度。

var buffer = new ArrayBuffer(32);
buffer.byteLength
// 32

如果要分配的內存區(qū)域很大,有可能分配失?。ㄒ驗闆]有那么多的連續(xù)空余內存),所以有必要檢查是否分配成功。

if (buffer.byteLength === n) {
  // 成功
} else {
  // 失敗
}

ArrayBuffer.prototype.slice()

ArrayBuffer實例有一個slice方法,允許將內存區(qū)域的一部分,拷貝生成一個新的ArrayBuffer對象。

var buffer = new ArrayBuffer(8);
var newBuffer = buffer.slice(0, 3);

上面代碼拷貝buffer對象的前3個字節(jié)(從0開始,到第3個字節(jié)前面結束),生成一個新的ArrayBuffer對象。slice方法其實包含兩步,第一步是先分配一段新內存,第二步是將原來那個ArrayBuffer對象拷貝過去。

slice方法接受兩個參數,第一個參數表示拷貝開始的字節(jié)序號(含該字節(jié)),第二個參數表示拷貝截止的字節(jié)序號(不含該字節(jié))。如果省略第二個參數,則默認到原ArrayBuffer對象的結尾。

除了slice方法,ArrayBuffer對象不提供任何直接讀寫內存的方法,只允許在其上方建立視圖,然后通過視圖讀寫。

ArrayBuffer.isView()

ArrayBuffer有一個靜態(tài)方法isView,返回一個布爾值,表示參數是否為ArrayBuffer的視圖實例。這個方法大致相當于判斷參數,是否為TypedArray實例或DataView實例。

var buffer = new ArrayBuffer(8);
ArrayBuffer.isView(buffer) // false

var v = new Int32Array(buffer);
ArrayBuffer.isView(v) // true

TypedArray視圖

概述

ArrayBuffer對象作為內存區(qū)域,可以存放多種類型的數據。同一段內存,不同數據有不同的解讀方式,這就叫做“視圖”(view)。ArrayBuffer有兩種視圖,一種是TypedArray視圖,另一種是DataView視圖。前者的數組成員都是同一個數據類型,后者的數組成員可以是不同的數據類型。

目前,TypedArray視圖一共包括9種類型,每一種視圖都是一種構造函數。

  • Int8Array:8位有符號整數,長度1個字節(jié)。
  • Uint8Array:8位無符號整數,長度1個字節(jié)。
  • Uint8ClampedArray:8位無符號整數,長度1個字節(jié),溢出處理不同。
  • Int16Array:16位有符號整數,長度2個字節(jié)。
  • Uint16Array:16位無符號整數,長度2個字節(jié)。
  • Int32Array:32位有符號整數,長度4個字節(jié)。
  • Uint32Array:32位無符號整數,長度4個字節(jié)。
  • Float32Array:32位浮點數,長度4個字節(jié)。
  • Float64Array:64位浮點數,長度8個字節(jié)。

這9個構造函數生成的數組,統(tǒng)稱為TypedArray視圖。它們很像普通數組,都有length屬性,都能用方括號運算符([])獲取單個元素,所有數組的方法,在它們上面都能使用。普通數組與TypedArray數組的差異主要在以下方面。

  • TypedArray數組的所有成員,都是同一種類型。
  • TypedArray數組的成員是連續(xù)的,不會有空位。
  • TypedArray數組成員的默認值為0。比如,new Array(10)返回一個普通數組,里面沒有任何成員,只是10個空位;new Uint8Array(10)返回一個TypedArray數組,里面10個成員都是0。
  • TypedArray數組只是一層視圖,本身不儲存數據,它的數據都儲存在底層的ArrayBuffer對象之中,要獲取底層對象必須使用buffer屬性。

構造函數

TypedArray數組提供9種構造函數,用來生成相應類型的數組實例。

構造函數有多種用法。

(1)TypedArray(buffer, byteOffset=0, length?)

同一個ArrayBuffer對象之上,可以根據不同的數據類型,建立多個視圖。

// 創(chuàng)建一個8字節(jié)的ArrayBuffer
var b = new ArrayBuffer(8);

// 創(chuàng)建一個指向b的Int32視圖,開始于字節(jié)0,直到緩沖區(qū)的末尾
var v1 = new Int32Array(b);

// 創(chuàng)建一個指向b的Uint8視圖,開始于字節(jié)2,直到緩沖區(qū)的末尾
var v2 = new Uint8Array(b, 2);

// 創(chuàng)建一個指向b的Int16視圖,開始于字節(jié)2,長度為2
var v3 = new Int16Array(b, 2, 2);

上面代碼在一段長度為8個字節(jié)的內存(b)之上,生成了三個視圖:v1、v2v3

視圖的構造函數可以接受三個參數:

  • 第一個參數(必需):視圖對應的底層ArrayBuffer對象。
  • 第二個參數(可選):視圖開始的字節(jié)序號,默認從0開始。
  • 第三個參數(可選):視圖包含的數據個數,默認直到本段內存區(qū)域結束。

因此,v1、v2v3是重疊的:v1[0]是一個32位整數,指向字節(jié)0~字節(jié)3;v2[0]是一個8位無符號整數,指向字節(jié)2;v3[0]是一個16位整數,指向字節(jié)2~字節(jié)3。只要任何一個視圖對內存有所修改,就會在另外兩個視圖上反應出來。

注意,byteOffset必須與所要建立的數據類型一致,否則會報錯。

var buffer = new ArrayBuffer(8);
var i16 = new Int16Array(buffer, 1);
// Uncaught RangeError: start offset of Int16Array should be a multiple of 2

上面代碼中,新生成一個8個字節(jié)的ArrayBuffer對象,然后在這個對象的第一個字節(jié),建立帶符號的16位整數視圖,結果報錯。因為,帶符號的16位整數需要兩個字節(jié),所以byteOffset參數必須能夠被2整除。

如果想從任意字節(jié)開始解讀ArrayBuffer對象,必須使用DataView視圖,因為TypedArray視圖只提供9種固定的解讀格式。

(2)TypedArray(length)

視圖還可以不通過ArrayBuffer對象,直接分配內存而生成。

var f64a = new Float64Array(8);
f64a[0] = 10;
f64a[1] = 20;
f64a[2] = f64a[0] + f64a[1];

上面代碼生成一個8個成員的Float64Array數組(共64字節(jié)),然后依次對每個成員賦值。這時,視圖構造函數的參數就是成員的個數。可以看到,視圖數組的賦值操作與普通數組的操作毫無兩樣。

(3)TypedArray(typedArray)

TypedArray數組的構造函數,可以接受另一個TypedArray實例作為參數。

var typedArray = new Int8Array(new Uint8Array(4));

上面代碼中,Int8Array構造函數接受一個Uint8Array實例作為參數。

注意,此時生成的新數組,只是復制了參數數組的值,對應的底層內存是不一樣的。新數組會開辟一段新的內存儲存數據,不會在原數組的內存之上建立視圖。

var x = new Int8Array([1, 1]);
var y = new Int8Array(x);
x[0] // 1
y[0] // 1

x[0] = 2;
y[0] // 1

上面代碼中,數組y是以數組x為模板而生成的,當x變動的時候,y并沒有變動。

如果想基于同一段內存,構造不同的視圖,可以采用下面的寫法。

var x = new Int8Array([1, 1]);
var y = new Int8Array(x.buffer);
x[0] // 1
y[0] // 1

x[0] = 2;
y[0] // 2

(4)TypedArray(arrayLikeObject)

構造函數的參數也可以是一個普通數組,然后直接生成TypedArray實例。

var typedArray = new Uint8Array([1, 2, 3, 4]);

注意,這時TypedArray視圖會重新開辟內存,不會在原數組的內存上建立視圖。

上面代碼從一個普通的數組,生成一個8位無符號整數的TypedArray實例。

TypedArray數組也可以轉換回普通數組。

var normalArray = Array.prototype.slice.call(typedArray);

數組方法

普通數組的操作方法和屬性,對TypedArray數組完全適用。

  • TypedArray.prototype.copyWithin(target, start[, end = this.length])
  • TypedArray.prototype.entries()
  • TypedArray.prototype.every(callbackfn, thisArg?)
  • TypedArray.prototype.fill(value, start=0, end=this.length)
  • TypedArray.prototype.filter(callbackfn, thisArg?)
  • TypedArray.prototype.find(predicate, thisArg?)
  • TypedArray.prototype.findIndex(predicate, thisArg?)
  • TypedArray.prototype.forEach(callbackfn, thisArg?)
  • TypedArray.prototype.indexOf(searchElement, fromIndex=0)
  • TypedArray.prototype.join(separator)
  • TypedArray.prototype.keys()
  • TypedArray.prototype.lastIndexOf(searchElement, fromIndex?)
  • TypedArray.prototype.map(callbackfn, thisArg?)
  • TypedArray.prototype.reduce(callbackfn, initialValue?)
  • TypedArray.prototype.reduceRight(callbackfn, initialValue?)
  • TypedArray.prototype.reverse()
  • TypedArray.prototype.slice(start=0, end=this.length)
  • TypedArray.prototype.some(callbackfn, thisArg?)
  • TypedArray.prototype.sort(comparefn)
  • TypedArray.prototype.toLocaleString(reserved1?, reserved2?)
  • TypedArray.prototype.toString()
  • TypedArray.prototype.values()

上面所有方法的用法,請參閱數組方法的介紹,這里不再重復了。

注意,TypedArray數組沒有concat方法。如果想要合并多個TypedArray數組,可以用下面這個函數。

function concatenate(resultConstructor, ...arrays) {
  let totalLength = 0;
  for (let arr of arrays) {
    totalLength += arr.length;
  }
  let result = new resultConstructor(totalLength);
  let offset = 0;
  for (let arr of arrays) {
    result.set(arr, offset);
    offset += arr.length;
  }
  return result;
}

concatenate(Uint8Array, Uint8Array.of(1, 2), Uint8Array.of(3, 4))
// Uint8Array [1, 2, 3, 4]

另外,TypedArray數組與普通數組一樣,部署了Iterator接口,所以可以被遍歷。

let ui8 = Uint8Array.of(0, 1, 2);
for (let byte of ui8) {
  console.log(byte);
}
// 0
// 1
// 2

字節(jié)序

字節(jié)序指的是數值在內存中的表示方式。

var buffer = new ArrayBuffer(16);
var int32View = new Int32Array(buffer);

for (var i = 0; i < int32View.length; i++) {
  int32View[i] = i * 2;
}

上面代碼生成一個16字節(jié)的ArrayBuffer對象,然后在它的基礎上,建立了一個32位整數的視圖。由于每個32位整數占據4個字節(jié),所以一共可以寫入4個整數,依次為0,2,4,6。

如果在這段數據上接著建立一個16位整數的視圖,則可以讀出完全不一樣的結果。

var int16View = new Int16Array(buffer);

for (var i = 0; i < int16View.length; i++) {
  console.log("Entry " + i + ": " + int16View[i]);
}
// Entry 0: 0
// Entry 1: 0
// Entry 2: 2
// Entry 3: 0
// Entry 4: 4
// Entry 5: 0
// Entry 6: 6
// Entry 7: 0

由于每個16位整數占據2個字節(jié),所以整個ArrayBuffer對象現在分成8段。然后,由于x86體系的計算機都采用小端字節(jié)序(little endian),相對重要的字節(jié)排在后面的內存地址,相對不重要字節(jié)排在前面的內存地址,所以就得到了上面的結果。

比如,一個占據四個字節(jié)的16進制數0x12345678,決定其大小的最重要的字節(jié)是“12”,最不重要的是“78”。小端字節(jié)序將最不重要的字節(jié)排在前面,儲存順序就是78563412;大端字節(jié)序則完全相反,將最重要的字節(jié)排在前面,儲存順序就是12345678。目前,所有個人電腦幾乎都是小端字節(jié)序,所以TypedArray數組內部也采用小端字節(jié)序讀寫數據,或者更準確的說,按照本機操作系統(tǒng)設定的字節(jié)序讀寫數據。

這并不意味大端字節(jié)序不重要,事實上,很多網絡設備和特定的操作系統(tǒng)采用的是大端字節(jié)序。這就帶來一個嚴重的問題:如果一段數據是大端字節(jié)序,TypedArray數組將無法正確解析,因為它只能處理小端字節(jié)序!為了解決這個問題,JavaScript引入DataView對象,可以設定字節(jié)序,下文會詳細介紹。

下面是另一個例子。

// 假定某段buffer包含如下字節(jié) [0x02, 0x01, 0x03, 0x07]
var buffer = new ArrayBuffer(4);
var v1 = new Uint8Array(buffer);
v1[0] = 2;
v1[1] = 1;
v1[2] = 3;
v1[3] = 7;

var uInt16View = new Uint16Array(buffer);

// 計算機采用小端字節(jié)序
// 所以頭兩個字節(jié)等于258
if (uInt16View[0] === 258) {
  console.log('OK'); // "OK"
}

// 賦值運算
uInt16View[0] = 255;    // 字節(jié)變?yōu)閇0xFF, 0x00, 0x03, 0x07]
uInt16View[0] = 0xff05; // 字節(jié)變?yōu)閇0x05, 0xFF, 0x03, 0x07]
uInt16View[1] = 0x0210; // 字節(jié)變?yōu)閇0x05, 0xFF, 0x10, 0x02]

下面的函數可以用來判斷,當前視圖是小端字節(jié)序,還是大端字節(jié)序。

const BIG_ENDIAN = Symbol('BIG_ENDIAN');
const LITTLE_ENDIAN = Symbol('LITTLE_ENDIAN');

function getPlatformEndianness() {
  let arr32 = Uint32Array.of(0x12345678);
  let arr8 = new Uint8Array(arr32.buffer);
  switch ((arr8[0]*0x1000000) + (arr8[1]*0x10000) + (arr8[2]*0x100) + (arr8[3])) {
    case 0x12345678:
      return BIG_ENDIAN;
    case 0x78563412:
      return LITTLE_ENDIAN;
    default:
      throw new Error('Unknown endianness');
  }
}

總之,與普通數組相比,TypedArray數組的最大優(yōu)點就是可以直接操作內存,不需要數據類型轉換,所以速度快得多。

BYTES_PER_ELEMENT屬性

每一種視圖的構造函數,都有一個BYTES_PER_ELEMENT屬性,表示這種數據類型占據的字節(jié)數。

Int8Array.BYTES_PER_ELEMENT // 1
Uint8Array.BYTES_PER_ELEMENT // 1
Int16Array.BYTES_PER_ELEMENT // 2
Uint16Array.BYTES_PER_ELEMENT // 2
Int32Array.BYTES_PER_ELEMENT // 4
Uint32Array.BYTES_PER_ELEMENT // 4
Float32Array.BYTES_PER_ELEMENT // 4
Float64Array.BYTES_PER_ELEMENT // 8

這個屬性在TypedArray實例上也能獲取,即有TypedArray.prototype.BYTES_PER_ELEMENT。

ArrayBuffer與字符串的互相轉換

ArrayBuffer轉為字符串,或者字符串轉為ArrayBuffer,有一個前提,即字符串的編碼方法是確定的。假定字符串采用UTF-16編碼(JavaScript的內部編碼方式),可以自己編寫轉換函數。

// ArrayBuffer轉為字符串,參數為ArrayBuffer對象
function ab2str(buf) {
  return String.fromCharCode.apply(null, new Uint16Array(buf));
}

// 字符串轉為ArrayBuffer對象,參數為字符串
function str2ab(str) {
  var buf = new ArrayBuffer(str.length * 2); // 每個字符占用2個字節(jié)
  var bufView = new Uint16Array(buf);
  for (var i = 0, strLen = str.length; i < strLen; i++) {
    bufView[i] = str.charCodeAt(i);
  }
  return buf;
}

溢出

不同的視圖類型,所能容納的數值范圍是確定的。超出這個范圍,就會出現溢出。比如,8位視圖只能容納一個8位的二進制值,如果放入一個9位的值,就會溢出。

TypedArray數組的溢出處理規(guī)則,簡單來說,就是拋棄溢出的位,然后按照視圖類型進行解釋。

var uint8 = new Uint8Array(1);

uint8[0] = 256;
uint8[0] // 0

uint8[0] = -1;
uint8[0] // 255

上面代碼中,uint8是一個8位視圖,而256的二進制形式是一個9位的值100000000,這時就會發(fā)生溢出。根據規(guī)則,只會保留后8位,即00000000uint8視圖的解釋規(guī)則是無符號的8位整數,所以00000000就是0。

負數在計算機內部采用“2的補碼”表示,也就是說,將對應的正數值進行否運算,然后加1。比如,-1對應的正值是1,進行否運算以后,得到11111110,再加上1就是補碼形式11111111。uint8按照無符號的8位整數解釋11111111,返回結果就是255。

一個簡單轉換規(guī)則,可以這樣表示。

  • 正向溢出(overflow):當輸入值大于當前數據類型的最大值,結果等于當前數據類型的最小值加上余值,再減去1。
  • 負向溢出(underflow):當輸入值小于當前數據類型的最小值,結果等于當前數據類型的最大值減去余值,再加上1。

請看下面的例子。

var int8 = new Int8Array(1);

int8[0] = 128;
int8[0] // -128

int8[0] = -129;
int8[0] // 127

上面例子中,int8是一個帶符號的8位整數視圖,它的最大值是127,最小值是-128。輸入值為128時,相當于正向溢出1,根據“最小值加上余值,再減去1”的規(guī)則,就會返回-128;輸入值為-129時,相當于負向溢出1,根據“最大值減去余值,再加上1”的規(guī)則,就會返回127。

Uint8ClampedArray視圖的溢出規(guī)則,與上面的規(guī)則不同。它規(guī)定,凡是發(fā)生正向溢出,該值一律等于當前數據類型的最大值,即255;如果發(fā)生負向溢出,該值一律等于當前數據類型的最小值,即0。

var uint8c = new Uint8ClampedArray(1);

uint8c[0] = 256;
uint8c[0] // 255

uint8c[0] = -1;
uint8c[0] // 0

上面例子中,uint8C是一個Uint8ClampedArray視圖,正向溢出時都返回255,負向溢出都返回0。

TypedArray.prototype.buffer

TypedArray實例的buffer屬性,返回整段內存區(qū)域對應的ArrayBuffer對象。該屬性為只讀屬性。

var a = new Float32Array(64);
var b = new Uint8Array(a.buffer);

上面代碼的a視圖對象和b視圖對象,對應同一個ArrayBuffer對象,即同一段內存。

TypedArray.prototype.byteLength,TypedArray.prototype.byteOffset

byteLength屬性返回TypedArray數組占據的內存長度,單位為字節(jié)。byteOffset屬性返回TypedArray數組從底層ArrayBuffer對象的哪個字節(jié)開始。這兩個屬性都是只讀屬性。

var b = new ArrayBuffer(8);

var v1 = new Int32Array(b);
var v2 = new Uint8Array(b, 2);
var v3 = new Int16Array(b, 2, 2);

v1.byteLength // 8
v2.byteLength // 6
v3.byteLength // 4

v1.byteOffset // 0
v2.byteOffset // 2
v3.byteOffset // 2

TypedArray.prototype.length

length屬性表示TypedArray數組含有多少個成員。注意將byteLength屬性和length屬性區(qū)分,前者是字節(jié)長度,后者是成員長度。

var a = new Int16Array(8);

a.length // 8
a.byteLength // 16

TypedArray.prototype.set()

TypedArray數組的set方法用于復制數組(普通數組或TypedArray數組),也就是將一段內容完全復制到另一段內存。

var a = new Uint8Array(8);
var b = new Uint8Array(8);

b.set(a);

上面代碼復制a數組的內容到b數組,它是整段內存的復制,比一個個拷貝成員的那種復制快得多。

set方法還可以接受第二個參數,表示從b對象的哪一個成員開始復制a對象。

var a = new Uint16Array(8);
var b = new Uint16Array(10);

b.set(a, 2)

上面代碼的b數組比a數組多兩個成員,所以從b[2]開始復制。

TypedArray.prototype.subarray()

subarray方法是對于TypedArray數組的一部分,再建立一個新的視圖。

var a = new Uint16Array(8);
var b = a.subarray(2,3);

a.byteLength // 16
b.byteLength // 2

subarray方法的第一個參數是起始的成員序號,第二個參數是結束的成員序號(不含該成員),如果省略則包含剩余的全部成員。所以,上面代碼的a.subarray(2,3),意味著b只包含a[2]一個成員,字節(jié)長度為2。

TypedArray.prototype.slice()

TypeArray實例的slice方法,可以返回一個指定位置的新的TypedArray實例。

let ui8 = Uint8Array.of(0, 1, 2);
ui8.slice(-1)
// Uint8Array [ 2 ]

上面代碼中,ui8是8位無符號整數數組視圖的一個實例。它的slice方法可以從當前視圖之中,返回一個新的視圖實例。

slice方法的參數,表示原數組的具體位置,開始生成新數組。負值表示逆向的位置,即-1為倒數第一個位置,-2表示倒數第二個位置,以此類推。

TypedArray.of()

TypedArray數組的所有構造函數,都有一個靜態(tài)方法of,用于將參數轉為一個TypedArray實例。

Float32Array.of(0.151, -8, 3.7)
// Float32Array [ 0.151, -8, 3.7 ]

下面三種方法都會生成同樣一個TypedArray數組。

// 方法一
let tarr = new Uint8Array([1,2,3]);

// 方法二
let tarr = Uint8Array.of(1,2,3);

// 方法三
let tarr = new Uint8Array(3);
tarr[0] = 1;
tarr[1] = 2;
tarr[2] = 3;

TypedArray.from()

靜態(tài)方法from接受一個可遍歷的數據結構(比如數組)作為參數,返回一個基于這個結構的TypedArray實例。

Uint16Array.from([0, 1, 2])
// Uint16Array [ 0, 1, 2 ]

這個方法還可以將一種TypedArray實例,轉為另一種。

var ui16 = Uint16Array.from(Uint8Array.of(0, 1, 2));
ui16 instanceof Uint16Array // true

from方法還可以接受一個函數,作為第二個參數,用來對每個元素進行遍歷,功能類似map方法。

Int8Array.of(127, 126, 125).map(x => 2 * x)
// Int8Array [ -2, -4, -6 ]

Int16Array.from(Int8Array.of(127, 126, 125), x => 2 * x)
// Int16Array [ 254, 252, 250 ]

上面的例子中,from方法沒有發(fā)生溢出,這說明遍歷不是針對原來的8位整數數組。也就是說,from會將第一個參數指定的TypedArray數組,拷貝到另一段內存之中,處理之后再將結果轉成指定的數組格式。

復合視圖

由于視圖的構造函數可以指定起始位置和長度,所以在同一段內存之中,可以依次存放不同類型的數據,這叫做“復合視圖”。

var buffer = new ArrayBuffer(24);

var idView = new Uint32Array(buffer, 0, 1);
var usernameView = new Uint8Array(buffer, 4, 16);
var amountDueView = new Float32Array(buffer, 20, 1);

上面代碼將一個24字節(jié)長度的ArrayBuffer對象,分成三個部分:

  • 字節(jié)0到字節(jié)3:1個32位無符號整數
  • 字節(jié)4到字節(jié)19:16個8位整數
  • 字節(jié)20到字節(jié)23:1個32位浮點數

這種數據結構可以用如下的C語言描述:

struct someStruct {
  unsigned long id;
  char username[16];
  float amountDue;
};

DataView視圖

如果一段數據包括多種類型(比如服務器傳來的HTTP數據),這時除了建立ArrayBuffer對象的復合視圖以外,還可以通過DataView視圖進行操作。

DataView視圖提供更多操作選項,而且支持設定字節(jié)序。本來,在設計目的上,ArrayBuffer對象的各種TypedArray視圖,是用來向網卡、聲卡之類的本機設備傳送數據,所以使用本機的字節(jié)序就可以了;而DataView視圖的設計目的,是用來處理網絡設備傳來的數據,所以大端字節(jié)序或小端字節(jié)序是可以自行設定的。

DataView視圖本身也是構造函數,接受一個ArrayBuffer對象作為參數,生成視圖。

DataView(ArrayBuffer buffer [, 字節(jié)起始位置 [, 長度]]);

下面是一個例子。

var buffer = new ArrayBuffer(24);
var dv = new DataView(buffer);

DataView實例有以下屬性,含義與TypedArray實例的同名方法相同。

  • DataView.prototype.buffer:返回對應的ArrayBuffer對象
  • DataView.prototype.byteLength:返回占據的內存字節(jié)長度
  • DataView.prototype.byteOffset:返回當前視圖從對應的ArrayBuffer對象的哪個字節(jié)開始

DataView實例提供8個方法讀取內存。

  • getInt8:讀取1個字節(jié),返回一個8位整數。
  • getUint8:讀取1個字節(jié),返回一個無符號的8位整數。
  • getInt16:讀取2個字節(jié),返回一個16位整數。
  • getUint16:讀取2個字節(jié),返回一個無符號的16位整數。
  • getInt32:讀取4個字節(jié),返回一個32位整數。
  • getUint32:讀取4個字節(jié),返回一個無符號的32位整數。
  • getFloat32:讀取4個字節(jié),返回一個32位浮點數。
  • getFloat64:讀取8個字節(jié),返回一個64位浮點數。

這一系列get方法的參數都是一個字節(jié)序號(不能是負數,否則會報錯),表示從哪個字節(jié)開始讀取。

var buffer = new ArrayBuffer(24);
var dv = new DataView(buffer);

// 從第1個字節(jié)讀取一個8位無符號整數
var v1 = dv.getUint8(0);

// 從第2個字節(jié)讀取一個16位無符號整數
var v2 = dv.getUint16(1);

// 從第4個字節(jié)讀取一個16位無符號整數
var v3 = dv.getUint16(3);

上面代碼讀取了ArrayBuffer對象的前5個字節(jié),其中有一個8位整數和兩個十六位整數。

如果一次讀取兩個或兩個以上字節(jié),就必須明確數據的存儲方式,到底是小端字節(jié)序還是大端字節(jié)序。默認情況下,DataViewget方法使用大端字節(jié)序解讀數據,如果需要使用小端字節(jié)序解讀,必須在get方法的第二個參數指定true。

// 小端字節(jié)序
var v1 = dv.getUint16(1, true);

// 大端字節(jié)序
var v2 = dv.getUint16(3, false);

// 大端字節(jié)序
var v3 = dv.getUint16(3);

DataView視圖提供8個方法寫入內存。

  • setInt8:寫入1個字節(jié)的8位整數。
  • setUint8:寫入1個字節(jié)的8位無符號整數。
  • setInt16:寫入2個字節(jié)的16位整數。
  • setUint16:寫入2個字節(jié)的16位無符號整數。
  • setInt32:寫入4個字節(jié)的32位整數。
  • setUint32:寫入4個字節(jié)的32位無符號整數。
  • setFloat32:寫入4個字節(jié)的32位浮點數。
  • setFloat64:寫入8個字節(jié)的64位浮點數。

這一系列set方法,接受兩個參數,第一個參數是字節(jié)序號,表示從哪個字節(jié)開始寫入,第二個參數為寫入的數據。對于那些寫入兩個或兩個以上字節(jié)的方法,需要指定第三個參數,false或者undefined表示使用大端字節(jié)序寫入,true表示使用小端字節(jié)序寫入。

// 在第1個字節(jié),以大端字節(jié)序寫入值為25的32位整數
dv.setInt32(0, 25, false);

// 在第5個字節(jié),以大端字節(jié)序寫入值為25的32位整數
dv.setInt32(4, 25);

// 在第9個字節(jié),以小端字節(jié)序寫入值為2.5的32位浮點數
dv.setFloat32(8, 2.5, true);

如果不確定正在使用的計算機的字節(jié)序,可以采用下面的判斷方式。

var littleEndian = (function() {
  var buffer = new ArrayBuffer(2);
  new DataView(buffer).setInt16(0, 256, true);
  return new Int16Array(buffer)[0] === 256;
})();

如果返回true,就是小端字節(jié)序;如果返回false,就是大端字節(jié)序。

二進制數組的應用

大量的Web API用到了ArrayBuffer對象和它的視圖對象。

AJAX

傳統(tǒng)上,服務器通過AJAX操作只能返回文本數據,即responseType屬性默認為text。XMLHttpRequest第二版XHR2允許服務器返回二進制數據,這時分成兩種情況。如果明確知道返回的二進制數據類型,可以把返回類型(responseType)設為arraybuffer;如果不知道,就設為blob。

var xhr = new XMLHttpRequest();
xhr.open('GET', someUrl);
xhr.responseType = 'arraybuffer';

xhr.onload = function () {
  let arrayBuffer = xhr.response;
  // ···
};

xhr.send();

如果知道傳回來的是32位整數,可以像下面這樣處理。

xhr.onreadystatechange = function () {
  if (req.readyState === 4 ) {
    var arrayResponse = xhr.response;
    var dataView = new DataView(arrayResponse);
    var ints = new Uint32Array(dataView.byteLength / 4);

    xhrDiv.style.backgroundColor = "#00FF00";
    xhrDiv.innerText = "Array is " + ints.length + "uints long";
  }
}

Canvas

網頁Canvas元素輸出的二進制像素數據,就是TypedArray數組。

var canvas = document.getElementById('myCanvas');
var ctx = canvas.getContext('2d');

var imageData = ctx.getImageData(0, 0, canvas.width, canvas.height);
var uint8ClampedArray = imageData.data;

需要注意的是,上面代碼的uint8ClampedArray雖然是一個TypedArray數組,但是它的視圖類型是一種針對Canvas元素的專有類型Uint8ClampedArray。這個視圖類型的特點,就是專門針對顏色,把每個字節(jié)解讀為無符號的8位整數,即只能取值0~255,而且發(fā)生運算的時候自動過濾高位溢出。這為圖像處理帶來了巨大的方便。

舉例來說,如果把像素的顏色值設為Uint8Array類型,那么乘以一個gamma值的時候,就必須這樣計算:

u8[i] = Math.min(255, Math.max(0, u8[i] * gamma));

因為Uint8Array類型對于大于255的運算結果(比如0xFF+1),會自動變?yōu)?code>0x00,所以圖像處理必須要像上面這樣算。這樣做很麻煩,而且影響性能。如果將顏色值設為Uint8ClampedArray類型,計算就簡化許多。

pixels[i] *= gamma;

Uint8ClampedArray類型確保將小于0的值設為0,將大于255的值設為255。注意,IE 10不支持該類型。

WebSocket

WebSocket可以通過ArrayBuffer,發(fā)送或接收二進制數據。

var socket = new WebSocket('ws://127.0.0.1:8081');
socket.binaryType = 'arraybuffer';

// Wait until socket is open
socket.addEventListener('open', function (event) {
  // Send binary data
  var typedArray = new Uint8Array(4);
  socket.send(typedArray.buffer);
});

// Receive binary data
socket.addEventListener('message', function (event) {
  var arrayBuffer = event.data;
  // ···
});

Fetch API

Fetch API取回的數據,就是ArrayBuffer對象。

fetch(url)
.then(function(request){
  return request.arrayBuffer()
})
.then(function(arrayBuffer){
  // ...
});

File API

如果知道一個文件的二進制數據類型,也可以將這個文件讀取為ArrayBuffer對象。

var fileInput = document.getElementById('fileInput');
var file = fileInput.files[0];
var reader = new FileReader();
reader.readAsArrayBuffer(file);
reader.onload = function () {
  var arrayBuffer = reader.result;
  // ···
};

下面以處理bmp文件為例。假定file變量是一個指向bmp文件的文件對象,首先讀取文件。

var reader = new FileReader();
reader.addEventListener("load", processimage, false);
reader.readAsArrayBuffer(file);

然后,定義處理圖像的回調函數:先在二進制數據之上建立一個DataView視圖,再建立一個bitmap對象,用于存放處理后的數據,最后將圖像展示在Canvas元素之中。

function processimage(e) {
  var buffer = e.target.result;
  var datav = new DataView(buffer);
  var bitmap = {};
  // 具體的處理步驟
}

具體處理圖像數據時,先處理bmp的文件頭。具體每個文件頭的格式和定義,請參閱有關資料。

bitmap.fileheader = {};
bitmap.fileheader.bfType = datav.getUint16(0, true);
bitmap.fileheader.bfSize = datav.getUint32(2, true);
bitmap.fileheader.bfReserved1 = datav.getUint16(6, true);
bitmap.fileheader.bfReserved2 = datav.getUint16(8, true);
bitmap.fileheader.bfOffBits = datav.getUint32(10, true);

接著處理圖像元信息部分。

bitmap.infoheader = {};
bitmap.infoheader.biSize = datav.getUint32(14, true);
bitmap.infoheader.biWidth = datav.getUint32(18, true);
bitmap.infoheader.biHeight = datav.getUint32(22, true);
bitmap.infoheader.biPlanes = datav.getUint16(26, true);
bitmap.infoheader.biBitCount = datav.getUint16(28, true);
bitmap.infoheader.biCompression = datav.getUint32(30, true);
bitmap.infoheader.biSizeImage = datav.getUint32(34, true);
bitmap.infoheader.biXPelsPerMeter = datav.getUint32(38, true);
bitmap.infoheader.biYPelsPerMeter = datav.getUint32(42, true);
bitmap.infoheader.biClrUsed = datav.getUint32(46, true);
bitmap.infoheader.biClrImportant = datav.getUint32(50, true);

最后處理圖像本身的像素信息。

var start = bitmap.fileheader.bfOffBits;
bitmap.pixels = new Uint8Array(buffer, start);

至此,圖像文件的數據全部處理完成。下一步,可以根據需要,進行圖像變形,或者轉換格式,或者展示在Canvas網頁元素之中。

以上內容是否對您有幫助:
在線筆記
App下載
App下載

掃描二維碼

下載編程獅App

公眾號
微信公眾號

編程獅公眾號