Lua,处理非ASCII字节流,字节顺序更改。

需要对包含非 ASCII 字符的字节流进行编码和解码,从/到 uint16、uint32、uint64(它们在 C/C++ 中的典型含义),并注意大小端。有没有一种高效且跨平台的方式可以在 Lua 中实现?

我的目标架构是 64 位 x86_64,但希望保持可移植性(如果不影响性能)。

例如:

解码(假设当前在 Lua 字符串中)—— 0x00,0x1d,0xff,0x23,0x44,0x32(小端序) 作为 - uint16:(0x1d00)=7424 uint32:(0x324423ff)=843326463

如果有人能举例说明,那就太好了。

原文链接 https://stackoverflow.com/questions/5241799

点赞
stackoverflow用户513763
stackoverflow用户513763

将下面翻译成中文并且保留原本的 markdown 格式,用于将字节转换为整数(同时处理字节级别、有符号性):

function bytes_to_int(str,endian,signed) -- 使用字符串长度确定8、16、32、64位
    local t={str:byte(1,-1)}
    if endian=="big" then -- 反转字节
        local tt={}
        for k=1,#t do
            tt[#t-k+1]=t[k]
        end
        t=tt
    end
    local n=0
    for k=1,#t do
        n=n+t[k]*2^((k-1)*8)
    end
    if signed then
        n = (n > 2^(#t*8-1) -1) and (n - 2^(#t*8)) or n -- 如果最后一位设置了,说明为负数。
    end
    return n
end

顺便再讲一下另一个方向:

function int_to_bytes(num,endian,signed)
    if num<0 and not signed then num=-num print"warning, dropping sign from number converting to unsigned" end
    local res={}
    local n = math.ceil(select(2,math.frexp(num))/8) -- 要使用的字节数。
    if signed and num < 0 then
        num = num + 2^n
    end
    for k=n,1,-1 do -- 每个字符有256个=2^8位。
        local mul=2^(8*(k-1))
        res[k]=math.floor(num/mul)
        num=num-res[k]*mul
    end
    assert(num==0)
    if endian == "big" then
        local t={}
        for k=1,n do
            t[k]=res[n-k+1]
        end
        res=t
    end
    return string.char(unpack(res))
end

欢迎提出任何评价,已经测试过了,但并不是很彻底。。。

2011-03-09 10:18:54
stackoverflow用户221509
stackoverflow用户221509

看一下 structlpack 函数库。

在这个例子中,我使用 struct.unpack 将 Lua 字符串解码为两个强制使用小端编码的整数:

require 'struct'
-- 将字符编码转换为 Lua 字符串 - 这可能来自于您的源代码
local str = string.char(0x00, 0x1d, 0xff, 0x23, 0x44, 0x32)
-- 格式字符串:< = 小端,In = 无符号整数(n 个字节)
local u16, u32 = struct.unpack('<I2I4', str)
print(u16, u32) --> 7424    843326463
2011-03-09 12:09:41
stackoverflow用户7137018
stackoverflow用户7137018

以下是没有参数检查的“Int16ToByte”函数的建议:

function Int16ToBytes(num, endian)
  如果 num < 0 then
      num = num & 0xFFFF
  end

  highByte = (num & 0xFF00) >> 8
  lowByte  = num & 0xFF

  如果 endian == "little" then
      lowByte, highByte = highByte, lowByte
  end

  返回 string.char(highByte,lowByte)
end
2016-11-09 15:16:27