如何在Lua字符串中存储二进制数据

我需要创建一个带有嵌入式元信息的自定义文件格式。但我决定不自己动手创建,而是使用 Lua。

texture
{
   format=GL_LUMINANCE_ALPHA;
   type=GL_UNSIGNED_BYTE;
   width=256;
   height=128;
   pixels=[[
<binary-data-here>]];
}

texture 是一个以一个表格为参数的函数。它可以通过表格中名称查找各个参数,并将调用转发到 C++ 例程上。希望没有什么不寻常的地方。

偶尔会出现以下错误,导致文件解析失败:

my_file.lua:8: unexpected symbol near ']'

这是怎么回事?

有更好的办法在 Lua 中存储二进制数据吗?


更新

事实证明,在 Lua 字符串中存储二进制数据是 非常复杂的。但是,当注意到 3 个序列时,它是可能的。

  • 长格式字符串字面值 不能嵌入一个 _closing-long-bracket_(]]=]等)。

    这个很显然。

  • 长格式字符串字面值不能以类似于 ]== 的东西结束,否则会与所选的 closing-long-bracket 匹配。

    这个更微妙一些。幸运的是,如果操作不正确,脚本将无法编译。

  • 数据不能嵌入 \n\r

    Lua 的内置行末处理会破坏它们。这个问题更加微妙。脚本将可以正常编译,但会产生错误的结果。0x13 => 0x10,0x1013 => 0x10,等等。

为了绕过这些限制,我将二进制数据分成 \r\n,然后选择一个可行的 _long-bracket_,最后生成将各个部分串联在一起的 Lua。我使用了一个帮我完成这项工作的脚本。

输入: XXXX\nXX]]XX\r\nXX]]XX]=

texture
{
  --其他字段被省略
  pixels= '' ..
     [[XXXX]] ..
     '\n' ..
     [=[XX]]XX]=] ..
     '\r\n' ..
     [==[XX]]XX]=]==];
}

原文链接 https://stackoverflow.com/questions/3815213

点赞
stackoverflow用户1491
stackoverflow用户1491

二进制数据需要编码成可打印字符。解码时最简单的方法是对所有字节使用类似 C 中的转义序列。例如,十六进制字节13 41 42 1E将被编码为\\19\\65\\66\\30。当然,编码后的数据大小是源二进制的三到四倍。

或者,你可以使用类似 Base64 的编码方式,但这需要在运行时进行解码,而不能依赖 Lua 解释器。个人来说,我可能会选择 Base64 的方法。Lua 中有 Base64 编码和解码的示例

另一种选择是使用两个文件。使用一个定义清晰的图像格式文件(如 TGA),并在一个独立的 Lua 脚本中指向额外的元数据。如果你不想让两个文件分开移动,它们可以组合在一个 archive 中。

2010-09-28 18:14:35
stackoverflow用户173806
stackoverflow用户173806

Lua 能够使用长括号格式编码包括 null 字符在内的大多数字符。但是,Lua 在文本模式下打开脚本文件,这引起了一些问题。在我的 Windows 系统中,以下字符存在问题:

字符代码        问题
--------------    -------------------------------
13(CR)           被转换成 10(LF)
13 10(CR LF)     被转换成 10(LF)
26(EOF)          引起“未完成长字符串附近的'<eof>”错误

如果您不使用 Windows,则这些可能不会导致问题,但可能会存在不同基于文本模式的问题。


我只能通过编码多个关闭括号来产生您收到的错误:

a=[[
]]] --> a.lua:2: unexpected symbol near ']'

但是,这很容易通过以下方式修复:

a=[==[
]]==]
2010-09-29 16:42:46