LUA中使用字符串连接的绝对最低限?

运行环境: ARM64编译的lua 5.1.x版本,不允许使用C模块。

示例代码可即刻执行: https://paste.gg/p/anonymous/08f364480a5f470e9da610ab565e11c0

我需要在一个循环中每X毫秒连接一堆字符串。根据我的理解,LUA支持“字符串内联”,这意味着字符串常量会被“缓存”并且不会每次分配。因此,仅直接调用tostring()(或..糖)将进行分配。现有字符串值的其余部分将通过引用传递。

到目前为止我做了什么:

  • 通过LUT消除了所有整数和字符串的分配
  • 虽然tostring(bool)确实从缓存中返回内联字符串,但我也消除了它
  • 通过索引创建了类似字符串构建器的伪表(~每个16B)
  • “预调整”了表的大小,以避免关联添加的成本,并将其设置为全局表,因此它不会被收集和重新创建
  • 使用table.concat()进行最终串联

最终结果仍然让我感到难过:

已分配预串联: 2.486328125 KB
已分配后串联: 39.7451171875 KB
表元总字节:1544 B
tostring元总字节: 273 B

我有什么遗漏的地方或者我达到了LUA的极限?

原文链接 https://stackoverflow.com/questions/69878514

点赞
stackoverflow用户10953006
stackoverflow用户10953006

你想要尽可能减少字符串对象中间分配的次数,以减少 GC 压力和减缓 GC 命中速度。在这种情况下,我建议您 仅调用一次 string.format 并用您想要格式化的字符串:

  • 可以全局声明字符串格式,以便它只 interned 一次。
  • string.format 代码可以在这里阅读。我们从这个代码中可以看到,中间字符串转换会使用 C 堆栈和 LUAL_BUFFERSIZE 字节的缓冲区进行。此大小在 luaconf.h 中声明,可根据需要进行自定义。对于您的用例,这种方法应该是最有效的,因为您只需放弃所有中间步骤(表插入,table.concat 等)。
local MY_STRING_FORMAT = [[My Very Big String
param-string-1 %d
param-string-2 %x
param-string-3 %f
param-string-4 %d
param-string-5 %d
]]

string.format(MY_STRING_FORMAT,
              Param1,
              Param2,
              Param3,
              Param4,
              Param5,
              等等...)
2021-11-09 01:40:28