在Lua中分割多字节字符串
2015-1-14 11:52:40
收藏:0
阅读:130
评论:3
我在Lua中有一个多字节字符串。
local s = "あいうえお"
我该如何将字符串拆分为字符串表?
在英文文本中,我可以使用此代码。 但这在多字节中不起作用。
local s = "foo bar 123"
local words = {}
for word in s:gmatch("%w+") do
table.insert( words, word )
end
原文链接 https://stackoverflow.com/questions/9003747
点赞
stackoverflow用户284969
正如其他人所指出的那样,不太清楚你想要做什么:如果在空格处分割不足以满足你,你想要在哪里分割非 ASCII 字符?
如果你只想在非 ASCII 字符之间按单个字符进行分割,那么以下代码可能就足够了:
s = "oink barf é ‘å¼µã£ã¦ã„ã¾ã™"
for word in s:gmatch("[\33-\127\192-\255]+[\128-\191]*") do
print (word)
end
输出:
oink
barf
é ‘
å¼µ
ã£
ã¦
ã„
ã¾
ã™
这里的诀窍在于,在 UTF-8 中,多字节字符各自由“引导字节”组成,顶部两位等于 11
(因此在 Lua 中是 \192
-\255
- 记住,Lua 中的字符转义是十进制),后跟零个或多个“跟随字节”,顶部两位等于 10
(在 Lua 中是 \128
-\191
)。
2012-01-27 06:41:24
stackoverflow用户1009479
如果它是UTF-8,在Lua 5.3中,您可以像这样使用utf8
库:
local s = "ã‚ã„ã†ãˆãŠ"
local words = {}
for _, c in utf8.codes(s) do
table.insert(words, utf8.char(c))
end
2015-01-14 11:52:11
评论区的留言会收到邮件通知哦~
推荐文章
- 如何在roblox studio中1:1导入真实世界的地形?
- 求解,lua_resume的第二次调用继续执行协程问题。
- 【上海普陀区】内向猫网络招募【Skynet游戏框架Lua后端程序员】
- SF爱好求教:如何用lua实现游戏内调用数据库函数实现账号密码注册?
- Lua实现网站后台开发
- LUA错误显式返回,社区常见的规约是怎么样的
- lua5.3下载库失败
- 请问如何实现文本框内容和某个网页搜索框内容连接,并把网页输出来的结果反馈到另外一个文本框上
- lua lanes多线程使用
- 一个kv数据库
- openresty 有没有比较轻量的 docker 镜像
- 想问一下,有大佬用过luacurl吗
- 在Lua执行过程中使用Load函数出现问题
- 为什么 neovim 里没有显示一些特殊字符?
- Lua比较两个表的值(不考虑键的顺序)
- 有个lua简单的项目,外包,有意者加微信 liuheng600456详谈,最好在成都
- 如何在 Visual Studio 2022 中运行 Lua 代码?
- addEventListener 返回 nil Lua
- Lua中获取用户配置主目录的跨平台方法
- 如何编写 Lua 模式将字符串(嵌套数组)转换为真正的数组?
为了开始,从这个 Stack Overflow 的问题 如何在 Lua 中写入 Unicode 符号 开始,RBerteig 的答案指向了一个库 slnunicode。
此外,在这个 Stack Overflow 的问题 是否有任何 Lua 库可以使用 utf8 编码将字符串转换为字节 中也有提到它。