使用正则表达式分离字符串

下面的代码输出:

re32
HKEY_LOCAL_MACHINE\SOFTWARE\XYZ\Assistant\
Active

我需要以下形式的输出——也就是说,我需要四个组,而不是三个:

re32
HKEY_LOCAL_MACHINE
SOFTWARE\XYZ\Assistant\
Active

在这种情况下,应该如何处理?

原文链接 https://stackoverflow.com/questions/5200742

点赞
stackoverflow用户191594
stackoverflow用户191594
_, _, XYZ, RootKey, Path, filename = string.find("re32:HKEY_LOCAL_MACHINE\SOFTWARE\XYZ\Assistant\Active ", "(%w+):(.-)\(.+)\(.*)")

print(XYZ)
print(RootKey)
print(Path)
print(filename)

应该输出

re32

HKEY_LOCAL_MACHINE

SOFTWARE\\XYZ\\Assistant\\

Active
2011-03-05 00:35:55
stackoverflow用户590278
stackoverflow用户590278

你可以在正则表达式中使用命名组。 例如:(/group1\\d)(abc) (在上面的示例中将“/”替换为“<”,将“\”替换为“>”) 这个正则表达式将匹配“3abc”,并且你可以通过在匹配中选择组名(group1)来获取匹配的数字。 参考这个http://www.regular-expressions.info/named.html

2011-03-05 02:57:59
stackoverflow用户20938
stackoverflow用户20938
_, _, XYZ, RootKey, Path, filename = string.find(
    "re32:HKEY_LOCAL_MACHINE\\SOFTWARE\\XYZ\\Assistant\\Active ",
    "(%%w+):(.-)\\(.+\\)(.*)")

print(XYZ)
print(RootKey)
print(Path)
print(filename)

输出:

re32
HKEY_LOCAL_MACHINE
SOFTWARE\XYZ\Assistant\
Active

在 ideone.com 上查看

这个答案基本上和 Serge 的答案相同,但是目标和模式字符串中的反斜杠被正确转义,最终的反斜杠包含在第三个捕获组中。

但最重要的是,这个解决方案是经过测试的。Ideone 赢了!

2011-03-05 03:33:31
stackoverflow用户282536
stackoverflow用户282536
使用 \[\[\]\] 代替 "" 以停止转义序列。

XYZ, RootKey, Path, filename = ([[re32:HKEY_LOCAL_MACHINE\SOFT WARE\XYZ\Assistant\Active ]]):match ( [[(%w+):([^\]+)(.+)\(.*)]])

其中,XYZ, RootKey, Path, filename 是一个 Lua 的多重赋值语句,利用 match 函数从 re32:HKEY_LOCAL_MACHINE\SOFT WARE\XYZ\Assistant\Active 中提取出对应的值。

2011-03-07 07:47:22