LUA:如何正确读取带重音和umlaut的UFT8文件和路径?

在LUA中的一个更复杂的脚本中,我创建了以下函数,它应该检索位于调用函数时指定的目录中的所有音频文件的列表(第一个参数)。

该函数根据第2个参数的值返回格式化的HTML行或CSV行。

如果是1,则返回HTML 如果是2,则返回CSV

除非路径和/或文件名没有重音或umlauts,否则此函数无法正常工作。 然后失败。

这里是一个夸大的例子,我已经用它进行了测试:

J:\ PRODUCTION \ tüv-ààéérï-utf8 \ Rendering \ tüv-ààéérï-utf8_.wav

我确实尝试了实现这里提出的解决方案:

在纯LUA中将UTF-8字符串转换为ASCII

以及这里:

处理lua文件路径中的特殊字符(umlauts)

但没有成功。

在LUA中,是否有一种方法可以按它们具有重音/umlauted字符的方式获取文件名和路径?

重要提示: LUA解释器不是独立的。 它是内置于音频应用程序Reaper中的解释器。 因此,我无法安装特定的LUA扩展。 因此,我需要编写一些代码,但我完全迷失了方向。 [编辑] 操作系统为Windows,但也应该在Mac和Linux上运行

----------------------------------------------
-- 扫描渲染的音频
----------------------------------------------
function scandir(directory,format)
  local i, t, popen = 0, {}, io.popen
  t = ''
  local f=io.popen('dir '..directory)
    for filename in popen('dir "'..directory..'" /b'):lines() do
      local extension = filename:match("^.+(%..+)$")
      if extension == ".wav" or
         extension == ".mp3" or
         extension == ".flac" or
         extension == ".mov" or
         extension == ".ogg" or
         extension == ".mp4" then
          uriFormat = filename:gsub(" ", "%%20")
          if format == 1 then
            t = t..'<tr class="Rendered"><td>'..directory..'</td><td>'..tostring(filename)..'</td><td><audio controls src="'..directory..'/'..tostring(uriFormat)..'"/></td></tr>'
          elseif format == 2 then
            t = t..directory..','..tostring(filename)..','..directory..tostring(filename)..LF
          end
          i = i + 1
      end

    end
  return t
end

原文链接 https://stackoverflow.com/questions/70170504

点赞
stackoverflow用户1847592
stackoverflow用户1847592

问题1:dir 命令的输出转换为 UTF8 字符串。

在您的磁盘上的某个位置创建文件 cp.bat

@chcp %1 >nul

popen('dir "'..

替换为

popen('C:\\path\\to\\cp.bat 65001 <nul & dir "'..


问题2:将输入参数 directory(作为参数传递给函数 scandir 的 UTF-8 字符串)转换为正确的编码。

io.popen 期望其参数使用 1252 代码页。

因此,请使用 此脚本 中的 utf8_to_win 函数。

不要忘记在第 11 行设置您的代码页(1252)。

2021-11-30 16:28:47