Lua模式 - 如何从字符串中删除不需要的部分

我收到以下的许多行:

2011/02 ARRTC   AAUUMCO ZZITNWMOBILE COMMUNICATIONS CENTER  ARRTC-AAUUM-TBT-2011-02 0.00    <a href="/cgi-bin/recon_detail?rectent=AAUUM&benificary=ARRTC&period=2011/02&svctype=Voice">AAUUM_ARRTC_0211_TBT</a>    18.03   18.03   EUR 1.14977 20.73   20.73
2011/02 ARRTC   AAUUMCO ZZITNWMOBILE COMMUNICATIONS CENTER  ARRTC-AAUUM-TBT-2011-02 0.00    <a href="/cgi-bin/recon_detail?rectent=AAUUM&benificary=ARRTC&period=2011/02&svctype=Voice">AAUUM_ARRTC_0211_TBT</a>    18.03   18.03   EUR 1.14977 20.73   20.73
2011/02 ARRTC   AAUUMCO ZZITNWMOBILE COMMUNICATIONS CENTER  ARRTC-AAUUM-TBT-2011-02 0.00    <a href="/cgi-bin/recon_detail?rectent=AAUUM&benificary=ARRTC&period=2011/02&svctype=Voice">AAUUM_ARRTC_0211_TBT</a>    18.03   18.03   EUR 1.14977 20.73   20.73
2011/02 ARRTC   AAUUMCO ZZITNWMOBILE COMMUNICATIONS CENTER  ARRTC-AAUUM-TBT-2011-02 0.00    <a href="/cgi-bin/recon_detail?rectent=AAUUM&benificary=ARRTC&period=2011/02&svctype=Voice">AAUUM_ARRTC_0211_TBT</a>    18.03   18.03   EUR 1.14977 20.73   20.73
2011/02 ARRTC   AAUUMCO ZZITNWMOBILE COMMUNICATIONS CENTER  ARRTC-AAUUM-TBT-2011-02 0.00    <a href="/cgi-bin/recon_detail?rectent=AAUUM&benificary=ARRTC&period=2011/02&svctype=Voice">AAUUM_ARRTC_0211_TBT</a>    18.03   18.03   EUR 1.14977 20.73   20.73
2011/02 ARRTC   AAUUMCO ZZITNWMOBILE COMMUNICATIONS CENTER  ARRTC-AAUUM-TBT-2011-02 0.00    <a href="/cgi-bin/recon_detail?rectent=AAUUM&benificary=ARRTC&period=2011/02&svctype=Voice">AAUUM_ARRTC_0211_TBT</a>    18.03   18.03   EUR 1.14977 20.73   20.73
2011/02 ARRTC   AAUUMCO ZZITNWMOBILE COMMUNICATIONS CENTER  ARRTC-AAUUM-TBT-2011-02 0.00    <a href="/cgi-bin/recon_detail?rectent=AAUUM&benificary=ARRTC&period=2011/02&svctype=Voice">AAUUM_ARRTC_0211_TBT</a>    18.03   18.03   EUR 1.14977 20.73   20.73
2011/02 ARRTC   AAUUMCO ZZITNWMOBILE COMMUNICATIONS CENTER  ARRTC-AAUUM-TBT-2011-02 0.00    <a href="/cgi-bin/recon_detail?rectent=AAUUM&benificary=ARRTC&period=2011/02&svctype=Voice">AAUUM_ARRTC_0211_TBT</a>    18.03   18.03   EUR 1.14977 20.73   20.73
2011/02 ARRTC   AAUUMCO ZZITNWMOBILE COMMUNICATIONS CENTER  ARRTC-AAUUM-TBT-2011-02 0.00    <a href="/cgi-bin/recon_detail?rectent=AAUUM&benificary=ARRTC&period=2011/02&svctype=Voice">AAUUM_ARRTC_0211_TBT</a>    18.03   18.03   EUR 1.14977 20.73   20.73
2011/02 ARRTC   AAUUMCO ZZITNWMOBILE COMMUNICATIONS CENTER  ARRTC-AAUUM-TBT-2011-02 0.00    <a href="/cgi-bin/recon_detail?rectent=AAUUM&benificary=ARRTC&period=2011/02&svctype=Voice">AAUUM_ARRTC_0211_TBT</a>    18.03   18.03   EUR 1.14977 20.73   20.73
2011/02 ARRTC   AAUUMCO ZZITNWMOBILE COMMUNICATIONS CENTER  ARRTC-AAUUM-TBT-2011-02 0.00    <a href="/cgi-bin/recon_detail?rectent=AAUUM&benificary=ARRTC&period=2011/02&svctype=Voice">AAUUM_ARRTC_0211_TBT</a>    18.03   18.03   EUR 1.14977 20.73   20.73

每一行, 我都收到一个由 HTML 标签包含着的值,如下所示。

<a href="/cgi-bin/recon_detail?rectent=AAUUM&benificary=ARRTC&period=2011/02&svctype=Voice">AAUUM_ARRTC_0211_TBT</a>

我想要去掉这些 HTML 标签,用隐藏在这些标签内的真实值 AAUUM_ARRTC_0211_TBT 替换所有这些值。所以在处理后,我需要上面的数据应该变成这样。

``` 2011/02 ARRTC AAUUMCO ZZITNWMOBILE COMMUNICATIONS CENTER ARRTC-AAUUM-TBT-2011-02 0.00 AAUUM_ARRTC_0211_TBT 18.03 18.03 EUR 1.14977 20.73 20.73 2011/02 ARRTC AAUUMCO ZZITNWMOBILE COMMUNICATIONS CENTER ARRTC-AAUUM-TBT-2011-02 0.00 AAUUM_ARRTC_0211_TBT 18.03 18.03 EUR 1.14977 20.73 20.73 2011/02 ARRTC AAUUMCO ZZITNWMOBILE COMMUNICATIONS CENTER ARRTC-AAUUM-TBT-2011-02 0.00 AAUUM_ARRTC_0211_TBT 18.03 18.03 EUR 1.14977 20.73 20.73 2011/02 ARRTC AAUUMCO ZZITNWMOBILE COMMUNICATIONS CENTER ARRTC-AAUUM-TBT-2011-02 0.00 AAUUM_ARRTC_0211_TBT 18.03 18.03 EUR 1.14977 20.73 20.73 2011/02 ARRTC AAUUMCO ZZITNWMOBILE COMMUNICATIONS CENTER ARRTC-AAUUM-TBT-2011-02 0.00 AAUUM_ARRTC_0211_TBT 18.03 18.03 EUR 1.14977 20.73 20.73 2011/02 ARRTC AAUUMCO ZZITNWMOBILE COMMUNICATIONS CENTER AR

原文链接 https://stackoverflow.com/questions/6570291

点赞
stackoverflow用户107090
stackoverflow用户107090

尝试使用 s=s:gsub("<a.->(.-)</a>","%1")

2011-07-04 11:02:30
stackoverflow用户282843
stackoverflow用户282843

这将删除所有括号中的内容: s=s:gsub("%b<>", "")

2012-11-15 23:48:09