问题：

在C#中如何将一个字符串中的所有内容捕获到单独的组中？[重复]

宗烨赫

2023-03-14

我在一个文件中有一些数据，我使用< code>Regex来获取各个元素，并删除< code >之间的所有< code>\r\n

但是当我尝试单独选择元素时，最后，整个数据被选为一个组。

这是我的正则表达式：

(<([ph0-9figc]+)>)([a-zA-Z0-9äöüÄÖÜß[:punct:] \n\r\t])+(<\/\2>)

带输入数据的样本

共有2个答案

仲孙兴旺

2023-03-14

如果你愿意接受额外的“_”和其他空格字符，那么我将你的模式简化如下：

var pat = @"(<(?'tag'[ph0-9figc]+)>)(?'body'([\wäöüÄÖÜß\p{P}\s])+)(<\/\k'tag'>)";

去除CR-LF的正则表达式是：

var body = m.Groups["body"].Value
   .Replace(Environment.NewLine, " ")
   .Replace("\r", " ")
   .Replace("\n", " ");
var tag = m.Groups["tag"].Value;
var noCrLf = re.Replace(text, m => $"<{tag}>{body}</{tag}>");

虽然看了你的数据，我可能不明白你在追求什么。例如，您的一个标记与您的标记模式“[ph0-9figc]”不匹配。如果我不明白你的担心，请给我指出来。

鲁博赡

2023-03-14

用正则表达式完成这项任务可能不是最好的主意，尤其是对于替换新行。

如果我们真的有必要，我们可能希望一个接一个地捕获这些标签。例如，此表达式仅使用三个捕获组< code>()来捕获< code>p标记:

(<p>)([\s\S]*?)(<\/p>)

我们还可以用 jex.im 可视化您的表情：

const regex = /(<p>)([\s\S]*?)(<\/p>)/gm;
const str = `<p>
<st>Liebe stern-Redaktion,
</st> 
<i>Liebe stern-Redaktion,</i> warum schreiben Sie nicht, was wirklich freitags whrend der Protest-Demos am Grenzzaun passiert? Wie die Familien der Mrder fr jede gettete jdische Person belohnt werden? Oder ber die Feuerballons, die aus dem Gazastreifen in den Sden Israels geschickt werden? Brita Singh, Scheeel</p>
<fig>
<img src="images/img_8-1.jpg" width="596" height="428" alt="" />
<fc>
<i>stern</i> Nr. 10/2019, Bild der Woche: Kindertrauer im Gazastreifen</fc>
</fig>	
<p>
<i>Sehr geehrte Frau Singh,</i> bei Demonstrationen am Grenzzaun starben laut Bericht der UN-Kommission in neun Monaten 35 Kinder durch Schüsse israelischer Soldaten. Zwei Journalisten und drei Sanitäter wurden erschossen, über 6000 Menschen verletzt. Israel hat gerade Ermittlungen zu elf der Todesfälle aufgenommen. Dagegen hat es in dem Zeitraum kein israelisches Todesopfer am Grenzzaun zu Gaza gegeben. Die Hamas pflegt einen Märtyrerkult und belohnt Morde mit Geld; israelische Sicherheitskräfte zerstören Häuser von Angehörigen palästinensischer Attentäter. Beides fördert den Hass. Opfer sind Menschen wie das Mädchen auf diesem Bild. Der <i>stern</i> hat keinen einseitigen Blick auf die Komplexität des Nahostkonflikts wir schauen stets auf beide Seiten. <i>Mit freundlichen Grüßen Cornelia Fuchs, Ressortleiterin Ausland</i></p>
<p>Eine liebevolle Mutter will, dass ihr Kind glücklich ist, egal, ob sie sein Leben versteht. Alles andere ist Egoismus und keine Mutterliebe. </p>
<p>Annemarie Fischer, Wielenbach</p>`;
let m;

while ((m = regex.exec(str)) !== null) {
    // This is necessary to avoid infinite loops with zero-width matches
    if (m.index === regex.lastIndex) {
        regex.lastIndex++;
    }
    
    // The result can be accessed through the `m`-variable.
    m.forEach((match, groupIndex) => {
        console.log(`Found match, group ${groupIndex}: ${match}`);
    });
}

在C#中如何将一个字符串中的所有内容捕获到单独的组中？[重复]

共有2个答案

相关问答

相关文章

相关阅读

相关工具

相关文档