当前位置：首页 > 知识库问答 >

问题：

从Java中的字符串中删除阿拉伯非字母数字字符

庄浩言

2023-03-14

如何在Java中从字符串中删除所有非字母数字阿拉伯字符？

共有3个答案

公羊俊德

2023-03-14

我尝试了多种解决方案，但没有明显的效果。我尝试了当前线程和这里的所有解决方案——我如何从java中的字符串中删除阿拉伯标点符号。

由于没有其他解决方案可以完全工作，我创建了一个只保留阿拉伯字符的方法，其余所有字符都将被删除，如下所示-

public static String findArabicString(String s) {
    StringBuilder finalValue = new StringBuilder();
    
     if (null != s) {
        for (int i = 0; i < s.length();) {
            int c = s.codePointAt(i);
            if ((c >= 0x0600 && c <= 0x06E0))
                finalValue.append((char) c);
            i += Character.charCount(c);            
        }
     }
    
    System.out.println(finalValue.toString());
    return finalValue.toString();
}

该方法可以根据需要定制，例如我想保留空格和阿拉伯字符，然后在测试条件下需要稍微的chnage，如下所示-

public static String findArabicString(String s) {
    StringBuilder finalValue = new StringBuilder();
    
     if (null != s) {
        for (int i = 0; i < s.length();) {
            int c = s.codePointAt(i);
            // 32 is unicode for white space
            if ((c >= 0x0600 && c <= 0x06E0) || c == 32)
                finalValue.append((char) c);
            i += Character.charCount(c);            
        }
     }
    
    System.out.println(finalValue.toString());
    return finalValue.toString();
}

我希望这将有助于任何人面临类似的问题，因为我这样做。

桂宏旷

2023-03-14

以下是完整的答案：

   String patternString = "";
    Pattern pattern = null;
    Matcher matcher = null;
    String normalizedString = "";

    patternString = "[^A-Za-zأ-ْ-9 ]";
    pattern = Pattern.compile(patternString);
    matcher = pattern.matcher(string);
    normalizedString = matcher.replaceAll("");

秦博延

2023-03-14

使用正则表达式[^A-Za-z0-9]正则表达式将只允许从A到Z的字母和从a到z的数字从0到9。没有别的

类似资料：

从字符串中删除非字母数字字符

问题内容：我想将以下字符串转换为提供的输出。我还没有发现，将处理特殊字符，如任何解决方案，，，等。基本上，我只是想摆脱所有不是字母数字的东西。这是我尝试过的… 尝试多个步骤结果任何帮助，将不胜感激。工作解决方案：问题答案：删除非字母数字字符以下是/正确的正则表达式，用于从输入字符串中去除非字母数字字符：请注意，这等效于-它包括下划线字符。要删除下划线，请使用例如：输入格式错误
从字符串中删除非数字字符

问题内容：我得到的任务是从文本文件或字符串中删除所有非数字字符，包括空格，然后在旧字符旁边打印新结果，例如：之前：后：由于我是初学者，所以我不知道从哪里开始。请帮忙问题答案：最简单的方法是使用正则表达式
Python，从字符串中删除所有非字母字符

问题内容：我正在编写python MapReduce字数统计程序。问题是数据中散布着许多非字母字符，我发现这篇文章从Python的字符串中剥离了除了字母数字字符之外的所有内容，这显示了使用正则表达式的一个很好的解决方案，但是我不确定如何实现它恐怕我不确定该如何使用该库甚至正则表达式。我不确定如何将正则表达式模式正确地应用于传入的字符串（书的一行）以检索没有任何非字母数字字符的新行。有什么建议
从Java中的字符串中删除非ASCII字符

问题内容：我有一个包含非ASCII字符的URI，例如： http://www.abc.de/qq/qq.ww?MIval=typo3_bsl_int_Smtliste&p_smtbez=Schmalbl -ttrigeSomerzischeruchtanb 如何从此URI中删除“ …” 问题答案：我猜想URL的来源更多是错误的。也许您正在解决错误的问题？从URI中删除“奇怪”字符可能会赋予它完
从字符串中删除非UTF8字符

问题内容：我在从字符串中删除非utf8字符时出现问题，这些字符无法正确显示。像这样的字符0x97 0x61 0x6C 0x6F（十六进制表示）删除它们的最佳方法是什么？正则表达式还是其他？问题答案：使用正则表达式方法：它搜索UTF-8序列，并将其捕获到组1中。它还与无法标识为UTF-8序列的一部分的单个字节匹配，但不捕获这些字节。替换是捕获到组1中的任何内容。这将有效删除所有无效字节。
从字符串中删除非ASCII字符

问题内容：从网站提取数据时出现奇怪的字符：如何删除不是非扩展ASCII字符的内容？问题答案：正则表达式替换将是最佳选择。使用作为一个例子的字符串，并使用匹配它，这是一个POSIX字符类：什么是寻找所有可打印字符。相反，查找所有不可打印的字符。不属于当前字符集的所有字符都将被删除。注意：使用此方法之前，必须确保当前字符集为ASCII。POSIX字符类同时支持ASCII和Unicode，

相关问答

从字符串中删除最后字符从字符串中删除转义字符从字符串中删除重复字符的方法（Java）从字符串中删除重复的字符[duplicate]分隔Java中的字母数字字符串[闭合]

相关文章

从字符串中删除非ASCII字符从Java中的String数组中删除所有非字母字符如何删除非字母数字字符？从字符串中去除非数字字符在Python中从字符串中删除所有非数字字符

相关阅读

C语言数组与字符串（包括：字符串与字符数组）C语言字符数组和字符串 Java字符串的替换 Java查找字符串 Java字符串比较

相关工具

数字绘字符云监控系统滚动数字Label 思沃数字平台语音数字键盘

相关文档

格式化字符串漏洞利用阿里云 OSS Python SDK 中文文档 Krpano 非官方中文文档 Java 程序员眼中的 Linux 阿里巴巴 Java 代码开发规范指南