我要做的是从字符串中删除所有重音符号和变音符号,将“lärm”变成“ larm”,或者将“andré”变成“
andre”。我试图做的是先对字符串进行utf8_decode,然后在其上使用strtr,但是由于我的源文件另存为UTF-8文件,因此我无法输入所有变音符号的ISO-8859-15字符-
编辑器将插入UTF-8字符。
显然,解决方案是拥有一个包含ISO-8859-15文件的包含文件,但是有比包含另一个所需包含文件更好的方法吗?
echo strtr(utf8_decode($input),
'ŠŒŽšœžŸ¥µÀÁÂÃÄÅÆÇÈÉÊËÌÍÎÏÐÑÒÓÔÕÖØÙÚÛÜÝßàáâãäåæçèéêëìíîïðñòóôõöøùúûüýÿ',
'SOZsozYYuAAAAAAACEEEEIIIIDNOOOOOOUUUUYsaaaaaaaceeeeiiiionoooooouuuuyy');
更新: 也许我对尝试做的事情有点不准确:我实际上并不是要删除变音符号,而是将其替换为最接近的“一个字符ASCII”。
iconv(“utf-8”,”ascii//TRANSLIT”,$input);
问题内容: 是否有任何库可以将特殊字符替换为ASCII等效项,例如: 至: 我当然可以创建地图: 并使用一些替换功能。但是我不想将所有等效项硬编码到我的程序中,如果已经有一些功能可以做到这一点。 问题答案:
问题内容: 我需要将unicode字符串转换为具有以unicode编码的非ascii字符的字符串。例如,字符串“汉字Max”应显示为“ \ u6F22 \ u5B57 Max”。 我尝试过的 的不同组合 新的String(sourceString.getBytes(encoding1),encoding2) Apache StringEscapeUtils也会转义ascii字符,例如双引号 Str
问题内容: 我的字符串看起来像这样:“您可以在[开始日期+ 30]之前使用促销。” 我需要将占位符替换为实际日期- 这是销售的开始日期加上30天(或其他任何数字)。也可以单独显示而无需添加数字。同样,占位符内的所有多余空格都应被忽略,并且不要使替换失败。 用Java做到这一点的最佳方法是什么?我正在考虑用于查找占位符的正则表达式,但不确定如何执行解析部分。如果只是[开始日期],我将使用该方法,但由
我正在尝试从最多500个字符的TextArea中获取值。但我面临一个问题,字符与变音符,其中每个特殊字符替换为4个字符。因此,如果我给出包含法语字符的500个字符的文本,在数据库中持久化所需的实际长度(字段长度为500)将超过500个字符,事务将失败。 一些例子: oubliée被转换为oubli:afetraye©E Désiriez被转换为D:FARTH©Siriez 使用的应用程序服务器:W
我需要将姓氏列表转换为字母数字用户名,但不幸的是,其中一些包含非ascii字符: 现在有一种方法是使用正则表达式删除任何非字母数字字符,例如。然而,更直观的解决方案(至少对用户来说)是将重音字符替换为它们的“纯”等价物,例如将、转换为,将转换为等。在javascript中有没有简单的方法来做到这一点?
问题内容: 我在字符串列表的json.Marshal上得到这个: 原因很明显,但是如何在Go中删除/替换这样的字符串?我一直在阅读docst 和包,似乎没有明显/快速的方法。 例如,在Python中,您可以使用一些方法删除无效字符,将其替换为指定字符或严格设置,这会导致无效字符的异常。如何在Go中做等效的事情? 更新:我的意思是得到异常的原因(紧急?)-json.Marshal期望有效的UTF-8