以下代码产生输出“ Hello World!”。(不,请尝试)。
public static void main(String... args) {
// The comment below is not a typo.
// \u000d System.out.println("Hello World!");
}
原因是Java编译器将Unicode字符解析\u000d
为新行并转换为:
public static void main(String... args) {
// The comment below is not a typo.
//
System.out.println("Hello World!");
}
因此导致评论被“执行”。
由于可以将其用于“隐藏”恶意代码或任何邪恶的程序员可以想到的内容, 因此为什么允许在注释中使用它 ?
为什么Java规范允许这样做?
Unicode解码发生在任何其他词汇翻译之前。这样做的主要好处是,它使得在ASCII和任何其他编码之间来回切换变得很简单。您甚至不需要弄清楚注释的开始和结束位置!
如JLS第3.3节所述,这允许任何基于ASCII的工具来处理源文件:
[…]
Java编程语言指定了一种将Unicode编写的程序转换为ASCII的标准方法,该程序将程序更改为可以由基于ASCII的工具处理的形式。[…]
这为平台独立性(支持的字符集的独立性)提供了基本保证,而平台独立性一直是Java平台的主要目标。
能够在文件中的任何位置写入任何Unicode字符是一项很简洁的功能,在以非拉丁语言记录代码时,在注释中尤其重要。它会以这种微妙的方式干扰语义的事实只是(不幸的)副作用。
这个主题有很多陷阱,Joshua Bloch和Neal Gafter的 Java
Puzzlers
包括以下变体:
这是合法的Java程序吗?如果是这样,它将打印什么?
\u0070\u0075\u0062\u006c\u0069\u0063\u0020\u0020\u0020\u0020 \u0063\u006c\u0061\u0073\u0073\u0020\u0055\u0067\u006c\u0079 \u007b\u0070\u0075\u0062\u006c\u0069\u0063\u0020\u0020\u0020 \u0020\u0020\u0020\u0020\u0073\u0074\u0061\u0074\u0069\u0063 \u0076\u006f\u0069\u0064\u0020\u006d\u0061\u0069\u006e\u0028 \u0053\u0074\u0072\u0069\u006e\u0067\u005b\u005d\u0020\u0020 \u0020\u0020\u0020\u0020\u0061\u0072\u0067\u0073\u0029\u007b \u0053\u0079\u0073\u0074\u0065\u006d\u002e\u006f\u0075\u0074 \u002e\u0070\u0072\u0069\u006e\u0074\u006c\u006e\u0028\u0020 \u0022\u0048\u0065\u006c\u006c\u006f\u0020\u0077\u0022\u002b \u0022\u006f\u0072\u006c\u0064\u0022\u0029\u003b\u007d\u007d
(该程序原来是普通的“ Hello World”程序。)
在解决难题的方法中,他们指出了以下几点:
更严重的是,此难题有助于加强前三个方面的教训: 当您需要在程序中插入无法以任何其他方式表示的字符时,Unicode转义至关重要。
在所有其他情况下,请避免使用它们。
来源:Java:在注释中执行代码?
问题内容: 我最近了解到,Java源代码中不仅允许将Unicode字符作为Unicode字符(例如),还允许将其作为转义序列(例如)。 第一个变体对我来说很有意义-它允许程序员使用他们选择的国际语言来命名变量和方法。但是,我看不到第二种方法的任何实际应用。 以下是一些使用Java SE 6和NetBeans 6.9.1进行测试的说明用法的代码: 此代码将打印出3.141592653589793 说
问题内容: 在精确地探究Java标识符中允许使用哪些字符时,我偶然发现了一件非常奇怪的事情,以至于几乎可以肯定这是一个错误。 我预料地发现,Java标识符合他们开始与拥有的Unicode字符属性的要求,并其次是与物业,以授予领先的下划线和美元符号例外。事实并非如此,我发现与我所听说的那种普通标识符或其他任何想法都存在极大差异。 简短演示 请考虑以下演示,证明Java标识符中允许使用ASCII ES
问题内容: 我用来解析/验证用户输入。不幸的是,它在解析时允许字符作为后缀。 示例代码: 结果: 我实际上希望他们两个都有解析异常。我怎样才能告诉我不允许输入? 问题答案: 从以下文档中: 从给定字符串的开头解析文本以产生数字。 该方法可能不会使用给定字符串的整个文本。 这是一个示例,可以使您了解如何确保考虑整个字符串。 输出:
我正在学习Spring Core认证,我对这个基于学习材料的问题的答案有一些疑问。 为什么不允许使用@Configuration注释最终类 为了证实这一论断,我的理由如下: 考虑下面的配置类: 乍一看,这种情况可能看起来很奇怪,因为第一个方法(帐户存储库())将JdbcAcCountRepository对象实例化为一个bean,该对象具有id=AcCountRepository,遵循Spring默
问题内容: 下划线似乎很好。破折号怎么办?其他特殊字符? 问题答案: 实际上,HTML和XHTML之间是有区别的。由于XHTML是XML,因此XML ID的规则适用: ID类型的值必须与Name产生的匹配。 对于HTML,适用以下条件: id =名称[CS] 此属性为元素分配名称。此名称在文档中必须唯一。 ID和NAME令牌必须以字母([A-Za-z])开头,然后可以跟任意数量的字母,数字([0-
问题内容: 我有一个来自客户的错误,当我查看日志时,我们跟踪异常,某些堆栈跟踪没有行号: 请注意:我已将包名称替换为“ xx”),并且所有类和方法均在我们的应用程序中定义: 完整的堆栈跟踪如下: 我对为什么会发生这样的事情很感兴趣,我的客户是否有可能对现有代码(自定义)进行某些处理? 问题答案: 不显示行号的代码是在没有调试信息的情况下编译的。