当前位置: 首页 > 编程笔记 >

深入学习Java编程中的字符串的进阶使用

葛永丰
2023-03-14
本文向大家介绍深入学习Java编程中的字符串的进阶使用,包括了深入学习Java编程中的字符串的进阶使用的使用技巧和注意事项,需要的朋友参考一下

JAVA虽然是在C++基础上发展而来,但却对C++的许多缺陷有所改进,其中一个不得不提的就是字符串,我们知道,随着学习的深入,进入MFC时,当处理字符串或字符时,常会需要通过_T()宏将字符或字符串变成UNICODE型,否则,会在处理中出现BUG,而在JAVA中,字符char或存储在Character类中的字符,不是一个字节,而是2个字节,采用UNICODE,这是为了支持全世界上的所有字符。

        字符的序列组成字符串,有两种类型的字符串:一种是创建以后不需要修改的,称为字符串常量,在JAVA中,用String类存储;
     一种是创建以后需要对其进行修改的,称为字符串变量,在JAVA中,用StringBuffer类操作和管理。

 StringBuffer类

1、创建StringBuffer类对象

     StringBuffer类对象表示的是字符串变量(注意是"变量"),每一个StringBuffer类对象都是可以扩充和修改的字符串变量。以下是常用的StringBuffer类构造函数:

      (1)public StringBuffer()

       创建一个新的空的StringBuffer类的对象,其容量初值设置成16个字符(注意是16个字符)

   (2)public StringBuffer(int length)

       创建一个新的空的StringBuffer类的对象,其容量初值设置成length个字符

    (3)public StringBuffer(String str)

       创建一个新的StringBuffer类的对象,其内容为str的内容,容量设置成str长度再加16个字符 (注意:再加上16个字符)


2、StringBuffer类对象的常用方法

     (1)StringBuffer类对象的扩充

         StringBuffer类提供两组方法用来扩充StringBuffer对象所包含的字符,分别是:

        1)public StringBuffer append

                            (Object  obj)

          append方法用于扩充StringBuffer对象所包含的字符,该方法将指定的参数对象转化为字符串后,将其附加在原来的StringBuffer对象之后,并返回新的StringBuffer对象。附加的的参数对象可以是各种数据类型的,如int、char、String、double等。

2)public StringBuffer insert(

        int插入位置offset,参数对象类型,参数对象名)

    该方法将指定的参数对象转化为字符串后,将其插入在原来的StringBuffer对象中指定的位置,并返回新的StringBuffer对象。

    (2)StringBuffer类对象的长度与容量

    一个StringBuffer类对象的长度指的是它包含的字符个数;容量指的是被分配的字符空间的数量。

     1)public int length()

        该方法返回当前StringBuffer类对象包含的字符个数。

    2)public int capacity()

   该方法返回当前StringBuffer类对象分配的字符空间的数量。
(3)StringBuffer类对象的修改

   public void setCharAt(intindex,charch)

     该方法将当前StringBuffer对象中的index位置的字符替换为指定的字符ch。

    (4)字符串的赋值和加法

      字符串是在程序中要经常使用的数据类型,在Java编译系统中引入了字符串的赋值和加法操作。

   (5)其它方法类似String类的方法
3、利用StringTokenizer类分解字符串

StringTokenizer类位于java.util包中, 在使用该类时在程序开始加上

importjava.util.StringTokenizer或

importjava.util.*

StringTokenizer类

对于StringTokenizer类,其主要作用是将字符串按照给定的分割符进行分割,其功能和String类的split方法类似

1、StringTokenizer类的构造函数

(1)StringTokenizer(Stringstr)

         为给定的字符串str创建一个StringTokenizer对象,其分隔符默认设置为“\t\n\r\f”,亦即:空格、水平制表符tab、换行、回车、表格符

(2)StringTokenizer(String str,String delim)

              为给定的字符串str创建一个StringTokenizer对象,其分隔符为指定的字符串delim,默认不包含分隔符

 


3)StringTokenizer(String str,String delim,boolean returnDelims)

             为给定的字符串str创建一个StringTokenizer对象,其分隔符为指定的字符串delim,如果returnDelims为true,则创建的StringTokenizer对象中的每个字符串包含有分隔符,否则不包含分隔符

2、StringTokenizer类的常用方法

nIntcountTokens()
返回StringTokenizer对象中被分割后子字符串的个数
nBooleanhasMoreElements()
该方法的功能和hasMoreTokens()方法的功能一样
nBooleanhasMoreTokens()
检测StringTokenizer对象中是否包含分割好的子字符串,有则返回true,否则返回false
ObjectnextElement()

该方法具有nextToken()一样的功能,主要区别是它返回的不是String对象,而是一个Object对象

StringnextToken()

返回StringTokenizer对象中下一个分割好的子字符串

StringnextToken(String delim)

返回StringTokenizer对象中下一个分割好的子字符串,但是分隔符被重新设定为delim

n其实在有些编程语言中,比如C语言,其字符串就是由字符数组构成的,每个字符串的结尾用“\0”标志,但是在Java中却不是这样的。
n在Java中,字符串通常是作为String类的对象存在着,如:Strings=“I like Java!”,其中“Ilike Java!”就是一个对象。
所以说,Java中的字符串和字符数组是完全不相同的,和C语言中的字符串也是不一样的!

 


n为了方便字符串和字符数组的转换,在String类中提供了许多这样的构造函数和方法
n如构造函数String(char[] value)
n方法toCharArray()
方法valueOf(char[] data)


常量池

对于源程序中出现的字符串常量,当程序运行时,会统一保存到一个常量池中进行缓存。
对引用这些缓存在常量池中的字符串的变量进行比较,用==也会得到正确的结果。

但在运行时,对字符串的各种操作如+、substring等等,都是会产生新的字符串对象的。
但是强大的编译器会对字符串常量的拼接进行优化,诸如s3 = "hell" + "o"时,s3仍然会
指向常量池中的字符串。但对于变量的运算,总不能要求虚拟机执行诸如s1 + s2时还要
判断结果是否已在常量池中了吧。因此,要用equals而非==去判断两个字符串是否相等。

public static void main(String[] args) { 
 
 // String constants are put in constant pool. 
 String s1 = "hello"; 
 String s2 = "hello"; 
 String s3 = "hell" + "o"; 
 System.out.println(s1 == s2); 
 System.out.println(s1 == s3); 
  
 // Operation like +,substring on string create new one. 
 String s4 = "hell"; 
 String s5 = s4 + "o"; 
 System.out.println(s1 == s5); 
 System.out.println(s1.equals(s5)); 
  
 // substring has special handle on substring(0) 
 String s6 = s1.substring(0); 
 System.out.println(s1 == s6); 
} 

测试代码s1、s2、s3的字节码:

   0:   ldc     #16; //String hello
   2:   astore_1
   3:   ldc     #16; //String hello
   5:   astore_2
   6:   ldc     #16; //String hello
   8:   astore_3

测试代码s4、s5的字节码:
  
   41:  ldc     #30; //String hell
   43:  astore  4
   45:  new     #32; //class java/lang/StringBuilder
   48:  dup
   49:  aload   4
   51:  invokestatic    #34; //Method java/lang/String.valueOf:(Ljava/lang/Object;)Ljava/lang/String;
   54:  invokespecial   #40; //Method java/lang/StringBuilder."<init>":(Ljava/lang/String;)V
   57:  ldc               #43; //String o
   59:  invokevirtual   #45; //Method java/lang/StringBuilder.append:(Ljava/lang/String;)Ljava/lang/StringBuilder;
   62:  invokevirtual   #49; //Method java/lang/StringBuilder.toString:()Ljava/lang/String;

注意一点是substring方法,substring(0,3)是得到从字符0到2的字符串。这样设计的原因
也许是这样容易计算子串的长度,3-0=3。同时substring对于特殊参数有特别的优化处理:

public String substring(int beginIndex, int endIndex) { 
 if (beginIndex < 0) { 
  throw new StringIndexOutOfBoundsException(beginIndex); 
 } 
 if (endIndex > count) { 
  throw new StringIndexOutOfBoundsException(endIndex); 
 } 
 if (beginIndex > endIndex) { 
  throw new StringIndexOutOfBoundsException(endIndex - beginIndex); 
 } 
 return ((beginIndex == 0) && (endIndex == count)) ? this : 
  new String(offset + beginIndex, endIndex - beginIndex, value); 
} 

由此看出,String对象背后并没有什么神奇之处,对字节码有了些了解可以更好的理解它。
其实常量池中还保存类及其方法的很多信息,如包名、类名、方法签名等等,有兴趣可以
深入研究。

 类似资料:
  • 本文向大家介绍深入学习 Java 中的 Lambda,包括了深入学习 Java 中的 Lambda的使用技巧和注意事项,需要的朋友参考一下 前言 我花了相当多的阅读和编码时间才最终理解Java Lambdas如何在概念上正常工作的。我阅读的大多数教程和介绍都遵循自顶向下的方法,从用例开始,最后以概念性问题结束。在这篇文章中,我想提供一个自下而上的解释,从其他已建立的Java概念中推导出Lambda

  • 本文向大家介绍深入学习Java中的SPI机制,包括了深入学习Java中的SPI机制的使用技巧和注意事项,需要的朋友参考一下 概述 SPI(Service Provider Interface),是JDK内置的一种服务提供发现机制,可以用来启用框架扩展和替换组件,主要是被框架的开发人员使用,比如java.sql.Driver接口,其他不同厂商可以针对同一接口做出不同的实现,MySQL和Postgre

  • 我正在通过Codingbat上的一系列在线练习进行学习。为了我自己的娱乐。一组练习侧重于递归编程。在其中一个练习中,我编写了以下函数来返回所传递字符串中字符“x”的频率: 根据Codingbat网站,这工作得很好。 下一个练习是计算字符串中子字符串“hi”的频率。我尝试调整我以前的方法,使用而不是: 但是,它始终返回0。看起来像是测试条件 从未见过,但我不知道为什么。希望有人能帮忙! 编辑: 正如

  • 本文向大家介绍java字节码框架ASM的深入学习,包括了java字节码框架ASM的深入学习的使用技巧和注意事项,需要的朋友参考一下 一、什么是ASM ASM是一个java字节码操纵框架,它能被用来动态生成类或者增强既有类的功能。ASM 可以直接产生二进制 class 文件,也可以在类被加载入 Java 虚拟机之前动态改变类行为。Java class 被存储在严格格式定义的 .class文件里,这些

  • 本文向大家介绍Python3字符串学习教程,包括了Python3字符串学习教程的使用技巧和注意事项,需要的朋友参考一下 字符串类型是python里面最常见的类型,是不可变类型,支持单引号、双引号、三引号,三引号是一对连续的单引号或者双引号,允许一个字符串跨多行。 字符串连接:前面提到的+操作符可用于字符串连接,还可以直接把几个字符串连在一起写,另外调用join()方法也可以连接字符串。 只适用于字

  • 本文向大家介绍深入解析C++和JAVA的字符串,包括了深入解析C++和JAVA的字符串的使用技巧和注意事项,需要的朋友参考一下 所有的字符串类都起源于C语言的字符串,而C语言字符串则是字符的数组。C语言中是没有字符串的,只有字符数组。 谈一下C++的字符串:C++提供两种字符串的表示:C风格的字符串和标准C++引入的string类型。一般建议用string类型,但是实际情况中还是要使用老式C风格的