Java字符串常量池_字符串常量池溢出

2022-09-19 08:39:15 浏览数 (1)

大家好,又见面了,我是你们的朋友全栈君。

在Java的内存分配中,总共3种常量池:

Java 常量池详解(二)class文件常量池 和 Java 常量池详解(三)class运行时常量池

1.字符串常量池(String Constant Pool)

在JDK1.7之前运行时常量池逻辑包含字符串常量池存放在方法区, 此时hotspot虚拟机对方法区的实现为永久代 在JDK1.7 字符串常量池被从方法区拿到了堆中, 这里没有提到运行时常量池,也就是说字符串常量池被单独拿到堆,运行时常量池剩下的东西还在方法区, 也就是hotspot中的永久代 在JDK1.8 hotspot移除了永久代用元空间(Metaspace)取而代之, 这时候字符串常量池还在堆, 运行时常量池还在方法区, 只不过方法区的实现从永久代变成了元空间(Metaspace)

1.1:字符串常量池在Java内存区域的哪个位置?

  • 在JDK6.0及之前版本,字符串常量池是放在Perm Gen区(也就是方法区)中;
  • 在JDK7.0版本,字符串常量池被移到了堆中了。至于为什么移到堆内,大概是由于方法区的内存空间太小了。
  • (堆内是可以进行回收的,然后方法区也是能回收的,但是本身区域内存比较少,如果用的字符串常量太多了,也会抛java.lang.OutOfMemoryError:PermGenspace 异常)

1.2:字符串常量池是什么?

  • 在HotSpot VM里实现的string pool功能的是一个StringTable类,它是一个Hash表,默认值大小长度是1009;这个StringTable在每个HotSpot VM的实例只有一份,被所有的类共享。字符串常量由一个一个字符组成,放在了StringTable上。
  • 在JDK6.0中,StringTable的长度是固定的,长度就是1009,因此如果放入String Pool中的String非常多,就会造成hash冲突,导致链表过长,当调用String#intern()时会需要到链表上一个一个找,从而导致性能大幅度下降;
  • 在JDK7.0中,StringTable的长度可以通过参数指定:
代码语言:javascript复制
-XX:StringTableSize=66666`

1.3 字符串常量池生成的时机?

代码语言:javascript复制
String a = "a";
  • 全局字符串池里的内容是在类加载完成,经过验证,准备阶段之后在堆中生成字符串对象实例,然后将该字符串对象实例的引用值存到string pool中(记住:string pool中存的是引用值而不是具体的实例对象,具体的实例对象是在堆中开辟的一块空间存放的)

如何将String对象放入到常量池

  • “abc” 双引号String 对象会自动放入常量池
  • 调用String的intern 方法也会将对象放入到常量池中

String 对象代码案例解析

代码语言:javascript复制
public static void main(String[] args) { 
   
    String a = "a";
    String b = "b";
    String c = "a"   "b";
    //生成两个对象 一个"ab" ,一个新的String 对象value 值是ab
    //public String(String original) { 
   
    // this.value = original.value;
    // this.hash = original.hash;
    //}
    String d = new String("ab"); 
    
    String e = a   "b";
    String f = a   b;
    String g = "ab";
    
   System.out.println(e == c);
   System.out.println(c == d);
   System.out.println(f == c);
   System.out.println(g == c);
   
   String e1 = e.intern();
   String c2 = c.intern();
   System.out.println(e1 == c2);
   System.out.println(e1 == c);
}

//运行结果
false
false
false
true
true
true
  1. String c =“a” “b” 和String c = “a” b (String b= “b”)的区别
代码语言:javascript复制
String b = "b";
String c = "a"   "b"; 等价于 String c ="ab"
String c1 = "a"   b; 
 
// java 反编译的结果 
 0 ldc #3 <b> //load constant 加载常量 "b"
 2 astore_1   // 存入变量1中
 3 ldc #4 <ab> //自动识别了 
 5 astore_2
 6 new #7 <java/lang/StringBuilder>
 9 dup
10 invokespecial #8 <java/lang/StringBuilder.<init>>
13 ldc #2 <a>
15 invokevirtual #9 <java/lang/StringBuilder.append>
18 aload_1
19 invokevirtual #9 <java/lang/StringBuilder.append>
22 invokevirtual #10 <java/lang/StringBuilder.toString>
25 astore_3
26 return

(1) “a” “b” 编译器自动识别了变成了 “ab” => 3 ldc #4 (2) “a” b(变量)

  1. 先new 了StringBuilder 对象,并初始化init
  2. 然后bulider.append(“a”)
  3. 从变量1(b)中取出值”b”
  4. 然后执行了bulider.append(“b”)
  5. 最后执行了builder.toString() 方法 给变量3( c1)进行赋值

new string(“abc”)创建了几个对象

答案:是两个 ,new string(xxxx)方法,xxxx传入的是String对象。说明xxxx也是String对象。

代码语言:javascript复制
	 public String(String original) { 
   
        this.value = original.value;
        this.hash = original.hash;
    }

String 是一个final 类型对象是不会变化的,如果发生变化,说明其实是新的对象。

代码语言:javascript复制
public final class String

解析public native String intern() 方法

如果常量池中存在当前字符串, 就会直接返回当前字符串. 如果常量池中没有此字符串, 会将此字符串放入常量池中后, 再返回

native实现代码:

  • openjdk7jdksrcsharenativejavalangString.c
代码语言:javascript复制
Java_java_lang_String_intern(JNIEnv *env, jobject this) 
{ 
    
    return JVM_InternString(env, this); 
}
  • openjdk7hotspotsrcsharevmprimsjvm.h
代码语言:javascript复制
JNIEXPORT jstring JNICALL 
JVM_InternString(JNIEnv *env, jstring str);
  • openjdk7hotspotsrcsharevmprimsjvm.cpp
代码语言:javascript复制
JVM_ENTRY(jstring, JVM_InternString(JNIEnv *env, jstring str)) 
  JVMWrapper("JVM_InternString"); 
  JvmtiVMObjectAllocEventCollector oam; 
  if (str == NULL) return NULL; 
  oop string = JNIHandles::resolve_non_null(str); 
  //调用StringTable::intern 方法
  oop result = StringTable::intern(string, CHECK_NULL);
  return (jstring) JNIHandles::make_local(env, result); 
JVM_END
  • openjdk7hotspotsrcsharevmclassfilesymbolTable.cpp
代码语言:javascript复制
oop StringTable::intern(Handle string_or_null, jchar* name, int len, TRAPS) { 
    
  //根据名字找到对应hash下标
  unsigned int hashValue = java_lang_String::hash_string(name, len); 
  int index = the_table()->hash_to_index(hashValue); 
  //顺着对应的链表查找对应的值
    oop string = the_table()->lookup(index, name, len, hashValue); 
  // Found 
  if (string != NULL) return string; 
  // Otherwise, add to symbol to table 
  return the_table()->basic_add(index, string_or_null, name, len, 
                                hashValue, CHECK_NULL); 
}
  • openjdk7hotspotsrcsharevmclassfilesymbolTable.cpp
代码语言:javascript复制
oop StringTable::lookup(int index, jchar* name, int len, unsigned int hash) { 
    
  for (HashtableEntry<oop>* l = bucket(index); l != NULL; l = l->next()) { 
    
    if (l->hash() == hash) { 
    
      if (java_lang_String::equals(l->literal(), name, len)) { 
    
        return l->literal(); 
      } 
    } 
  } 
  return NULL; 
}
代码语言:javascript复制
1.它的大体实现结构就是:JAVA 使用 jni 调用c  实现的StringTable的intern方法。

2.要注意的是,String的String Pool是一个固定大小的Hashtable,默认值大小长度是1009,如果放进String Pool的String非常多,就会造成Hash冲突严重,从而导致链表会很长,而链表长了后直接会造成的影响就是当调用String.intern时性能会大幅下降。

Interger 包装类的池化技术

代码语言:javascript复制
public final class Integer extends Number implements Comparable<Integer> { 
   
   
    @Native public static final int   MIN_VALUE = 0x80000000;

  
    @Native public static final int   MAX_VALUE = 0x7fffffff;

    //缓存-128到127的值在IntegerCache里面,可以进行共享
    private static class IntegerCache { 
   
        static final int low = -128;
        static final int high;
        static final Integer cache[];
    
        static { 
   
            // high value may be configured by property
            int h = 127;
            String integerCacheHighPropValue =
                sun.misc.VM.getSavedProperty("java.lang.Integer.IntegerCache.high");
            if (integerCacheHighPropValue != null) { 
   
                try { 
   
                    int i = parseInt(integerCacheHighPropValue);
                    i = Math.max(i, 127);
                    // Maximum array size is Integer.MAX_VALUE
                    h = Math.min(i, Integer.MAX_VALUE - (-low) -1);
                } catch( NumberFormatException nfe) { 
   
                    // If the property cannot be parsed into an int, ignore it.
                }
            }
            high = h;
    
            cache = new Integer[(high - low)   1];
            int j = low;
            for(int k = 0; k < cache.length; k  )
                cache[k] = new Integer(j  );
    
            // range [-128, 127] must be interned (JLS7 5.1.7)
            assert IntegerCache.high >= 127;
        }
    
        private IntegerCache() { 
   }
    }
    
    public static Integer valueOf(int i) { 
   
        //是不是在-128到127里面,不是的话就生成新的Integer
        if (i >= IntegerCache.low && i <= IntegerCache.high)
            return IntegerCache.cache[i   (-IntegerCache.low)];
        return new Integer(i);
    }
}        

Integer 对象代码案例解析

代码语言:javascript复制
public void test(){ 
   
    Integer i1 = 10;
    Integer i2 = 10;
    Integer i3 = new Integer(10);//新对象
    Integer i4 = new Integer(10);//新对象
    Integer i5 = Integer.valueOf(10);//从缓存池里面获取。
    Integer i6 = Integer.valueOf(128);
    Integer i7 = 128;

    System.out.println(i1 == i2); // true
    System.out.println(i2 == i3); // false
    System.out.println(i3 == i4); // false
    System.out.println(i1 == i5); // true
    System.out.println(i6 == i7); // false
}

//运行结果:
true
false
false
true
false

为啥Integer i1 =10 跟Integer.valueOf(10) 是相等的?

  • 因为Integer i1 = 10 底层原理是 Integer i1 = Integer.valueof(10)
代码语言:javascript复制
  //Integer i1 =10 反编译的结果
  0 bipush 10
  2 invokestatic #14 <java/lang/Integer.valueOf> //调用了Integer.valueof方法
  5 astore_1

为啥Integer i1 =128 跟Integer.valueOf(128) 是不相等的?

  • 因为超过-128~127 这个范围,就不在缓存池里面,不能共享都是新new 出来的
代码语言:javascript复制
public static Integer valueOf(int i) { 
   
        //是不是在-128到127里面,不是的话就生成新的Integer
        if (i >= IntegerCache.low && i <= IntegerCache.high)
            return IntegerCache.cache[i   (-IntegerCache.low)];
        return new Integer(i);
    }

问题:包装类对象池是不是 JVM 常量池的一种?

  • 包装类的对象池是池化技术的应用,并非是虚拟机层面的东西,而是 Java 在类封装里实现的,IntegerCache 是 Integer在内部维护的一个静态内部类,用于对象缓存。
  • Integer 对象池在底层实际上就是一个变量名为 cache 的数组,里面包含了 -128 ~ 127 的 Integer 对象实例。使用对象池的方法就是通过 Integer.valueOf() 返回 cache 中的对象,像 Integer i = 10这种自动装箱实际上也是调用 Integer.valueOf() 完成的
  • 这和常量池中字面量的保存有很大区别,Integer 不需要显示地出现在代码中才添加到池中,初始化时它已经包含了所有需要缓存的对象

发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/164783.html原文链接:https://javaforall.cn

0 人点赞