在前一篇介绍ClassFileParser类时简单提了一下_stream属性,这个属性保存的是字节码文件流。如果要读取Class文件的内容,首先需要获取文件对应的字节流,ClassFileStream 内部维护了一个buffer,该buffer指向Class文件所对应的字节流。
ClassFileStream对象是在ClassLoader::load_classfile()函数中创建的,这个方法在之前介绍类的双亲委派机制时提到过,当装载一个类时,可能会调用到SystemDictionary::load_instance_class()函数,而这个函数会体现出“双亲委派”的逻辑。如果使用启动类加载器,那么可能需要调用load_classfile()方法装载类。load_classfile()方法的实现如下:
代码语言:javascript复制源代码位置:src/share/vm/classfile/classLoader.cpp
instanceKlassHandle ClassLoader::load_classfile(Symbol* h_name, TRAPS) {
stringStream st;
st.print_raw(h_name->as_utf8());
st.print_raw(".class");
const char* name = st.as_string(); // 通过st获取对应的文件名
// Lookup stream for parsing .class file
ClassFileStream* stream = NULL;
{
ClassPathEntry* e = _first_entry;
while (e != NULL) {
stream = e->open_stream(name, CHECK_NULL);
if (stream != NULL) {
break;
}
e = e->next();
}
}
...
}
遍历class_path找到要加载的类文件,获取到文件的绝对路径后就创建ClassFileStream对象。ClassPathEntry 是一个链表结构(因为class path有多个),同时在ClassPathEntry中还声明了一个虚函数open_stream()。这样就可以通过循环遍历链表上的结构,直到查找到某个路径下名称为name的文件为止,这时候open_stream()函数会返回ClassFileStream实例。
在load_classfile()方法中获取到ClassFileStream实例后会调用ClassFileParser类中的parseClassFile()方法,如下:
代码语言:javascript复制instanceKlassHandle ClassLoader::load_classfile(Symbol* h_name, TRAPS) {
// ...
instanceKlassHandle h;
if (stream != NULL) {
// class file found, parse it
ClassFileParser parser(stream);
ClassLoaderData* loader_data = ClassLoaderData::the_null_class_loader_data();
Handle protection_domain;
TempNewSymbol parsed_name = NULL;
instanceKlassHandle result = parser.parseClassFile(h_name,loader_data,protection_domain,parsed_name,false,CHECK_(h));
// add to package table
if (add_package(name, classpath_index, THREAD)) {
h = result;
}
}
return h;
}
调用parseClassFile()方法后返回表示Java类的instanceKlass对象,最终方法返回的是操作instanceKlass对象的句柄instanceKlassHandle。下一篇开始将详细介绍parseClassFile()方法的实现。
简单介绍一下ClassFileStream类中的一些被频繁调用的方法,如下:
代码语言:javascript复制u1 ClassFileStream::get_u1(TRAPS) {
return *_current ;
}
u2 ClassFileStream::get_u2(TRAPS) {
u1* tmp = _current;
_current = 2;
return Bytes::get_Java_u2(tmp);
}
u4 ClassFileStream::get_u4(TRAPS) {
u1* tmp = _current;
_current = 4;
return Bytes::get_Java_u4(tmp);
}
u8 ClassFileStream::get_u8(TRAPS) {
u1* tmp = _current;
_current = 8;
return Bytes::get_Java_u8(tmp);
}
void ClassFileStream::skip_u1(int length, TRAPS) {
_current = length;
}
void ClassFileStream::skip_u2(int length, TRAPS) {
_current = length * 2;
}
void ClassFileStream::skip_u4(int length, TRAPS) {
_current = length * 4;
}
Class文件由字节为单位的字节流组成,所有的16位、32位和64位长度的数据将被构造成 2个、4个和8个8字节单位来表示。多字节数据项总是按照Big-Endian的顺序进行存储,而x86等处理器则是使用了相反的Little-Endian顺序来存储数据。 因此,在x86平台上需要进行转换。代码如下:
代码语言:javascript复制源代码位置:openjdk/hotspot/src/cpu/x86/vm/bytes_x86.hpp
// Efficient reading and writing of unaligned unsigned data in Java
// byte ordering (i.e. big-endian ordering). Byte-order reversal is
// needed since x86 CPUs use little-endian format.
static inline u2 get_Java_u2(address p) { return swap_u2(get_native_u2(p)); }
static inline u4 get_Java_u4(address p) { return swap_u4(get_native_u4(p)); }
static inline u8 get_Java_u8(address p) { return swap_u8(get_native_u8(p)); }
调用的相关函数如下:
代码语言:javascript复制源代码位置:openjdk/hotspot/src/cpu/x86/vm/bytes_x86.hpp
// Efficient reading and writing of unaligned unsigned data in platform-specific byte ordering
// (no special code is needed since x86 CPUs can access unaligned data)
static inline u2 get_native_u2(address p) { return *(u2*)p; }
static inline u4 get_native_u4(address p) { return *(u4*)p; }
static inline u8 get_native_u8(address p) { return *(u8*)p; }
调用的swap_u<x>系列的函数实现如下
代码语言:javascript复制源代码位置:openjdk/hotspot/src/os_cpu/linux_x86/vm/bytes_linux_x86.inline.hpp
inline u2 Bytes::swap_u2(u2 x) {
return bswap_16(x);
}
inline u4 Bytes::swap_u4(u4 x) {
return bswap_32(x);
}
inline u8 Bytes::swap_u8(u8 x) {
return bswap_64(x);
}
如上是针对基于Linux内核的ubuntu的x86架构下64位版本代码的实现。其中调用的bswap_<x>系列函数是gcc提供的几个内建函数。 由于HotSpot需要跨平台兼容,所以会增加一些针对各平台的特定实现,如Bytes::swap_u2()函数的完整实现如下:
代码语言:javascript复制inline u2 Bytes::swap_u2(u2 x) {
#ifdef AMD64
return bswap_16(x);
#else
u2 ret;
__asm__ __volatile__ (
"movw %0, %%ax;"
"xchg %%al, %%ah;"
"movw %%ax, %0"
:"=r" (ret) // output : register 0 => ret
:"0" (x) // input : x => register 0
:"ax", "0" // clobbered registers
);
return ret;
#endif // AMD64
}
其中的AMD64表示x86架构下的64位指令集,所以笔者当前的机器会选择AMD64位下的实现。如果是非AMD64位的系统,使用gcc内联汇编来实现相关的功能,其将x 的值读入某个寄存器,然后在指令中使用相应寄存器,并将该值移动到%ax中,然后通过xchg 交换�x中的高低位。然后将最终的结果送入某个寄存器,最后将该结果送到ret中。