美文网首页Java学习笔记@IT·互联网我爱编程
从Java到C++,以JVM的角度看Java线程的创建与运行

从Java到C++,以JVM的角度看Java线程的创建与运行

作者: Van96 | 来源:发表于2017-06-13 19:29 被阅读642次

    写在前面

    写作时间:2017.5
    本文JDK版本:JDK 1.8
    本文简述:从Java的新建一个线程开始,溯源到Thread类的源码,然后再从Thread类的源码跳到虚拟机层的C+ +源码。虚拟机层是平台相关的,但我没有对每个平台的实现机制都探索一遍,于是只选取Linux部分的实现源码进行探究。而C++的代码在逻辑上又分为几层,逐层深挖,一直到C++新建的线程调用Java线程的run()方法结束。(本文每处都贴有源码地址,可作参考)
    本文持续更新地址:http://www.jianshu.com/p/3ce1b5e5a55e

    附:
    本文相当长,可以先看结尾的总结再回头看正文,如果你只想理解个大概,也可以只看java部分以及结尾总结。
    可能我的文笔以及实力都有所欠缺,想要完全理解的话可能需要多看几遍以及花点时间,请诸君包涵。(但做学问需要的不正是沉得住气,耐得住寂寞吗)
    然而,代码细节实在是太多了,硬吃实在不是个办法,所以我的建议是,最开始可以先不看代码,只看每个小节后面的总结和代码中的中文注释,甚至是先看流程终结,再看小节的总结,最后有兴趣才开始研究源码。
    切忌“只见树木,不见森林”

    线程的创建

    故事的开始,是这样的一段的代码:

    Thread thread = new Thread(new Runnable() {
        @Override
        public void run() {             
            System.out.println(Thread.currentThread().getName());
        }
    });
            
    thread.start();
    

    然后我们的目标就是,在C++源码中找到这个run()方法是在哪里执行的。
    首先进入的是它的构造方法:

        public Thread(Runnable target) {
            init(null, target, "Thread-" + nextThreadNum(), 0);
        }
    

    经过一系列的调用,最终跳到这个方法,(这里的代码有点长,就不给出完整代码,完整的源码在这里:源码传送门

    /**
         * Initializes a Thread.
         *
         * @param g 线程组
         * @param target 携带run方法的Runnable对象
         * @param name 线程名
         * @param stackSize  新线程的需要的stack size,若此值为0则表明此属性忽略
         * @param acc 将要被继承的AccessControlContext,若此值为null,则此属性默认设置为
         *            AccessController.getContext()
         * @param inheritThreadLocals 若此值为true,从构造此线程的线程中继承thread-locals的初始值
         */
        private void init(ThreadGroup g, Runnable target, String name,
                          long stackSize, AccessControlContext acc,
                          boolean inheritThreadLocals) {
            if (name == null) {
                throw new NullPointerException("name cannot be null");
            }
    
            this.name = name;
    
            Thread parent = currentThread();
            SecurityManager security = System.getSecurityManager();
            if (g == null) {
                /* Determine if it's an applet or not */
    
                /* If there is a security manager, ask the security manager
                   what to do. */
                if (security != null) {
                    g = security.getThreadGroup();
                }
    
                /* If the security doesn't have a strong opinion of the matter
                   use the parent thread group. */
                if (g == null) {
                    g = parent.getThreadGroup();
                }
            }
    
    
            g.addUnstarted();
    
            this.group = g;
            this.daemon = parent.isDaemon();
            this.priority = parent.getPriority();
           
            this.target = target;
            setPriority(priority);
            
            this.stackSize = stackSize;
    
            /* Set thread ID */
            tid = nextThreadID();                  
        }
    

    稍微尝试着总结一下:

    1. 设置线程名(即设置name属性),一般情况下,这个name的格式是“Thread-X”,X是一个数字,代表用这个线程类初始化的第X个实例
    2. 设置线程的ThreadGroup,这个ThreadGroup要么从应用的SecurityManager处拿到,要么就直接继承父线程的ThreadGroup。(设置完成以后还会有一个验证)
    3. 在真正设置此线程的ThreadGroup之前,需要为这个ThreadGroup的“还未开始的线程数目”(nUnstartedThreads)加一
    4. 设置此线程是否为守护线程(即设置daemon属性),若父线程为守护线程,那么此线程也是守护线程
    5. 设置此线程的优先级(即priority属性)为父线程的优先级(顺便补充一句,子线程的优先级是不能大于父线程的)
    6. 设置此线程的上下文类加载器
    7. 设置这个Thread的target,这个target就是携带了我们写好的run()方法的Runnable对象
    8. 设置stackSize
    9. 设置线程ID(tid属性)

    关于run方法的一个补充

    或许有人会说,我创建线程的时候,是使用传递一个Runnable对象来进行创建对象,并没有重写原来的run方法,那么到了这里,还调用run方法的话,不就出问题了。
    其实,这个问题我们看一下Thread.java的run()方法就好了:

    @Override
    public void run(){
        if(target != null){
            target.run();
        }
    }
    

    target是什么,target就是我们在初始化Thread时传递进去的Runnable对象,那么这几行代码可以解释我们的几个疑问:

    1. 如果我们是通过传递Runnable对象来初始化Thread实例的话,那么就是将实例的run方法“替换”为Runnable对象的run()方法(逻辑上的替换)
    2. 如果我们的Thread继承类重写了run()方法,也就是说原本的“替换”逻辑被覆盖了,这时我们再通过传递Runnable对象来初始化Thread实例的话,这个实例的run不会再被替换,也就是这个实例仅会执行我们重写的run方法。

    线程的开始

    我们都知道,开始一个线程就是调用这个线程的start方法:

        /**
         * 调用此方法将会使得thread开始运行,JVM会在这个线程中调用run方法。
         * <p>
         * 调用结果是,两个线程同时运行:调用此线程的线程,以及此线程
         * <p>
         * 无论在什么情况下,要求同一条线程开始两次都是不合法,即便是此线程已经结束在要求开始也是不合法的。
         *
         * @exception  IllegalThreadStateException  若此线程曾经开始(start)过
         * @see        #run()
         * @see        #stop()
         */
        public synchronized void start() {
            /**
             * 
             * 对于main方法线程(即运行main方法的线程),或者是由虚拟机创建的“system”组的
             * 线程,都不需要调用此方法来启动。
             * 任何在这个方法中添加的新功能,以后都有可能添加到虚拟机上。
             * 翻译的不是很满意,原文留在这里:
             * This method is not invoked for the main method thread or "system"
             * group threads created/set up by the VM. Any new functionality added
             * to this method in the future may have to also be added to the VM.
             * 
             * 若线程的threadStatus为0,则表明这个状态是NEW状态
             */
            if (threadStatus != 0)
                throw new IllegalThreadStateException();
    
            /* 
             * 通知线程组:此线程已经就绪,可以开始运行了
             * 所以,这条线程可以添加到线程组的线程list中,以及线程组
             * 未开始线程的数目(he group's unstarted count)可以减一了。
             * 
             * */
            group.add(this);
    
            boolean started = false;
            try {
                start0();
                started = true;
            } finally {
                try {
                    if (!started) {
                        group.threadStartFailed(this);
                    }
                } catch (Throwable ignore) {
                    /* do nothing. If start0 threw a Throwable then
                      it will be passed up the call stack */
                }
            }
        }
    

    挺简短的一段代码,我们可以总结出以下步骤:

    第一步,非常重要,就是先检查线程的状态,如果线程的状态不是NEW状态的话,那么就会抛出一个异常(关于Java线程的状态,可以看这篇文章:Java 线程的几种状态
    第二步,将这个Thread添加到之前引用的ThreadGroup中
    第三步,调用native start0()

    关于Thread类中的native方法

    在Thread.java里面,有一个registerNatives()的native方法,并且在Threa.java的第一个static块中就调用了这个方法,保证这个方法在类加载中是第一个被调用的方法。这个native方法的作用是为其他native方法注册到JVM中(可见:JVM查找java native方法的规则)。
    通过这个方法,我们可以找到Thrad.java中native方法在JVM中对应方法:
    Thread.c$Java_java_lang_Thread_registerNatives

    static JNINativeMethod methods[] = {
        {"start0",           "()V",        (void *)&JVM_StartThread},
        {"stop0",            "(" OBJ ")V", (void *)&JVM_StopThread},
        {"isAlive",          "()Z",        (void *)&JVM_IsThreadAlive},
        {"suspend0",         "()V",        (void *)&JVM_SuspendThread},
        {"resume0",          "()V",        (void *)&JVM_ResumeThread},
        {"setPriority0",     "(I)V",       (void *)&JVM_SetThreadPriority},
        {"yield",            "()V",        (void *)&JVM_Yield},
        {"sleep",            "(J)V",       (void *)&JVM_Sleep},
        {"currentThread",    "()" THD,     (void *)&JVM_CurrentThread},
        {"countStackFrames", "()I",        (void *)&JVM_CountStackFrames},
        {"interrupt0",       "()V",        (void *)&JVM_Interrupt},
        {"isInterrupted",    "(Z)Z",       (void *)&JVM_IsInterrupted},
        {"holdsLock",        "(" OBJ ")Z", (void *)&JVM_HoldsLock},
        {"getThreads",        "()[" THD,   (void *)&JVM_GetAllThreads},
        {"dumpThreads",      "([" THD ")[[" STE, (void *)&JVM_DumpThreads},
    };
    JNIEXPORT void JNICALL
    Java_java_lang_Thread_registerNatives(JNIEnv *env, jclass cls)
    {
        (*env)->RegisterNatives(env, cls, methods, ARRAY_LENGTH(methods));
    }
    

    0、在进入C之前的准备

    我们将会需要使用到这几个概念:

    java.lang.Thread: 这个是Java语言里的线程类,由这个Java类创建的instance都会 1:1 映射到一个操作系统的osthread;
    JavaThread: JVM中C++定义的类,一个JavaThread的instance代表了在JVM中的java.lang.Thread的instance, 它维护了线程的状态,并且维护一个指针指向java.lang.Thread创建的对象(oop)。它同时还维护了一个指针指向对应的OSThread,来获取底层操作系统创建的osthread的状态
    OSThread: JVM中C++定义的类,代表了JVM中对底层操作系统的osthread的抽象,它维护着实际操作系统创建的线程句柄handle,可以获取底层osthread的状态
    VMThread: JVM中C++定义的类,这个类和用户创建的线程无关,是JVM本身用来进行虚拟机操作的线程,比如GC

    (引自:聊聊JVM(五)从JVM角度理解线程

    补充:需要注意的是osthread和OSThread的区别,简单的说,osthread是操作系统级别的线程,也就是真正意义上的线程,它的具体实现由操作系统完成;
    而OSThread则是关于osthread的抽象,通过操作系统暴露出来的接口(句柄)对osthread进行操作,在实际的运行中,OSThread会根据所运行的操作系统(平台)来创建,也就是说,如果字节码运行的平台是Linux的话,那么创建出来的OSThread就是Linux的OSThread;如果是Windows的话,那么创建出来的就是Windows的OSThread

    0.5、流程概述

    为了避免“只见树木,不见森林”,特意将流程总结提前到开始
    撇开源码,整个过程大概是:

    1. 在Java中,使用java.lang.Thread的构造方法来构建一个java.lang.Thread对象,此时只是对这个对象的部分字段(例如线程名,优先级等)进行初始化;
    2. 调用java.lang.Thread对象的start()方法,开始此线程。此时,在start()方法内部,调用start0() 本地方法来开始此线程;
    3. start0()在VM中对应的是JVM_StartThread,也就是,在VM中,实际运行的是JVM_StartThread方法(宏),在这个方法中,创建了一个JavaThread对象;
    4. 在JavaThread对象的创建过程中,会根据运行平台创建一个对应的OSThread对象,且JavaThread保持这个OSThread对象的引用;
    5. 在OSThread对象的创建过程中,创建一个平台相关的底层级线程,如果这个底层级线程失败,那么就抛出异常;
    6. 在正常情况下,这个底层级的线程开始运行,并执行java.lang.Thread对象的run方法;
    7. 当java.lang.Thread生成的Object的run()方法执行完毕返回后,或者抛出异常终止后,终止native thread;
    8. 最后就是释放相关的资源(包括内存、锁等)

    在上述过程,穿插着各种的判断检测,其中很大一部分都是关于各种层次下的线程的状态的检测,在JVM中,无论哪种层次的线程,都只允许执行一次。

    1、从Java进入C:JVM_StartThread

    首先JVM会进入jvm.cpp的jvm.cpp$JVM_StartThread 方法(确切地说,这个JVM_StartThread是一个宏):
    关于native的函数参数

    第一个参数:JNIEnv* 是定义任意native函数的第一个参数(包括调用JNI的RegisterNatives函数注册的函数),指向JVM函数表的指针,函数表中的每一个入口指向一个JNI函数,每个函数用于访问JVM中特定的数据结构。
    第二个参数:调用java中native方法的实例或Class对象,如果这个native方法是实例方法,则该参数是jobject,如果是静态方法,则是jclass

    接下来我们来看下这个JVM_StartThread方法:

    JVM_ENTRY(void, JVM_StartThread(JNIEnv* env, jobject jthread))
      JVMWrapper("JVM_StartThread");
      JavaThread *native_thread = NULL;
      bool throw_illegal_thread_state = false;
    
      // We must release the Threads_lock before we can post a jvmti event
      // in Thread::start.
      {
    
        //在我们操作的时候,确保C++线程和OSThread不会被提前释放
        //(译者附:)从上面的一个左花括号开始,一直到下一个匹配的右花括号为止,都上了关于Threads_lock的互斥锁
        //可以理解为Java的sync块
        MutexLocker mu(Threads_lock);
        
    
        // 安全原因,先进行一次检测,个人猜测是,判断这个线程是否已被启动过,若是已启动过,抛线程状态异常
        if (java_lang_Thread::thread(JNIHandles::resolve_non_null(jthread)) != NULL) {
          throw_illegal_thread_state = true;
        } else {
          // We could also check the stillborn flag to see if this thread was already stopped, but
          // for historical reasons we let the thread detect that itself when it starts running
    
          jlong size =
                 java_lang_Thread::stackSize(JNIHandles::resolve_non_null(jthread));
                 
          // 为C++ thread结构体分配内存,以及创建一个本地线程。这个从Java取过来的stack size是有一个符号数,
          // 但构造器需要的size_t是一个无符号数,所以在转换的时候需要避免因为size是负数出现的问题。
          size_t sz = size > 0 ? (size_t) size : 0;
          native_thread = new JavaThread(&thread_entry, sz);
          // 创建一个JavaThrea对象(创建过程见第二节),其中第二个参数thread_entry是一个方法指针,详见本节下方补充
          // ***************** 注意这个thread_entry  ************************
          // ***************** 注意这个thread_entry  ************************
          // ***************** 注意这个thread_entry  ************************
    
          // 仍做一次安全检测,因为osthread不一定能创建成功(详见下文第三节的osthread创建)
          if (native_thread->osthread() != NULL) {
            // 注意:当前线程在下面的“prepare”没有被使用到。
            native_thread->prepare(jthread);
          }
        }
      }
    
      if (throw_illegal_thread_state) {
        THROW(vmSymbols::java_lang_IllegalThreadStateException());
      }
    
      assert(native_thread != NULL, "Starting null thread?");
    
        //事实上,如果native_thread的osthread为NULL,就可以宣告整个线程创建过程失败
        //这时应该整理内存,并通知java层线程创建失败
      if (native_thread->osthread() == NULL) {
        // No one should hold a reference to the 'native_thread'.
        delete native_thread;
        if (JvmtiExport::should_post_resource_exhausted()) {
          JvmtiExport::post_resource_exhausted(
            JVMTI_RESOURCE_EXHAUSTED_OOM_ERROR | JVMTI_RESOURCE_EXHAUSTED_THREADS,
            "unable to create new native thread");
        }
        THROW_MSG(vmSymbols::java_lang_OutOfMemoryError(),
                  "unable to create new native thread");
      }
    
      Thread::start(native_thread);
    
    JVM_END
    

    关于thread_entry方法的补充:注意,这个方法非常重要,后面还会出现,所以我们留到后面再解释【第6节】。


    然后我们来看一下JVM在这个宏里面做了什么:

    1. 申请一个锁
    2. 创建一个JavaThread对象【见第二节】
    3. 如果有异常情况,抛出异常
    4. 对第二步的JavaThread类,做一个准备操作:thread.cpp$JavaThread::prepare
    5. 调用Thread::start方法,让一条线程开始运行

    2、JavaThread对象的创建

    本节是接上面小节中间,关于JavaThread对象创建的讲述的。
    JavaThread是Java层的线程与平台层线程中间的一个过渡:
    一个java.lang.Thread对象,在其start方法中,会创建一个JavaThread对象,由于java.lang.Thread对象的start方法只允许调用一次,所以java.lang.Thread对象与JavaThread对象是一一对应的
    而在JavaThread对象的创建过程,会创建一个OSThread对象,并且JavaThread对象会持有一个指向该OSThread对象的指针(至于什么是OSThread,大概是平台相关的系统层线程,更详细见第三节)
    thread.cpp$JavaThread::JavaThread :

    JavaThread::JavaThread(ThreadFunction entry_point, size_t stack_sz) :
      Thread()
    #if INCLUDE_ALL_GCS
      , _satb_mark_queue(&_satb_mark_queue_set),
      _dirty_card_queue(&_dirty_card_queue_set)
    #endif // INCLUDE_ALL_GCS
    {
      if (TraceThreadEvents) {
        tty->print_cr("creating thread %p", this);
      }
      initialize();
      _jni_attach_state = _not_attaching_via_jni;
      set_entry_point(entry_point);
      // Create the native thread itself.
      // %note runtime_23
      os::ThreadType thr_type = os::java_thread;
      thr_type = entry_point == &compiler_thread_entry ? os::compiler_thread :
                                                         os::java_thread;
      os::create_thread(this, thr_type, stack_sz);
      // 在这里,由于内存不足的原因,_osthread有可能为NULL、
      // 而我们应当抛出OutOfMenoryError,然而现在我们还不能抛出Error
      // 因为此方法的调用者有可能扔持有着所有的锁,而我们必须释放所有的锁才能抛出后异常
      // (抛出异常的工作包括:创建并初始化一个exception对象,而初始化exception对象则必须要通过JavaCall离开VM,
      // 然后所有的锁都必须要被释放)
      //
      // 此时这条线程扔处在挂起的状态,而线程必须由创建者显式地启动!
      // 此外,线程还必须显式地通过Threads:add方法被添加到Threads list 中。
      // 上面的工作(显式启动,显式添加)之所以到达这里还没完成,是因为线程还没有被完成地初始化(可参见JVM_Start)
    }
    

    完成的操作有:

    1. 调用initialize方法对JavaThread进行初始化,此方法仅是对结构体的属性做赋值;
    2. 为这个JavaThread设置一个入口方法set_entry_point
    3. 根据平台调用os::create_thread()方法来创建一个OSThread对象【见第三节】

    3、根据平台创建OSThread

    在这一步中,OSThread的创建是根据平台来选择,这里我是使用Linux部分的代码来进行研究的
    OSThread是一个平台相关线程,OSThread由JavaThread对象创建并进行管理。
    在OSThread创建的过程中,会通过pthread方法来创建一个真正意义上的底层级线程,

    os_linux.cpp$os::create_thread
    这个方法传入三个参数:
    第一个是我们之前在JavaThread构造方法中创建的JavaThread对象;
    第二个是一个ThreadType对象,只有两种可能,一种是os::compiler_thread,另一种是os::java_thread
    第三个是,线程栈的大小

    bool os::create_thread(Thread* thread, ThreadType thr_type, size_t stack_size) {
      assert(thread->osthread() == NULL, "caller responsible");
    
      // 为OSThread对象分配内存
      OSThread* osthread = new OSThread(NULL, NULL);
      //(注:)关于这个构造方法,并没有做出特殊的操作,仅是初始化一些属性,详见下方补充
      
      if (osthread == NULL) {
        return false;
      }
    
      // 设置正确的状态
      osthread->set_thread_type(thr_type);
    
      // 初始状态应该是ALLOCATED 而不是INITIALIZED
      osthread->set_state(ALLOCATED);
    
        //使得JavaThread的osthread指针指向新建的osthread
      thread->set_osthread(osthread);
    
      // 初始化线程
      pthread_attr_t attr;
      pthread_attr_init(&attr);
      pthread_attr_setdetachstate(&attr, PTHREAD_CREATE_DETACHED);
    
      // stack size
      if (os::Linux::supports_variable_stack_size()) {
        // 如果调用者没有指定stack size,那么就需要对这个stack size进行计算
        if (stack_size == 0) {
          stack_size = os::Linux::default_stack_size(thr_type);
    
          switch (thr_type) {
          case os::java_thread:
            // Java threads use ThreadStackSize which default value can be
            // changed with the flag -Xss
            assert (JavaThread::stack_size_at_create() > 0, "this should be set");
            stack_size = JavaThread::stack_size_at_create();
            break;
          case os::compiler_thread:
            if (CompilerThreadStackSize > 0) {
              stack_size = (size_t)(CompilerThreadStackSize * K);
              break;
            } // else fall through:
              // use VMThreadStackSize if CompilerThreadStackSize is not defined
          case os::vm_thread:
          case os::pgc_thread:
          case os::cgc_thread:
          case os::watcher_thread:
            if (VMThreadStackSize > 0) stack_size = (size_t)(VMThreadStackSize * K);
            break;
          }
        }
    
        stack_size = MAX2(stack_size, os::Linux::min_stack_allowed);
        pthread_attr_setstacksize(&attr, stack_size);
      } else {
        // let pthread_create() pick the default value.
      }
    
      // glibc guard page
      pthread_attr_setguardsize(&attr, os::Linux::default_guard_size(thr_type));
    
      ThreadState state;
    
      {
        // Serialize thread creation if we are running with fixed stack LinuxThreads
        // (好吧,我也不是很懂这句注释的意思,
        // 尝试着直译一下:如果我们正在运行的是固定stack的LinuxThreads,那么就序列化线程的创建过程)
        bool lock = os::Linux::is_LinuxThreads() && !os::Linux::is_floating_stack();
        if (lock) {
          os::Linux::createThread_lock()->lock_without_safepoint_check();
        }
    
        pthread_t tid;
        int ret = pthread_create(&tid, &attr, (void* (*)(void*)) java_start, thread);
        
        //(注:)这个方法是c在Linux下创建并执行一个平台层的线程的方法
        // 新建好的线程,应该执行的是java_start方法(即第二个参数)
        //如果返回值是0,表示线程创建成功,否则表示线程创建失败,关于这个方法的详细介绍,见下方补充
        
        pthread_attr_destroy(&attr);
    
    
        // 下面是平台级线程创建失败的一些处理
        // 如果osthread创建失败,就把JAVAThread的osthread设置为NULL
        if (ret != 0) {
          if (PrintMiscellaneous && (Verbose || WizardMode)) {
            perror("pthread_create()");
          }
          // Need to clean up stuff we've allocated so far
          thread->set_osthread(NULL);
          delete osthread;
          if (lock) os::Linux::createThread_lock()->unlock();
          return false;
        }
    
        // Store pthread info into the OSThread
        // 这个tid是刚才新建的底层级线程的一个标识符,我们需要通过这个标识符来管理底层级线程
        osthread->set_pthread_id(tid);
    
        // 在这里停顿!直到子线程的初始化完成,或者子线程被放弃(考虑到线程中还有线程的情况)
        {
          Monitor* sync_with_child = osthread->startThread_lock();
          MutexLockerEx ml(sync_with_child, Mutex::_no_safepoint_check_flag);
          while ((state = osthread->get_state()) == ALLOCATED) {
            sync_with_child->wait(Mutex::_no_safepoint_check_flag);
          }
        }
    
        if (lock) {
          os::Linux::createThread_lock()->unlock();
        }
      }
    
      // Aborted due to thread limit being reached
      if (state == ZOMBIE) {
          thread->set_osthread(NULL);
          delete osthread;
          return false;
      }
      
      
    
      // The thread is returned suspended (in state INITIALIZED),
      // and is started higher up in the call chain
      assert(state == INITIALIZED, "race condition");
      return true;
    }
    

    补充OSThread::OSThread:

    OSThread::OSThread(OSThreadStartFunc start_proc, void* start_parm) {
      pd_initialize();
        //这个方法更是没有什么好讲的,只是将值初始化为初始值(及0或NULL)
        //要是要看的话,这个方法在os/linux/vm/osThread_linux.cpp
      set_start_proc(start_proc);
      set_start_parm(start_parm);
      set_interrupted(false);
    }
    

    补充创建系统级线程的pthread_create()方法

    这个方法很长,做了以下的几件事:
    1、 创建一个osthread对象,并初始化这个对象,这个初始化包括:设置thread_type,设置线程状态
    2、让我们传进来的JavaThread对象保存这个osthread对象的引用
    3、中间还有一些设置线程栈数量,获取锁之类的操作
    4、864行,int ret = pthread_create(&tid, &attr, (void* ()(void)) java_start, thread);这个方法是C++创建线程的库方法,通过调用这个方法,会创建一个C++ 线程并使线程进入就绪状态,即可以开始运行
    5、这个线程将执行java_start这个方法【见第四节】
    6、开始收尾,清理一下内存

    4、java_start方法

    这个方法是OSThread创建的底层级线程中将要执行的方法,它的描述是:为所有新建的线程启动例程

    os_linux.cpp$java_start

    // 线程为所有新创建的线程启动例程。
    static void *java_start(Thread *thread) {
      // Try to randomize the cache line index of hot stack frames.
      // This helps when threads of the same stack traces evict each other's
      // cache lines. The threads can be either from the same JVM instance, or
      // from different JVM instances. The benefit is especially true for
      // processors with hyperthreading technology.
      static int counter = 0;
      int pid = os::current_process_id();
      alloca(((pid ^ counter++) & 7) * 128);
    
      ThreadLocalStorage::set_thread(thread);
    
      OSThread* osthread = thread->osthread();
      Monitor* sync = osthread->startThread_lock();
    
      // non floating stack LinuxThreads needs extra check, see above
      if (!_thread_safety_check(thread)) {
        // notify parent thread
        MutexLockerEx ml(sync, Mutex::_no_safepoint_check_flag);
        osthread->set_state(ZOMBIE);
        sync->notify_all();
        return NULL;
      }
    
      // thread_id is kernel thread id (similar to Solaris LWP id)
      osthread->set_thread_id(os::Linux::gettid());
    
      if (UseNUMA) {
        int lgrp_id = os::numa_get_group_id();
        if (lgrp_id != -1) {
          thread->set_lgrp_id(lgrp_id);
        }
      }
      // initialize signal mask for this thread
      os::Linux::hotspot_sigmask(thread);
    
      // initialize floating point control register
      os::Linux::init_thread_fpu_state();
    
      // 与父进程进行新号交互(handshaking)
      {
        MutexLockerEx ml(sync, Mutex::_no_safepoint_check_flag);
    
        // 通知父线程
        osthread->set_state(INITIALIZED);
        sync->notify_all();
    
        // wait until os::start_thread()
        while (osthread->get_state() == INITIALIZED) {
          sync->wait(Mutex::_no_safepoint_check_flag);
        }
      }
    
      // 调用一个更高级别的开始例程(见第五节)
      thread->run();
    
      return 0;
    }
    

    这个方法做的事:
    1、拿到这个线程的线程id
    2、分配内存?
    3、设置ThreadLocal
    4、线程安全检测
    5、中间还有一些东西,不想关心
    6、同样地,再次设置这个thread的osthrad的状态
    7、调用Thread的run方法,但是这个run方法是个虚方法,实际上调用的是JavaThread的run方法【见第五节】

    5、JavaThread::run()

    JavThread::run():

    // Java Thread第一个调用的例程
    void JavaThread::run() {
        //初始化相关字段
      // initialize thread-local alloc buffer related fields
      this->initialize_tlab();
    
      // used to test validitity of stack trace backs
      this->record_base_of_stack_pointer();
    
      // Record real stack base and size.
      this->record_stack_base_and_size();
    
      // Initialize thread local storage; set before calling MutexLocker
      this->initialize_thread_local_storage();
    
      this->create_stack_guard_pages();
    
      this->cache_global_variables();
    
        //线程基本初始化完成,在虚拟机中可以当作是safepoint代码来处理了
        //于是将线程的状态从 _thread_new切换到_thread_in_vm
      // Thread is now sufficient initialized to be handled by the safepoint code as being
      // in the VM. Change thread state from _thread_new to _thread_in_vm
      ThreadStateTransition::transition_and_fence(this, _thread_new, _thread_in_vm);
    
      assert(JavaThread::current() == this, "sanity check");
      assert(!Thread::current()->owns_locks(), "sanity check");
    
      DTRACE_THREAD_PROBE(start, this);
    
      // This operation might block. We call that after all safepoint checks for a new thread has
      // been completed.
      //这个操作有可能会被阻塞,我们需要要在所有safepoint检查完这个新线程以后才能调用此方法
      this->set_active_handles(JNIHandleBlock::allocate_block());
    
      if (JvmtiExport::should_post_thread_life()) {
        JvmtiExport::post_thread_start(this);
      }
    
      EventThreadStart event;
      if (event.should_commit()) {
         event.set_javalangthread(java_lang_Thread::thread_id(this->threadObj()));
         event.commit();
      }
    
      // We call another function to do the rest so we are sure that the stack addresses used
      // from there will be lower than the stack base just computed
      thread_main_inner();
    
      // 注意,一旦运行到这里,线程就不再合法(valid)了
    }
    
    

    这个方法完成的事有:
    1、初始化相关字段
    2、将线程的状态从 _thread_new切换到_thread_in_vm
    3、调用thread_main_inner()方法【见第六节】
    (这里说的safepoint应该就是GC中要用到的safepoint吧,但是all safepoint checks for a new thread是什么意思,safepoint还能检查线程..?暂且搁置)

    6、JavaThread::thread_main_inner()

    void JavaThread::thread_main_inner() {
      assert(JavaThread::current() == this, "sanity check");
      assert(this->threadObj() != NULL, "just checking");
    
      // Execute thread entry point unless this thread has a pending exception
      // or has been stopped before starting.
      // Note: Due to JVM_StopThread we can have pending exceptions already!
      if (!this->has_pending_exception() &&
          !java_lang_Thread::is_stillborn(this->threadObj())) {
        {
          ResourceMark rm(this);
          this->set_native_thread_name(this->get_thread_name());
        }
        HandleMark hm(this);
        this->entry_point()(this, this);
      }
    
      DTRACE_THREAD_PROBE(stop, this);
    
      this->exit(false);
      delete this;
    }
    

    然后又回到了之前的我们设置的entry_point():(可回看第一节)
    thread_entry方法的补充:

    static void thread_entry(JavaThread* thread, TRAPS) {
      HandleMark hm(THREAD);
      Handle obj(THREAD, thread->threadObj());
      JavaValue result(T_VOID);
      JavaCalls::call_virtual(&result,
                              obj,
                              KlassHandle(THREAD, SystemDictionary::Thread_klass()),
                              vmSymbols::run_method_name(),`
                              THREAD);
    }
    

    注意这个vmSymbols::run_method_name(),非常关键!

    这个方法是在vmSymbolHandles中用宏来定义的,而这个vmSymbolHandles的描述是:

    // The class vmSymbols is a name space for fast lookup of
    // symbols commonly used in the VM.
    //
    // Sample usage:
    //
    //   Symbol* obj       = vmSymbols::java_lang_Object();
    

    大意翻译为:vmSymbols是一个VM中使用的,用于常用符号的快速查找的命名空间

    于是,我们在这个命名空间找到了这样的一行代码:

     template(run_method_name,                           "run")
    

    也就是说,这里调用的是java.lang.Thread对象的run()方法!

    总结

    撇开源码,整个过程大概是:

    1. 在Java中,使用java.lang.Thread的构造方法来构建一个java.lang.Thread对象,此时只是对这个对象的部分字段(例如线程名,优先级等)进行初始化;
    2. 调用java.lang.Thread对象的start()方法,开始此线程。此时,在start()方法内部,调用start0() 本地方法来开始此线程;
    3. start0()在VM中对应的是JVM_StartThread,也就是,在VM中,实际运行的是JVM_StartThread方法(宏),在这个方法中,创建了一个JavaThread对象;
    4. 在JavaThread对象的创建过程中,会根据运行平台创建一个对应的OSThread对象,且JavaThread保持这个OSThread对象的引用;
    5. 在OSThread对象的创建过程中,创建一个平台相关的底层级线程,如果这个底层级线程失败,那么就抛出异常;
    6. 在正常情况下,这个底层级的线程开始运行,并执行java.lang.Thread对象的run方法;
    7. 当java.lang.Thread生成的Object的run()方法执行完毕返回后,或者抛出异常终止后,终止native thread;
    8. 最后就是释放相关的资源(包括内存、锁等)

    在上述过程,穿插着各种的判断检测,其中很大一部分都是关于各种层次下的线程的状态的检测,在JVM中,无论哪种层次的线程,都只允许执行一次。

    最后

    本文的参考资料比较多,但是由于我在写作的时候没有进行做引用记录,于是就不一一列举了。但是,所有的参考引用,我在文章的引用位置都以超链接的方式放出来了。
    写作相当辛苦,所以能不能不要抄袭/剽窃我的劳动成果,谢谢。
    若需转载授权,在评论留言即可。


    未经授权,不得转载。

    相关文章

      网友评论

        本文标题:从Java到C++,以JVM的角度看Java线程的创建与运行

        本文链接:https://www.haomeiwen.com/subject/cuxizttx.html