当前位置: 首页 > 面试题库 >

Linux中进程和线程之间的区别

邹祺
2023-03-14
问题内容

在阅读了这个答案和Robert Love的“LinuxKernelDevelopment”之后,随后在clone()系统调用中,我发现Linux中的进程和线程(几乎)与内核没有区别。它们之间有一些调整(在引用的SO问题中被讨论为“更多共享”或“更少共享”),但是我仍然有一些问题需要解答。

我最近开发了一个包含几个POSIX线程的程序,并决定在此前提下进行试验。在创建两个线程的进程中,所有线程当然都会获得的唯一值pthread_self()
不是getpid()

我创建的示例程序如下:

#include <stdio.h>
#include <stdlib.h>
#include <stdint.h>
#include <unistd.h>
#include <pthread.h>

void* threadMethod(void* arg)
{
    int intArg = (int) *((int*) arg);

    int32_t pid = getpid();
    uint64_t pti = pthread_self();

    printf("[Thread %d] getpid() = %d\n", intArg, pid);
    printf("[Thread %d] pthread_self() = %lu\n", intArg, pti);
}

int main()
{
    pthread_t threads[2];

    int thread1 = 1;

    if ((pthread_create(&threads[0], NULL, threadMethod, (void*) &thread1))
         != 0)
    {
        fprintf(stderr, "pthread_create: error\n");
        exit(EXIT_FAILURE);
    }

    int thread2 = 2;

    if ((pthread_create(&threads[1], NULL, threadMethod, (void*) &thread2))
         != 0)
    {
        fprintf(stderr, "pthread_create: error\n");
        exit(EXIT_FAILURE);
    }

    int32_t pid = getpid();
    uint64_t pti = pthread_self();

    printf("[Process] getpid() = %d\n", pid);
    printf("[Process] pthread_self() = %lu\n", pti);

    if ((pthread_join(threads[0], NULL)) != 0)
    {
        fprintf(stderr, "Could not join thread 1\n");
        exit(EXIT_FAILURE);
    }

    if ((pthread_join(threads[1], NULL)) != 0)
    {
        fprintf(stderr, "Could not join thread 2\n");
        exit(EXIT_FAILURE);
    }

    return 0;
}

(这被编译[ gcc -pthread -o thread_test thread_test.c]在64位的Fedora;由于用于64位类型pthread_t从来源<bits/pthreadtypes.h>,代码将需要小的变化来编译在32位版本。)

我得到的输出如下:

[bean@fedora ~]$ ./thread_test 
[Process] getpid() = 28549
[Process] pthread_self() = 140050170017568
[Thread 2] getpid() = 28549
[Thread 2] pthread_self() = 140050161620736
[Thread 1] getpid() = 28549
[Thread 1] pthread_self() = 140050170013440
[bean@fedora ~]$

通过使用锁定的调度程序gdb,我可以使程序及其线程保持活动状态,这样我就可以捕获top所说的内容, 仅显示进程 为:

  PID USER      PR  NI  VIRT  RES  SHR S %CPU %MEM    TIME+  COMMAND
28602 bean      20   0 15272 1112  820 R  0.4  0.0   0:00.63 top
 2036 bean      20   0  108m 1868 1412 S  0.0  0.0   0:00.11 bash
28547 bean      20   0  231m  16m 7676 S  0.0  0.4   0:01.56 gdb
28549 bean      20   0 22688  340  248 t  0.0  0.0   0:00.26 thread_test
28561 bean      20   0  107m 1712 1356 S  0.0  0.0   0:00.07 bash

当显示线程时,说:

  PID USER      PR  NI  VIRT  RES  SHR S %CPU %MEM    TIME+  COMMAND
28617 bean      20   0 15272 1116  820 R 47.2  0.0   0:00.08 top
 2036 bean      20   0  108m 1868 1412 S  0.0  0.0   0:00.11 bash
28547 bean      20   0  231m  16m 7676 S  0.0  0.4   0:01.56 gdb
28549 bean      20   0 22688  340  248 t  0.0  0.0   0:00.26 thread_test
28552 bean      20   0 22688  340  248 t  0.0  0.0   0:00.00 thread_test
28553 bean      20   0 22688  340  248 t  0.0  0.0   0:00.00 thread_test
28561 bean      20   0  107m 1860 1432 S  0.0  0.0   0:00.08 bash

似乎很清楚,程序或内核与进程相比,具有一种定义线程的独特方法。每个线程根据其都有自己的PID- top为什么?


问题答案:

这些混乱的根源在于,内核开发人员最初持有一种不合理和错误的观点,即只要内核提供了一种使它们共享内存和文件描述符的方法,线程就可以几乎完全在用户空间中使用内核进程作为原语来实现。
。这导致了臭名昭著的POSIX线程的LinuxThreads糟糕的实现,这是一个错误的称呼,因为它没有提供任何与POSIX线程语义类似的东西。最终,LinuxThreads被NPTL取代(但由NPTL代替),但是仍然存在许多令人困惑的术语和误解。

首先要认识到的最重要的事情是“
PID”在内核空间和用户空间中的含义不同。内核称为PID的实际上是内核级线程ID(通常称为TID),不要与之混淆,pthread_t后者是一个单独的标识符。系统上的每个线程,无论是在同一进程中还是在不同进程中,都具有唯一的TID(或内核术语中的“
PID”)。

另一方面,在POSIX的“进程”意义上,所谓的PID在内核中称为“线程组ID”或“
TGID”。每个进程由一个或多个线程(内核进程)组成,每个线程都有自己的TID(内核PID),但都共享相同的TGID,该TGID等于在其中main运行的初始线程的TID(内核PID)。

top显示线程时,它显示的是TID(内核PID),而不是PID(内核TGID),因此每个线程都有一个单独的线程。

随着NPTL的到来,大多数采用PID参数或对调用 进程 起作用的系统调用都已更改为将PID视为TGID并对整个“线程组”起作用(POSIX进程)。



 类似资料:
  • 本文向大家介绍进程和线程之间的区别,包括了进程和线程之间的区别的使用技巧和注意事项,需要的朋友参考一下 进程是活动程序,即正在执行的程序。它不仅包含程序代码,还包括程序计数器,进程堆栈,寄存器,程序代码等。与此相比,程序代码只是文本部分。 线程是可以由调度程序独立管理的轻量级进程。它使用并行性提高了应用程序性能。线程与它的对等线程共享信息,如数据段,代码段,文件等,而该线程包含其自己的寄存器,堆栈

  • 问题内容: 进程和线程之间的技术区别是什么? 我感到像“过程”这样的词已被过度使用,并且还有硬件和软件线程。像Erlang这样的语言的轻量级进程怎么样?有确定的理由使用一个术语而不是另一个术语吗? 问题答案: 进程和线程都是独立的执行序列。典型的区别是(同一进程的)线程在共享内存空间中运行,而进程在单独的内存空间中运行。 我不确定您可能指的是“硬件”还是“软件”线程。线程是一种操作环境功能,而不是

  • 本文向大家介绍Linux中进程和线程的对比与区别,包括了Linux中进程和线程的对比与区别的使用技巧和注意事项,需要的朋友参考一下 Linux中进程和线程的对比与区别 1.概念 进程:正在运行中的程序。 线程:进程中的一条执行路径。 2.区别 (1)通常在一个进程中可以包含若干个线程,它们可以利用进程所拥有的资源。在引入线程的操作系统中,通常都是把进程作为分配资源的基本单位,而把线程作为独立运行和

  • 问题内容: 我对此感到困惑。我已经读到,当父进程创建子进程时,子进程会获得其父进程的地址空间的副本。复制在这里意味着什么?如果我在下面使用代码,那么它将在所有情况下都在堆上打印变量“ a”的相同地址。即在孩子和父母的情况下。那么这里发生了什么? } 问题答案: 子级将获得父级地址空间的精确副本,在许多情况下,该副本可能以与父级地址空间相同的格式进行布局。我必须指出,每个内存都有自己的虚拟地址空间,

  • 本文向大家介绍固定线程池和缓存线程池之间的区别。,包括了固定线程池和缓存线程池之间的区别。的使用技巧和注意事项,需要的朋友参考一下 执行器框架是使用线程池概念设计的。线程池是重用已经创建的线程的方法,而不是每次执行当前任务都创建一个新线程的方法。 Executors类提供了一种工厂方法来创建线程池。ThreadPoolExecutor类是从许多Executors工厂方法返回的执行器的基本实现。 序

  • 本文向大家介绍Python中进程和线程的区别详解,包括了Python中进程和线程的区别详解的使用技巧和注意事项,需要的朋友参考一下 Num01–>线程 线程是操作系统中能够进行运算调度的最小单位。它被包含在进程之中,是进程中的实际运作单位。 一个线程指的是进程中一个单一顺序的控制流。 一个进程中可以并发多条线程,每条线程并行执行不同的任务。 Num02–>进程 进程就是一个程序在一个数据集上的一次