GIL全局解释器锁
GIL全局解释器锁
CPython 在解释器进程级别有一把锁,叫做GIL,即全局解释器锁。
GIL保证在CPython进程中,只有一个线程执行字节码。甚至在多核CPU的情况下,也只允许同时只能有一个CPU核心上运行该进程的一个线程(就是一个进程中同时只能有一个线程被运行)
Cpython中
- IO密集型,某个线程阻塞,GIL会释放,就会调度其他就绪线程。
- CPU密集型,当前线程可能会连续的获得GIL,导致其他线程几乎无法使用CPU
- 在CPython中由于有GIL存在,IO秘籍型,使用多线程较为合算;cpu秘籍型使用多进程,要绕开GIL
Python中绝大多数内置数据结构的读、写操作都是原子操作(在线程运行进行读或写操作时不会被其他线程打断)。
由于GIL的存在,python的内置数据类型在多线程编程的时候就变成了安全的了,但是实际上他们本身不是线程安全类型
测试下面2个程序,请问下面的程序是计算密集型还是IO密集型?(计算密集型)
import logging
import datetime
logging.basicConfig(level=logging.INFO, format="%(thread)s %(message)s")
start = datetime.datetime.now()
# 计算
def calc():
sum = 0
for _ in range(1000000000): # 10亿
sum += 1
calc()
calc()
calc()
calc()
delta = (datetime.datetime.now() - start).total_seconds()
logging.info(delta)
import threading
import time
import logging
FORMAT='%(asctime)s %(threadName)s %(thread)d %(message)s'
logging.basicConfig(format=FORMAT,level=logging.INFO)
import logging
import datetime
logging.basicConfig(level=logging.INFO, format="%(thread)s %(message)s")
start = datetime.datetime.now()
# 计算
def calc():
sum = 0
for _ in range(10000000):
sum += 1
t1 = threading.Thread(target=calc)
t2 = threading.Thread(target=calc)
t3 = threading.Thread(target=calc)
t4 = threading.Thread(target=calc)
t1.start()
t2.start()
t3.start()
t4.start()
t1.join()
t2.join()
t3.join()
t4.join()
delta = (datetime.datetime.now() - start).total_seconds()
logging.info(delta)
#输出
2023-03-03 10:29:55,796 MainThread 8673478144 18.765817
注意,不要在代码中出现print等访问IO的语句。访问IO,线程阻塞,会释放GIL锁,其他线程被调度。
程序1是单线程程序,所有calc()依次执行,根本就不是并发。在主线程内,函数串行执行。
程序2是多线程程序,calc()执行在不同的线程中,但是由于GIL的存在,线程的执行变成了假并发。但是这些线程可以被调度到不同的CPU核心上执行,只不过GIL让同一时间该进程只有一个线程被执行。
从两段程序测试的结果来看,CPython中多线程根本没有任何优势,和一个线程执行时间相当。因为GIL的存在,尤其是像上面的计算密集型程序,和单线程串行效果相当。这样,实际上就没有用上CPU多核心的优势。
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 J.のblog!
评论