更新md

daacheng · daacheng · commit 9e0cf83af88e · 2020-10-10T16:53:49.000+08:00
&#26356;&#26032;md
diff --git a/python_advance/concurrentfutures&#27169;&#22359;.md b/python_advance/concurrentfutures&#27169;&#22359;.md
@@ -0,0 +1,117 @@
+## concurrent.futures&#27169;&#22359;
+python&#26631;&#20934;&#24211;&#20026;&#25105;&#20204;&#25552;&#20379;&#20102;concurrent.futures&#27169;&#22359;&#65292;&#23427;&#25552;&#20379;&#20102;ThreadPoolExecutor&#21644;ProcessPoolExecutor&#20004;&#20010;&#31867;&#65292;&#23454;&#29616;&#20102;&#23545;threading&#21644;multiprocessing&#30340;&#26356;&#39640;&#32423;&#30340;&#25277;&#35937;&#65292;&#23545;&#32534;&#20889;&#32447;&#31243;&#27744;/&#36827;&#31243;&#27744;&#25552;&#20379;&#20102;&#30452;&#25509;&#30340;&#25903;&#25345;&#12290;
+#### 1.&#21333;&#32447;&#31243;&#19979;&#36733;&#20219;&#21153;
+```python
+import time
+import requests
+
+def download(index, pic_url):
+    resp = requests.get(pic_url)
+    with open('down.png', 'wb') as fw:
+        fw.write(resp.content)
+    return index
+
+if __name__ == '__main__':
+    url = 'https://github.com/daacheng/PythonBasic/blob/master/pic/python_basic/tuple2.png'
+    urls = [(index, url) for index in range(1, 6)]
+    t0 = time.time()
+    for index, pic_url in urls:
+        res = download(index, pic_url)
+        print('&#19979;&#36733;&#25104;&#21151;-{}'.format(res))
+    elapsed = time.time() - t0
+    print('&#19979;&#36733;&#32791;&#26102;: {}'.format(elapsed))
+```
+&#36816;&#34892;&#32467;&#26524;
+```python
+&#19979;&#36733;&#25104;&#21151;-1
+&#19979;&#36733;&#25104;&#21151;-2
+&#19979;&#36733;&#25104;&#21151;-3
+&#19979;&#36733;&#25104;&#21151;-4
+&#19979;&#36733;&#25104;&#21151;-5
+&#19979;&#36733;&#32791;&#26102;: 3.3739817142486572
+```
+
+#### 2.&#20351;&#29992;concurrent.futures&#30340;&#22810;&#32447;&#31243;&#19979;&#36733;&#20219;&#21153;
+#### &#26041;&#24335;&#19968;&#65306;&#20027;&#35201;&#26159;concurrent.futures.Executor&#23545;&#35937;&#21644;concurrent.futures.Future&#23545;&#35937;
+1. **futures.ThreadPoolExecutor(workers)** &#21019;&#24314;&#32447;&#31243;&#27744;Executor&#23545;&#35937;&#65292;&#25351;&#23450;&#24037;&#20316;&#32447;&#31243;&#30340;&#25968;&#37327;&#12290;
+2. **executor.submit(download, index, pic_url)** &#25226;&#20219;&#21153;&#20132;&#32473;concurrent.futures.Executor&#23545;&#35937;&#65292;&#36890;&#36807;executor.submit() &#21019;&#24314;concurrent.futures.Future&#23545;&#35937;&#12290;
+3. **futures.as_completed(todo)** concurrent.futures.as_completed&#20989;&#25968;&#30340;&#21442;&#25968;&#26159;&#19968;&#20010;Future&#23545;&#35937;&#21015;&#34920;&#65292;&#36820;&#22238;&#20540;&#26159;&#19968;&#20010;&#36845;&#20195;&#22120;&#65292;&#22312;Future&#23545;&#35937;&#36816;&#34892;&#32467;&#26463;&#21518;&#36820;&#22238;Future&#23545;&#35937;&#12290;
+4. future.result(timeout)&#26041;&#27861;,&#20250;&#38459;&#22622;&#35843;&#29992;&#26041;&#25152;&#22312;&#30340;&#32447;&#31243;&#65292;&#30452;&#21040;&#26377;&#32467;&#26524;&#21487;&#36820;&#22238;.
+
+```python
+import time
+import requests
+from concurrent import futures
+
+def download(index, pic_url):
+    resp = requests.get(pic_url)
+    with open('down.png', 'wb') as fw:
+        fw.write(resp.content)
+    return index
+
+if __name__ == '__main__':
+    url = 'https://github.com/daacheng/PythonBasic/blob/master/pic/python_basic/tuple2.png'
+    urls = [(index, url) for index in range(1, 6)]
+    workers = len(urls)
+    t0 = time.time()
+    with futures.ThreadPoolExecutor(workers) as executor:
+        todo = {executor.submit(download, index, pic_url) for index, pic_url in urls}
+        for future in futures.as_completed(todo):
+            # &#26412;&#31034;&#20363;&#20013;&#35843;&#29992;future.result()&#26041;&#27861;&#32477;&#19981;&#20250;&#38459;&#22622;&#65292;&#22240;&#20026;future&#26159;&#30001;as_completed&#20989;&#25968;&#20135;&#20986;&#12290;
+            res = future.result()
+            print('&#19979;&#36733;&#25104;&#21151;-{}'.format(res))
+
+    elapsed = time.time() - t0
+    print('&#19979;&#36733;&#32791;&#26102;: {}'.format(elapsed))
+```
+&#36816;&#34892;&#32467;&#26524;
+```python
+&#19979;&#36733;&#25104;&#21151;-4
+&#19979;&#36733;&#25104;&#21151;-3
+&#19979;&#36733;&#25104;&#21151;-2
+&#19979;&#36733;&#25104;&#21151;-5
+&#19979;&#36733;&#25104;&#21151;-1
+&#19979;&#36733;&#32791;&#26102;: 0.7290542125701904
+```
+
+#### &#26041;&#24335;&#20108;
+executor.map()&#26041;&#27861;&#30340;&#20316;&#29992;&#19982;&#20869;&#32622;&#30340;map&#20989;&#25968;&#31867;&#20284;&#65292;download&#20989;&#25968;&#20250;&#22312;&#22810;&#20010;&#32447;&#31243;&#20013;&#24182;&#21457;&#35843;&#29992;, map&#26041;&#27861;&#36820;&#22238;&#19968;&#20010;&#29983;&#25104;&#22120;&#65292;&#22240;&#27492;&#21487;&#20197;&#36845;&#20195;&#65292;&#33719;&#21462;&#21508;&#20010;&#32447;&#31243;&#36820;&#22238;&#30340;&#20540;&#12290;
+
+```python
+import time
+import requests
+from concurrent import futures
+
+def download(index, url):
+    resp = requests.get(url)
+    with open('down.png', 'wb') as fw:
+        fw.write(resp.content)
+    return index
+
+if __name__ == '__main__':
+    url = 'https://github.com/daacheng/PythonBasic/blob/master/pic/python_basic/tuple2.png'
+    urls = [(index, url) for index in range(1, 6)]
+    workers = len(urls)
+    t0 = time.time()
+    with futures.ThreadPoolExecutor(workers) as executor:
+        download_tasks_res = executor.map(download, (i[0] for i in urls), (i[1] for i in urls))
+
+        for res in download_tasks_res:
+            print('&#19979;&#36733;&#25104;&#21151;-{}'.format(res))
+
+    elapsed = time.time() - t0
+    print('&#19979;&#36733;&#32791;&#26102;: {}'.format(elapsed))
+```
+&#36816;&#34892;&#32467;&#26524;
+```python
+&#19979;&#36733;&#25104;&#21151;-1
+&#19979;&#36733;&#25104;&#21151;-2
+&#19979;&#36733;&#25104;&#21151;-3
+&#19979;&#36733;&#25104;&#21151;-4
+&#19979;&#36733;&#25104;&#21151;-5
+&#19979;&#36733;&#32791;&#26102;: 0.5195839405059814
+```
+
+
+#### 3. futures.ProcessPoolExecutor&#19982;futures.ThreadPoolExecutor&#30340;&#29992;&#27861;&#31867;&#20284;
+&#23545;CPU&#23494;&#38598;&#22411;&#24037;&#20316;&#26469;&#35828;&#65292;&#35201;&#21551;&#21160;&#22810;&#20010;&#36827;&#31243;&#65292;&#35268;&#36991;GIL&#12290;&#21019;&#24314;&#22810;&#20010;&#36827;&#31243;&#26368;&#31616;&#21333;&#30340;&#26041;&#24335;&#26159;&#29992;futures.ProcessPoolExecutor &#31867;&#12290;&#23545;&#20110;&#27604;&#36739;&#22797;&#26434;&#30340;&#22810;&#32447;&#31243;&#65292;&#22810;&#36827;&#31243;&#20351;&#29992;&#22330;&#26223;&#65292;&#36824;&#26159;&#35201;&#29992;threading&#21644;multiprocessing&#26469;&#26367;&#20195;futures.ThreadPoolExecutor&#21644;futures.ProcessPoolExecutor&#12290;
diff --git a/python_advance/&#36827;&#31243;&#19982;&#32447;&#31243;&#27010;&#24565;.md b/python_advance/&#36827;&#31243;&#19982;&#32447;&#31243;&#27010;&#24565;.md
@@ -67,3 +67,8 @@ GIL&#37322;&#25918;&#30340;&#24773;&#20917;&#65306;
 **CPU&#23494;&#38598;&#22411;**&#65306;CPU&#23494;&#38598;&#22411;&#30340;&#31243;&#24207;&#38656;&#35201;&#36827;&#34892;&#22823;&#37327;&#30340;&#35745;&#31639;&#65292;&#22914;&#35745;&#31639;&#22278;&#21608;&#29575;&#31561;&#65292;CPU&#30340;&#20351;&#29992;&#29575;&#24456;&#39640;&#65292;&#20219;&#21153;&#26412;&#36523;&#19981;&#22826;&#38656;&#35201;&#35775;&#38382;IO&#35774;&#22791;&#65288;&#30828;&#30424;&#65289;&#12290;**&#36825;&#31181;&#35745;&#31639;&#23494;&#38598;&#22411;&#30340;&#20219;&#21153;&#65292;&#23545;&#20195;&#30721;&#30340;&#36816;&#34892;&#25928;&#29575;&#35201;&#27714;&#24456;&#39640;&#65292;python&#22810;&#32447;&#31243;&#20043;&#38388;&#20999;&#25442;&#65292;&#39057;&#32321;GIL&#30340;&#37322;&#25918;&#19982;&#33719;&#21462;&#65292;&#24182;&#19981;&#33021;&#24456;&#22909;&#30340;&#21033;&#29992;cpu&#30340;&#36164;&#28304;&#65292;&#25152;&#20197;Python&#19981;&#22826;&#36866;&#21512;&#20570;CPU&#23494;&#38598;&#22411;&#30340;&#20219;&#21153;&#65292;&#36825;&#31867;&#20219;&#21153;&#26368;&#22909;&#26159;C&#35821;&#35328;&#23436;&#25104;&#12290;&#22914;&#26524;&#36873;&#29992;Python&#30340;&#35805;&#21487;&#20197;&#29992;Python&#30340;&#22810;&#36827;&#31243;&#21033;&#29992;&#22810;&#26680;&#36164;&#28304;**&#12290;
 
 **IO&#23494;&#38598;&#22411;**&#65306; &#31995;&#32479;&#36816;&#34892;&#30340;&#22823;&#37096;&#20998;&#26102;&#38388;&#65292;&#37117;&#26159;CPU&#22312;&#31561;&#24453;IO&#30340;&#35835;&#20889;&#25805;&#20316;&#65292;CPU&#30340;&#20351;&#29992;&#29575;&#24182;&#19981;&#39640;&#65292;&#27492;&#26102;&#20351;&#29992;python&#22810;&#32447;&#31243;&#65292;&#22810;&#20010;&#20219;&#21153;&#24182;&#21457;&#25191;&#34892;&#65292;&#19981;&#20250;&#20687;&#21333;&#20010;&#32447;&#31243;&#37027;&#26679;&#19968;&#20010;&#20219;&#21153;&#38459;&#22622;&#23548;&#33268;&#25972;&#20010;&#32447;&#31243;&#38459;&#22622;&#65292;&#33021;&#22815;&#26377;&#25928;&#25552;&#21319;&#25928;&#29575;&#12290;&#23545;&#20110;IO&#23494;&#38598;&#22411;&#30340;&#20219;&#21153;&#65292;&#29992;C&#35821;&#35328;&#36824;&#26159;&#29992;Python&#37117;&#24046;&#19981;&#22810;&#65292;&#22240;&#20026;&#22823;&#37096;&#20998;&#26102;&#38388;&#37117;&#26159;IO&#25805;&#20316;&#65292;**&#36825;&#31867;&#20219;&#21153;&#27604;&#36739;&#36866;&#21512;Python&#22810;&#32447;&#31243;&#26469;&#23436;&#25104;&#65288;&#24320;&#21457;&#36895;&#24230;&#24555;&#65289;**&#12290;
+
+## &#20026;&#20160;&#20040;&#35828;python&#22810;&#32447;&#31243;&#27809;&#29992;
+CPython&#35299;&#37322;&#22120;&#26412;&#36523;&#23601;&#19981;&#26159;&#32447;&#31243;&#23433;&#20840;&#30340;&#65292;&#22240;&#27492;&#26377;&#20840;&#23616;&#35299;&#37322;&#22120;&#38145;&#65288;GIL&#65289;&#65292;&#19968;&#27425;&#21482;&#20801;&#35768;&#20351;&#29992;&#19968;&#20010;&#32447;&#31243;&#25191;&#34892;Python&#23383;&#33410;&#30721;&#12290;&#22240;&#27492;&#65292;&#19968;&#20010;Python&#36827;&#31243;&#20013;&#30340;&#22810;&#20010;&#32447;&#31243;&#19981;&#33021;&#21516;&#26102;&#20351;&#29992;&#22810;&#20010;CPU&#26680;&#24515;&#65288;java&#20013;&#19968;&#20010;&#36827;&#31243;&#20013;&#30340;&#22810;&#32447;&#31243;&#21487;&#20197;&#21033;&#29992;&#22810;&#26680;cpu&#65289;&#12290;
+
+&#20294;&#26159;Python&#26631;&#20934;&#24211;&#20013;&#30340;&#25152;&#26377;&#38459;&#22622;&#22411;I/O&#20989;&#25968;&#37117;&#20250;&#37322;&#25918;GIL&#65292;&#20801;&#35768;&#20854;&#20182;&#32447;&#31243;&#36816;&#34892;&#12290;time.sleep()&#20989;&#25968;&#20063;&#20250;&#37322;&#25918;GIL&#12290;&#22240;&#27492;&#65292;&#23613;&#31649;&#26377;GIL&#65292;Python&#22810;&#32447;&#31243;&#36824;&#26159;&#33021;&#22312;I/O&#23494;&#38598;&#22411;&#24212;&#29992;&#20013;&#21457;&#25381;&#20316;&#29992;&#12290;

-Original file line number
+Diff line change
@@ @@ -0,0 +1,117 @@ @@
 +## concurrent.futures模块
 +python标准库为我们提供了concurrent.futures模块，它提供了ThreadPoolExecutor和ProcessPoolExecutor两个类，实现了对threading和multiprocessing的更高级的抽象，对编写线程池/进程池提供了直接的支持。
 +#### 1.单线程下载任务
 +```python
 +import time
 +import requests
++
 +def download(index, pic_url):
 +    resp = requests.get(pic_url)
 +    with open('down.png', 'wb') as fw:
 +        fw.write(resp.content)
 +    return index
++
 +if __name__ == '__main__':
 +    url = 'https://github.com/daacheng/PythonBasic/blob/master/pic/python_basic/tuple2.png'
 +    urls = [(index, url) for index in range(1, 6)]
 +    t0 = time.time()
 +    for index, pic_url in urls:
 +        res = download(index, pic_url)
 +        print('下载成功-{}'.format(res))
 +    elapsed = time.time() - t0
 +    print('下载耗时: {}'.format(elapsed))
 +```
 +运行结果
 +```python
 +下载成功-1
 +下载成功-2
 +下载成功-3
 +下载成功-4
 +下载成功-5
 +下载耗时: 3.3739817142486572
 +```
++
 +#### 2.使用concurrent.futures的多线程下载任务
 +#### 方式一：主要是concurrent.futures.Executor对象和concurrent.futures.Future对象
 +1. **futures.ThreadPoolExecutor(workers)** 创建线程池Executor对象，指定工作线程的数量。
 +2. **executor.submit(download, index, pic_url)** 把任务交给concurrent.futures.Executor对象，通过executor.submit() 创建concurrent.futures.Future对象。
 +3. **futures.as_completed(todo)** concurrent.futures.as_completed函数的参数是一个Future对象列表，返回值是一个迭代器，在Future对象运行结束后返回Future对象。
 +4. future.result(timeout)方法,会阻塞调用方所在的线程，直到有结果可返回.
++
 +```python
 +import time
 +import requests
 +from concurrent import futures
++
 +def download(index, pic_url):
 +    resp = requests.get(pic_url)
 +    with open('down.png', 'wb') as fw:
 +        fw.write(resp.content)
 +    return index
++
 +if __name__ == '__main__':
 +    url = 'https://github.com/daacheng/PythonBasic/blob/master/pic/python_basic/tuple2.png'
 +    urls = [(index, url) for index in range(1, 6)]
 +    workers = len(urls)
 +    t0 = time.time()
 +    with futures.ThreadPoolExecutor(workers) as executor:
 +        todo = {executor.submit(download, index, pic_url) for index, pic_url in urls}
 +        for future in futures.as_completed(todo):
 +            # 本示例中调用future.result()方法绝不会阻塞，因为future是由as_completed函数产出。
 +            res = future.result()
 +            print('下载成功-{}'.format(res))
++
 +    elapsed = time.time() - t0
 +    print('下载耗时: {}'.format(elapsed))
 +```
 +运行结果
 +```python
 +下载成功-4
 +下载成功-3
 +下载成功-2
 +下载成功-5
 +下载成功-1
 +下载耗时: 0.7290542125701904
 +```
++
 +#### 方式二
 +executor.map()方法的作用与内置的map函数类似，download函数会在多个线程中并发调用, map方法返回一个生成器，因此可以迭代，获取各个线程返回的值。
++
 +```python
 +import time
 +import requests
 +from concurrent import futures
++
 +def download(index, url):
 +    resp = requests.get(url)
 +    with open('down.png', 'wb') as fw:
 +        fw.write(resp.content)
 +    return index
++
 +if __name__ == '__main__':
 +    url = 'https://github.com/daacheng/PythonBasic/blob/master/pic/python_basic/tuple2.png'
 +    urls = [(index, url) for index in range(1, 6)]
 +    workers = len(urls)
 +    t0 = time.time()
 +    with futures.ThreadPoolExecutor(workers) as executor:
 +        download_tasks_res = executor.map(download, (i[0] for i in urls), (i[1] for i in urls))
++
 +        for res in download_tasks_res:
 +            print('下载成功-{}'.format(res))
++
 +    elapsed = time.time() - t0
 +    print('下载耗时: {}'.format(elapsed))
 +```
 +运行结果
 +```python
 +下载成功-1
 +下载成功-2
 +下载成功-3
 +下载成功-4
 +下载成功-5
 +下载耗时: 0.5195839405059814
 +```
++
++
 +#### 3. futures.ProcessPoolExecutor与futures.ThreadPoolExecutor的用法类似
 +对CPU密集型工作来说，要启动多个进程，规避GIL。创建多个进程最简单的方式是用futures.ProcessPoolExecutor 类。对于比较复杂的多线程，多进程使用场景，还是要用threading和multiprocessing来替代futures.ThreadPoolExecutor和futures.ProcessPoolExecutor。
-Original file line number
+Diff line change
 **CPU密集型**：CPU密集型的程序需要进行大量的计算，如计算圆周率等，CPU的使用率很高，任务本身不太需要访问IO设备（硬盘）。**这种计算密集型的任务，对代码的运行效率要求很高，python多线程之间切换，频繁GIL的释放与获取，并不能很好的利用cpu的资源，所以Python不太适合做CPU密集型的任务，这类任务最好是C语言完成。如果选用Python的话可以用Python的多进程利用多核资源**。
 **IO密集型**： 系统运行的大部分时间，都是CPU在等待IO的读写操作，CPU的使用率并不高，此时使用python多线程，多个任务并发执行，不会像单个线程那样一个任务阻塞导致整个线程阻塞，能够有效提升效率。对于IO密集型的任务，用C语言还是用Python都差不多，因为大部分时间都是IO操作，**这类任务比较适合Python多线程来完成（开发速度快）**。
++
 +## 为什么说python多线程没用
 +CPython解释器本身就不是线程安全的，因此有全局解释器锁（GIL），一次只允许使用一个线程执行Python字节码。因此，一个Python进程中的多个线程不能同时使用多个CPU核心（java中一个进程中的多线程可以利用多核cpu）。
++
 +但是Python标准库中的所有阻塞型I/O函数都会释放GIL，允许其他线程运行。time.sleep()函数也会释放GIL。因此，尽管有GIL，Python多线程还是能在I/O密集型应用中发挥作用。