博彩葡京,皇轩时时彩怎么样,凯旋城娱乐场官网平台(中国)·官方网站

Python 在程序并行化方面多少有些聲名狼藉。撇開技術(shù)上的問題，例如線程的實(shí)現(xiàn)和 GIL，我覺得錯(cuò)誤的教學(xué)指導(dǎo)才是主要問題。常見的經(jīng)典 Python 多線程、多進(jìn)程教程多顯得偏"重"。而且往往隔靴搔癢，沒有深入探討日常工作中最有用的內(nèi)容。

傳統(tǒng)的例子

簡(jiǎn)單搜索下"Python 多線程教程"，不難發(fā)現(xiàn)幾乎所有的教程都給出涉及類和隊(duì)列的例子：

import os 
import PIL 

from multiprocessing import Pool 
from PIL import Image

SIZE = (75,75)
SAVE_DIRECTORY = 'thumbs'

def get_image_paths(folder):
  return (os.path.join(folder, f) 
      for f in os.listdir(folder) 
      if 'jpeg' in f)

def create_thumbnail(filename): 
  im = Image.open(filename)
  im.thumbnail(SIZE, Image.ANTIALIAS)
  base, fname = os.path.split(filename) 
  save_path = os.path.join(base, SAVE_DIRECTORY, fname)
  im.save(save_path)

if __name__ == '__main__':
  folder = os.path.abspath(
    '11_18_2013_R000_IQM_Big_Sur_Mon__e10d1958e7b766c3e840')
  os.mkdir(os.path.join(folder, SAVE_DIRECTORY))

  images = get_image_paths(folder)

  pool = Pool()
  pool.map(creat_thumbnail, images)
  pool.close()
  pool.join()

哈，看起來有些像 Java 不是嗎？

我并不是說使用生產(chǎn)者/消費(fèi)者模型處理多線程/多進(jìn)程任務(wù)是錯(cuò)誤的（事實(shí)上，這一模型自有其用武之地）。只是，處理日常腳本任務(wù)時(shí)我們可以使用更有效率的模型。

問題在于…

首先，你需要一個(gè)樣板類；
其次，你需要一個(gè)隊(duì)列來傳遞對(duì)象；
而且，你還需要在通道兩端都構(gòu)建相應(yīng)的方法來協(xié)助其工作（如果需想要進(jìn)行雙向通信或是保存結(jié)果還需要再引入一個(gè)隊(duì)列）。

worker 越多，問題越多

按照這一思路，你現(xiàn)在需要一個(gè) worker 線程的線程池。下面是一篇 IBM 經(jīng)典教程中的例子——在進(jìn)行網(wǎng)頁檢索時(shí)通過多線程進(jìn)行加速。

#Example2.py
'''
A more realistic thread pool example 
'''

import time 
import threading 
import Queue 
import urllib2 

class Consumer(threading.Thread): 
  def __init__(self, queue): 
    threading.Thread.__init__(self)
    self._queue = queue 

  def run(self):
    while True: 
      content = self._queue.get() 
      if isinstance(content, str) and content == 'quit':
        break
      response = urllib2.urlopen(content)
    print 'Bye byes!'

def Producer():
  urls = [
    'http://www.python.org', 'http://www.yahoo.com'
    'http://www.scala.org', 'http://www.google.com'
    # etc.. 
  ]
  queue = Queue.Queue()
  worker_threads = build_worker_pool(queue, 4)
  start_time = time.time()

  # Add the urls to process
  for url in urls: 
    queue.put(url) 
  # Add the poison pillv
  for worker in worker_threads:
    queue.put('quit')
  for worker in worker_threads:
    worker.join()

  print 'Done! Time taken: {}'.format(time.time() - start_time)

def build_worker_pool(queue, size):
  workers = []
  for _ in range(size):
    worker = Consumer(queue)
    worker.start() 
    workers.append(worker)
  return workers

if __name__ == '__main__':
  Producer()

這段代碼能正確的運(yùn)行，但仔細(xì)看看我們需要做些什么：構(gòu)造不同的方法、追蹤一系列的線程，還有為了解決惱人的死鎖問題，我們需要進(jìn)行一系列的 join 操作。這還只是開始……

至此我們回顧了經(jīng)典的多線程教程，多少有些空洞不是嗎？樣板化而且易出錯(cuò)，這樣事倍功半的風(fēng)格顯然不那么適合日常使用，好在我們還有更好的方法。

何不試試 map

map 這一小巧精致的函數(shù)是簡(jiǎn)捷實(shí)現(xiàn) Python 程序并行化的關(guān)鍵。map 源于 Lisp 這類函數(shù)式編程語言。它可以通過一個(gè)序列實(shí)現(xiàn)兩個(gè)函數(shù)之間的映射。

  urls = ['http://www.yahoo.com', 'http://www.reddit.com']
  results = map(urllib2.urlopen, urls)

上面的這兩行代碼將 urls 這一序列中的每個(gè)元素作為參數(shù)傳遞到 urlopen 方法中，并將所有結(jié)果保存到 results 這一列表中。其結(jié)果大致相當(dāng)于：

results = []
for url in urls: 
  results.append(urllib2.urlopen(url))

map 函數(shù)一手包辦了序列操作、參數(shù)傳遞和結(jié)果保存等一系列的操作。

為什么這很重要呢？這是因?yàn)榻柚_的庫，map 可以輕松實(shí)現(xiàn)并行化操作。

在 Python 中有個(gè)兩個(gè)庫包含了 map 函數(shù)：multiprocessing 和它鮮為人知的子庫 multiprocessing.dummy.

這里多扯兩句：multiprocessing.dummy？mltiprocessing 庫的線程版克隆？這是蝦米？即便在 multiprocessing 庫的官方文檔里關(guān)于這一子庫也只有一句相關(guān)描述。而這句描述譯成人話基本就是說:"嘛，有這么個(gè)東西，你知道就成."相信我，這個(gè)庫被嚴(yán)重低估了！

dummy 是 multiprocessing 模塊的完整克隆，唯一的不同在于 multiprocessing 作用于進(jìn)程，而 dummy 模塊作用于線程（因此也包括了 Python 所有常見的多線程限制）。
所以替換使用這兩個(gè)庫異常容易。你可以針對(duì) IO 密集型任務(wù)和 CPU 密集型任務(wù)來選擇不同的庫。

動(dòng)手嘗試

使用下面的兩行代碼來引用包含并行化 map 函數(shù)的庫：

from multiprocessing import Pool
from multiprocessing.dummy import Pool as ThreadPool

實(shí)例化 Pool 對(duì)象：

pool = ThreadPool()

這條簡(jiǎn)單的語句替代了 example2.py 中 buildworkerpool 函數(shù) 7 行代碼的工作。它生成了一系列的 worker 線程并完成初始化工作、將它們儲(chǔ)存在變量中以方便訪問。

Pool 對(duì)象有一些參數(shù)，這里我所需要關(guān)注的只是它的第一個(gè)參數(shù)：processes. 這一參數(shù)用于設(shè)定線程池中的線程數(shù)。其默認(rèn)值為當(dāng)前機(jī)器 CPU 的核數(shù)。

一般來說，執(zhí)行 CPU 密集型任務(wù)時(shí)，調(diào)用越多的核速度就越快。但是當(dāng)處理網(wǎng)絡(luò)密集型任務(wù)時(shí)，事情有有些難以預(yù)計(jì)了，通過實(shí)驗(yàn)來確定線程池的大小才是明智的。

pool = ThreadPool(4) # Sets the pool size to 4

線程數(shù)過多時(shí)，切換線程所消耗的時(shí)間甚至?xí)^實(shí)際工作時(shí)間。對(duì)于不同的工作，通過嘗試來找到線程池大小的最優(yōu)值是個(gè)不錯(cuò)的主意。

創(chuàng)建好 Pool 對(duì)象后，并行化的程序便呼之欲出了。我們來看看改寫后的 example2.py

import urllib2 
from multiprocessing.dummy import Pool as ThreadPool 

urls = [
  'http://www.python.org', 
  'http://www.python.org/about/',
  'http://www.onlamp.com/pub/a/python/2003/04/17/metaclasses.html',
  'http://www.python.org/doc/',
  'http://www.python.org/download/',
  'http://www.python.org/getit/',
  'http://www.python.org/community/',
  'https://wiki.python.org/moin/',
  'http://planet.python.org/',
  'https://wiki.python.org/moin/LocalUserGroups',
  'http://www.python.org/psf/',
  'http://docs.python.org/devguide/',
  'http://www.python.org/community/awards/'
  # etc.. 
  ]

# Make the Pool of workers
pool = ThreadPool(4) 
# Open the urls in their own threads
# and return the results
results = pool.map(urllib2.urlopen, urls)
#close the pool and wait for the work to finish 
pool.close() 
pool.join()

實(shí)際起作用的代碼只有 4 行，其中只有一行是關(guān)鍵的。map 函數(shù)輕而易舉的取代了前文中超過 40 行的例子。為了更有趣一些，我統(tǒng)計(jì)了不同方法、不同線程池大小的耗時(shí)情況。

# results = [] 
# for url in urls:
#  result = urllib2.urlopen(url)
#  results.append(result)

# # ------- VERSUS ------- # 

# # ------- 4 Pool ------- # 
# pool = ThreadPool(4) 
# results = pool.map(urllib2.urlopen, urls)

# # ------- 8 Pool ------- # 

# pool = ThreadPool(8) 
# results = pool.map(urllib2.urlopen, urls)

# # ------- 13 Pool ------- # 

# pool = ThreadPool(13) 
# results = pool.map(urllib2.urlopen, urls)

結(jié)果：

#    Single thread: 14.4 Seconds 
#        4 Pool:  3.1 Seconds
#        8 Pool:  1.4 Seconds
#       13 Pool:  1.3 Seconds

很棒的結(jié)果不是嗎？這一結(jié)果也說明了為什么要通過實(shí)驗(yàn)來確定線程池的大小。在我的機(jī)器上當(dāng)線程池大小大于 9 帶來的收益就十分有限了。

另一個(gè)真實(shí)的例子

生成上千張圖片的縮略圖
這是一個(gè) CPU 密集型的任務(wù)，并且十分適合進(jìn)行并行化。

基礎(chǔ)單進(jìn)程版本

import os 
import PIL 

from multiprocessing import Pool 
from PIL import Image

SIZE = (75,75)
SAVE_DIRECTORY = 'thumbs'

def get_image_paths(folder):
  return (os.path.join(folder, f) 
      for f in os.listdir(folder) 
      if 'jpeg' in f)

def create_thumbnail(filename): 
  im = Image.open(filename)
  im.thumbnail(SIZE, Image.ANTIALIAS)
  base, fname = os.path.split(filename) 
  save_path = os.path.join(base, SAVE_DIRECTORY, fname)
  im.save(save_path)

if __name__ == '__main__':
  folder = os.path.abspath(
    '11_18_2013_R000_IQM_Big_Sur_Mon__e10d1958e7b766c3e840')
  os.mkdir(os.path.join(folder, SAVE_DIRECTORY))

  images = get_image_paths(folder)

  for image in images:
    create_thumbnail(Image)

上邊這段代碼的主要工作就是將遍歷傳入的文件夾中的圖片文件，一一生成縮略圖，并將這些縮略圖保存到特定文件夾中。

這我的機(jī)器上，用這一程序處理 6000 張圖片需要花費(fèi) 27.9 秒。

如果我們使用 map 函數(shù)來代替 for 循環(huán)：

import os 
import PIL 

from multiprocessing import Pool 
from PIL import Image

SIZE = (75,75)
SAVE_DIRECTORY = 'thumbs'

def get_image_paths(folder):
  return (os.path.join(folder, f) 
      for f in os.listdir(folder) 
      if 'jpeg' in f)

def create_thumbnail(filename): 
  im = Image.open(filename)
  im.thumbnail(SIZE, Image.ANTIALIAS)
  base, fname = os.path.split(filename) 
  save_path = os.path.join(base, SAVE_DIRECTORY, fname)
  im.save(save_path)

if __name__ == '__main__':
  folder = os.path.abspath(
    '11_18_2013_R000_IQM_Big_Sur_Mon__e10d1958e7b766c3e840')
  os.mkdir(os.path.join(folder, SAVE_DIRECTORY))

  images = get_image_paths(folder)

  pool = Pool()
  pool.map(creat_thumbnail, images)
  pool.close()
  pool.join()

5.6 秒！

雖然只改動(dòng)了幾行代碼，我們卻明顯提高了程序的執(zhí)行速度。在生產(chǎn)環(huán)境中，我們可以為 CPU 密集型任務(wù)和 IO 密集型任務(wù)分別選擇多進(jìn)程和多線程庫來進(jìn)一步提高執(zhí)行速度——這也是解決死鎖問題的良方。此外，由于 map 函數(shù)并不支持手動(dòng)線程管理，反而使得相關(guān)的 debug 工作也變得異常簡(jiǎn)單。

到這里，我們就實(shí)現(xiàn)了（基本）通過一行 Python 實(shí)現(xiàn)并行化。

原文標(biāo)題：一行 Python 代碼實(shí)現(xiàn)并行

文章出處：【微信公眾號(hào)：Linux愛好者】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

審核編輯：彭菁

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

函數(shù)

函數(shù)

+關(guān)注

關(guān)注
3

文章
4346

瀏覽量
62969
代碼

代碼

+關(guān)注

關(guān)注
30

文章
4825

瀏覽量
69044
python

python

+關(guān)注

關(guān)注
56

文章
4807

瀏覽量
85037

原文標(biāo)題：一行 Python 代碼實(shí)現(xiàn)并行

文章出處：【微信號(hào)：LinuxHub，微信公眾號(hào)：Linux愛好者】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

評(píng)論

相關(guān)推薦

分享50條經(jīng)典的Python一行代碼

今天浩道跟大家分享python學(xué)習(xí)過程中非常經(jīng)典的50條一行代碼，讓大家體驗(yàn)它簡(jiǎn)潔而功能強(qiáng)大的特點(diǎn)。同時(shí)給大家分享號(hào)主收集到的所有關(guān)于python的電子書籍，所有電子書以網(wǎng)盤打包，免費(fèi)

發(fā)表于 08-16 15:00 ?1089次閱讀

第一行代碼——Android

android開發(fā)。第一行代碼開發(fā)入門。

發(fā)表于 03-21 11:40 ?0次下載

第一行代碼——Android

發(fā)表于 03-19 11:24 ?0次下載

如何實(shí)現(xiàn)計(jì)算機(jī)視覺的目標(biāo)檢測(cè)10行Python代碼幫你實(shí)現(xiàn)

只需10行Python代碼，我們就能實(shí)現(xiàn)計(jì)算機(jī)視覺中目標(biāo)檢測(cè)。沒錯(cuò)，用這寥寥10行代碼，就能

發(fā)表于 02-03 11:35 ?3083次閱讀

Python使用過程中用一行代碼實(shí)現(xiàn)過哪些激動(dòng)人心的功能呢？

那一刻，我腦洞大開，很想知道 python 高手們只用一行代碼都能干些什么？當(dāng)然，限定條件是不能引用自定義的模塊，可以使用內(nèi)置模塊或通用的第三方模塊。

發(fā)表于 05-12 09:07 ?2636次閱讀

盤點(diǎn)10個(gè)一行強(qiáng)大的、有趣的Python源代碼

Python是一門非常簡(jiǎn)潔而優(yōu)美的編程語言，在其他編程語言中需要繁瑣的代碼邏輯才能完成的事情，往往在Python中一行就可以解決。

發(fā)表于 10-08 14:33 ?8817次閱讀

使用map函數(shù)實(shí)現(xiàn)Python程序并行化

Python 在程序并行化方面多少有些聲名狼藉。撇開技術(shù)上的問題，例如線程的實(shí)現(xiàn)和 GIL，我覺得錯(cuò)誤的教學(xué)指導(dǎo)才是主要問題。常見的經(jīng)典 Pytho

發(fā)表于 06-12 16:31 ?1731次閱讀

20個(gè)非常有用的Python單行代碼

有用的 Python 單行代碼片段，只需一行代碼即可解決特定編碼問題！

發(fā)表于 03-14 17:45 ?944次閱讀

一行Python代碼實(shí)現(xiàn)并行

Python 在程序并行化方面多少有些聲名狼藉。撇開技術(shù)上的問題，例如線程的實(shí)現(xiàn)和 GIL，我覺得錯(cuò)誤的教學(xué)指導(dǎo)才是主要問題。常見的經(jīng)典 Pytho

發(fā)表于 04-06 11:00 ?609次閱讀

一行代碼將Python程序轉(zhuǎn)換為GUI應(yīng)用程序

Gooey項(xiàng)目支持用一行代碼將（幾乎）任何Python 2或3控制臺(tái)程序轉(zhuǎn)換為GUI應(yīng)用程序。 1.快速開始開始之前，你要確保Python和pip已經(jīng)成功安裝在電腦上，如果沒有，可以

發(fā)表于 10-17 11:41 ?1035次閱讀

一行代碼將Python程序轉(zhuǎn)換為圖形界面應(yīng)用

Gooey項(xiàng)目支持用一行代碼將（幾乎）任何Python 2或3控制臺(tái)程序轉(zhuǎn)換為GUI應(yīng)用程序。 1.快速開始開始之前，你要確保Python和pip已經(jīng)成功安裝在電腦上，如果沒有，可以

發(fā)表于 10-30 15:39 ?504次閱讀

如何用一行命令格式化 Python 代碼

統(tǒng)一代碼規(guī)范??！然而這顯然是不可能的。不過雖然無法改變他人，但我們可以改變自己。現(xiàn)在有了Black這個(gè)神器，我們可以在終端中輸入一句命令自動(dòng)使用最規(guī)范的代碼風(fēng)格來格式

發(fā)表于 10-31 10:35 ?637次閱讀

python如何將多行合并成一行

在Python中，有多種方法可以將多行合并成一行。以下是詳細(xì)解釋和示例：方法一：使用字符串的replace()方法你可以使用字符串的replace()方法來刪除換行符并將多行合并為一行

發(fā)表于 11-24 09:42 ?4701次閱讀

python如何讓多行輸出為一行

。但是，我們可以使用end參數(shù)將其替換為其他字符，例如空格或逗號(hào)，從而實(shí)現(xiàn)多行輸出為一行。示例代碼如下： print ( "Hello," , end = " " ) print ( "World

發(fā)表于 11-24 09:45 ?7601次閱讀

python多行數(shù)據(jù)合并成一行

在Python中，有許多不同的方法可以將多行數(shù)據(jù)合并成一行。接下來，我將為您詳細(xì)介紹其中一些方法。方法一：使用字符串連接符最常見的方法是使用字符串連接符“+”來連接每

發(fā)表于 11-24 09:48 ?2717次閱讀

吴忠躺衫网络科技有限公司

搜索歷史

一行Python代碼如何實(shí)現(xiàn)并行化

評(píng)論

分享50條經(jīng)典的Python一行代碼

第一行代碼——Android

第一行代碼——Android

如何實(shí)現(xiàn)計(jì)算機(jī)視覺的目標(biāo)檢測(cè)10行Python代碼幫你實(shí)現(xiàn)

Python使用過程中用一行代碼實(shí)現(xiàn)過哪些激動(dòng)人心的功能呢？

盤點(diǎn)10個(gè)一行強(qiáng)大的、有趣的Python源代碼

使用map函數(shù)實(shí)現(xiàn)Python程序并行化

20個(gè)非常有用的Python單行代碼

一行Python代碼實(shí)現(xiàn)并行

一行代碼將Python程序轉(zhuǎn)換為GUI應(yīng)用程序

一行代碼將Python程序轉(zhuǎn)換為圖形界面應(yīng)用

如何用一行命令格式化 Python 代碼

python如何將多行合并成一行

python如何讓多行輸出為一行

python多行數(shù)據(jù)合并成一行