更新時間:2017年12月21日15時35分 來源:傳智播客 瀏覽次數(shù):
Python是一門優(yōu)秀的語言,它能讓你在短時間內(nèi)通過極少量代碼就能完成許多操作。不僅如此,它還輕松支持多任務處理,比如多進程。
不喜歡Python的人經(jīng)常會吐嘈Python運行太慢。但是,事實并非如此
作為程序猿就是希望如何優(yōu)化代碼,精簡代碼。今天傳智播客專家就為大家精選6條python代碼優(yōu)化建議。
因為GIL的存在,Python很難充分利用多核CPU的優(yōu)勢。但是,可以通過內(nèi)置的模塊multiprocessing實現(xiàn)下面幾種并行模式:
1、 多進程并行編程:對于CPU密集型的程序,可以使用multiprocessing的Process,Pool等封裝好的類,通過多進程的方式實現(xiàn)并行計算。但是因為進程中的通信成本比較大,對于進程之間需要大量數(shù)據(jù)交互的程序效率未必有大的提高。
2、 多線程并行編程:對于IO密集型的程序,multiprocessing.dummy模塊使用multiprocessing的接口封裝threading,使得多線程編程也變得非常輕松(比如可以使用Pool的map接口,簡潔高效)。 分布式:multiprocessing中的Managers類提供了可以在不同進程之共享數(shù)據(jù)的方式,可以在此基礎上開發(fā)出分布式的程序。 不同的業(yè)務場景可以選擇其中的一種或幾種的組合實現(xiàn)程序性能的優(yōu)化。
3、 優(yōu)化算法時間
算法的時間復雜度對程序的執(zhí)行效率影響最大,在Python中可以通過選擇合適的數(shù)據(jù)結(jié)構(gòu)來優(yōu)化時間復雜度,如list和set查找某一個元素的時間復雜度分別是O(n)和O(1)。不同的場景有不同的優(yōu)化方式,總得來說,一般有分治,分支界限,貪心,動態(tài)規(guī)劃等思想。
例如:set的用法
set的union,intersection,difference操作要比list的迭代要快。因此如果涉及到求list交集,并集或者差的問題可以轉(zhuǎn)換為set來操作。
4、 針對循環(huán)的優(yōu)化
每種編程語言都會強調(diào)需要優(yōu)化循環(huán)。當使用Python的時候,你可以依靠大量的技巧使得循環(huán)運行得更快。然而,開發(fā)者經(jīng)常漏掉的一個方法是:避免在一個循環(huán)中使用點操作。例如,考慮下面的代碼:
每一次你調(diào)用方法str.upper,Python都會求該方法的值。然而,如果你用一個變量代替求得的值,值就變成了已知的,Python就可以更快地執(zhí)行任務。優(yōu)化循環(huán)的關鍵,是要減少Python在循環(huán)內(nèi)部執(zhí)行的工作量,因為Python原生的解釋器在那種情況下,真的會減緩執(zhí)行的速度。
5、 函數(shù)選擇
在循環(huán)的時候使用xrange而不是range;使用xrange可以節(jié)省大量的系統(tǒng)內(nèi)存,因為xrange()在序列中每次調(diào)用只產(chǎn)生一個整數(shù)元素。而range()將直接返回完整的元素列表,用于循環(huán)時會有不必要的開銷。在python3中xrange不再存在,里面range提供一個可以遍歷任意長度的范圍的iterator。
6、 使用性能分析工具
除了上面在ipython使用到的timeit模塊,還有cProfile。cProfile的使用方式也非常簡單:python –m cProfile filename.py,filename.py是要運行程序的文件名,可以在標準輸出中看到每一個函數(shù)被調(diào)用的次數(shù)和運行的時間,從而找到程序的性能瓶頸,然后可以有針對性地優(yōu)化。