天天看点

python zipfile模块学习笔记(一)

ZIP文件格式是一种常见的存档和压缩标准,这个zipfile模块提供了工具来创建、读取、写入、附加和列出一个ZIP文件。使用ZIP64扩展(即压缩文件大小超过4G),它能解压加密的ZIP文件,解密过程很慢。

1、测试是否为ZIP文件

is_zipfile()函数会返回一个布尔值来表示是否为ZIP文件,代码如下:

1

2

3

4

<code>#!/usr/bin/python</code>

<code>import</code> <code>zipfile</code>

<code>for</code> <code>filename </code><code>in</code> <code>[</code><code>'print_name.py'</code><code>, </code><code>'python.zip'</code><code>, </code><code>'uwsgi'</code><code>, </code><code>'admin'</code><code>]:</code>

<code>    </code><code>print</code> <code>'%20s %s'</code> <code>%</code> <code>(filename, zipfile.is_zipfile(filename))</code>

如果文件不存在或者不是ZIP文件会返回False。

5

<code>[root@www home]</code><code># python zipfile_is_zipfile.py</code>

<code>       </code><code>print_name.py </code><code>False</code>

<code>          </code><code>python.</code><code>zip</code> <code>True</code>

<code>               </code><code>uwsgi </code><code>False</code>

<code>               </code><code>admin </code><code>False</code>

2、读取ZIP文件的内容

<code>#!/usr/bin/env python</code>

<code>                                                                                                      </code> 

<code>zf </code><code>=</code> <code>zipfile.ZipFile(</code><code>'python.zip'</code><code>, </code><code>'r'</code><code>)</code>

<code>print</code> <code>zf.namelist()</code>

使用namelist() 函数,返回结果是一个列表

<code>[root@www home]# python zipfile_namelist.py</code>

<code>[</code><code>'test.txt'</code><code>]</code>

#这只能查看ZIP文件的部分内容,使用infolist() 或者 getinfo() 可以从ZIP文件中获取更多信息,代码如下:

6

7

8

9

10

11

12

13

14

15

16

17

<code>import</code> <code>datetime</code>

<code>                                                                                            </code> 

<code>def</code> <code>print_info(archive_name):</code>

<code>    </code><code>zf </code><code>=</code> <code>zipfile.ZipFile(archive_name)</code>

<code>    </code><code>for</code> <code>info </code><code>in</code> <code>zf.infolist():</code>

<code>        </code><code>print</code> <code>info.filename</code>

<code>        </code><code>print</code> <code>'\tComment:\t'</code><code>, info.comment</code>

<code>        </code><code>print</code> <code>'\tModified:\t'</code><code>, datetime.datetime(</code><code>*</code><code>info.date_time)</code>

<code>        </code><code>print</code> <code>'\tSystem:\t\t'</code><code>, info.create_system, </code><code>'(0 = Windows, 3 = Unix)'</code>

<code>        </code><code>print</code> <code>'\tZIP version:\t'</code><code>, info.create_version</code>

<code>        </code><code>print</code> <code>'\tCompressed:\t'</code><code>, info.compress_size, </code><code>'bytes'</code>

<code>        </code><code>print</code> <code>'\tUncompressed:\t'</code><code>, info.file_size, </code><code>'bytes'</code>

<code>        </code><code>print</code>

<code>if</code> <code>__name__ </code><code>=</code><code>=</code> <code>'__main__'</code><code>:</code>

<code>    </code><code>print_info(</code><code>'python.zip'</code><code>)</code>

执行上面代码显示如下结果:

<code>[root@www home]</code><code># python zipfile_infolist.py</code>

<code>test.txt</code>

<code>    </code><code>Comment:  </code>

<code>    </code><code>Modified:   </code><code>2013</code><code>-</code><code>09</code><code>-</code><code>06</code> <code>20</code><code>:</code><code>09</code><code>:</code><code>58</code>

<code>    </code><code>System:     </code><code>3</code> <code>(</code><code>0</code> <code>=</code> <code>Windows, </code><code>3</code> <code>=</code> <code>Unix)</code>

<code>    </code><code>ZIP</code> <code>version:    </code><code>20</code>

<code>    </code><code>Compressed: </code><code>419430400</code> <code>bytes</code>

<code>    </code><code>Uncompressed:   </code><code>419430400</code> <code>bytes</code>

使用getinfo()函数可以在ZIP文件内查找内容,代码如下:

<code>                                                                                  </code> 

<code>zf </code><code>=</code> <code>zipfile.ZipFile(</code><code>'python.zip'</code><code>)</code>

<code>for</code> <code>filename </code><code>in</code> <code>[</code><code>'test.txt'</code><code>, </code><code>'notthere.txt'</code><code>]:</code>

<code>    </code><code>try</code><code>:</code>

<code>        </code><code>info </code><code>=</code> <code>zf.getinfo(filename)</code>

<code>    </code><code>except</code> <code>KeyError:</code>

<code>        </code><code>print</code> <code>'ERROR: Did not find %s in zip file'</code> <code>%</code> <code>filename</code>

<code>    </code><code>else</code><code>:</code>

<code>        </code><code>print</code> <code>"%s is %d bytes"</code> <code>%</code> <code>(info.filename, info.file_size)</code>

如果需要查找的不存在ZIP文档里,会返回一个KeyError错误。

<code>[root@www home]</code><code># python zipfile_getinfo.py</code>

<code>test.txt </code><code>is</code> <code>419430400</code> <code>bytes</code>

<code>ERROR: Did </code><code>not</code> <code>find notthere.txt </code><code>in</code> <code>zip</code> <code>file</code>

3、从一个ZIP文档中提取文件

<code>                                                                        </code> 

<code>for</code> <code>filename </code><code>in</code> <code>[</code><code>'test.txt'</code><code>, </code><code>'notihere.txt'</code><code>]:</code>

<code>        </code><code>data </code><code>=</code> <code>zf.read(filename)</code>

<code>        </code><code>print</code> <code>filename, </code><code>':'</code>

<code>        </code><code>print</code> <code>repr</code><code>(data)</code>

<code>    </code><code>print</code>

要提取的文件会被自动解压:

<code>[root@www home]# python zipfile_read.py</code>

<code>                                                                   </code> 

<code>README.txt :</code>

<code>'The examples for the zipfile module use this file and example.zip as data.\n'</code>

<code>ERROR: Did not find notthere.txt in zip file</code>

4、创建一个新的ZIP文件

创建新的ZIP归档文件代码如下:

<code>                                                           </code> 

<code>from</code> <code>zipfile_infolist </code><code>import</code> <code>print_info</code>

<code>print</code> <code>'creating archive'</code>

<code>zf </code><code>=</code> <code>zipfile.ZipFile(</code><code>'zipfile_write.zip'</code><code>, </code><code>'w'</code><code>)</code>

<code>try</code><code>:</code>

<code>    </code><code>print</code> <code>'adding text.txt'</code>

<code>    </code><code>zf.write(</code><code>'text.txt'</code><code>)</code>

<code>finally</code><code>:</code>

<code>    </code><code>print</code> <code>'closing'</code>

<code>    </code><code>zf.close()</code>

<code>print</code>

<code>print_info(</code><code>'zipfile_write.zip'</code><code>)</code>

默认情况下不会对文件进行压缩:

<code>[root@www home]</code><code># python zipfile_write.py</code>

<code>creating archive</code>

<code>adding text.txt</code>

<code>closing</code>

<code>                                                    </code> 

<code>text.txt</code>

<code>    </code><code>Modified:   </code><code>2013</code><code>-</code><code>09</code><code>-</code><code>06</code> <code>20</code><code>:</code><code>39</code><code>:</code><code>52</code>

<code>    </code><code>Compressed: </code><code>104857600</code> <code>bytes</code>

<code>    </code><code>Uncompressed:   </code><code>104857600</code> <code>bytes</code>

如果要对文件进行压缩,zlib模块是必须的,如果zlib可以使用,你可以使用zipfile.ZIP_DEFLATED设置压缩模式为单个文件或者归档一个整体。默认的压缩模式是zipfile.ZIP_STORED。

18

19

20

21

22

23

24

25

<code>                                               </code> 

<code>    </code><code>import</code> <code>zlib</code>

<code>    </code><code>compression </code><code>=</code> <code>zipfile.ZIP_DEFLATED</code>

<code>except</code><code>:</code>

<code>    </code><code>compression </code><code>=</code> <code>zipfile.ZIP_STORED</code>

<code>modes </code><code>=</code> <code>{ zipfile.ZIP_DEFLATED: </code><code>'deflated'</code><code>,</code>

<code>          </code><code>zipfile.ZIP_STORED:   </code><code>'stored'</code><code>,</code>

<code>          </code><code>}</code>

<code>zf </code><code>=</code> <code>zipfile.ZipFile(</code><code>'zipfile_write_compression.zip'</code><code>, mode</code><code>=</code><code>'w'</code><code>)</code>

<code>    </code><code>print</code> <code>'adding text.txt with compression mode'</code><code>, modes[compression]</code>

<code>    </code><code>zf.write(</code><code>'text.txt'</code><code>, compress_type</code><code>=</code><code>compression)</code>

<code>print_info(</code><code>'zipfile_write_compression.zip'</code><code>)</code>

这次文件被压缩:

<code>[root@www home]</code><code># python zipfile_write_compression.py</code>

<code>adding text.txt with compression mode deflated</code>

<code>                                          </code> 

<code>    </code><code>Compressed: </code><code>101923</code> <code>bytes</code>

替换原始文件名:

<code>                                     </code> 

<code>zf </code><code>=</code> <code>zipfile.ZipFile(</code><code>'zipfile_write_arcname.zip'</code><code>, mode</code><code>=</code><code>'w'</code><code>)</code>

<code>    </code><code>zf.write(</code><code>'text.txt'</code><code>, arcname</code><code>=</code><code>'NOT_README.txt'</code><code>)</code>

<code>print_info(</code><code>'zipfile_write_arcname.zip'</code><code>)</code>

结果显示原始文件名已经被替换了:

<code>[root@www home]</code><code># python zipfile_write_arcname.py</code>

<code>NOT_README.txt</code>

本文转自1594cqb 51CTO博客,原文链接:http://blog.51cto.com/wolfchen/1290229,如需转载请自行联系原作者