-
php实现的zip文件内容比较类
这篇文章主要介绍了php实现的zip文件内容比较类及其用法,可实现比较两个zip文件的内容,返回新增、删除、及相同的文件列表,是非常实用的技巧,需要的朋友可以参考下
本文实例讲述了php实现的zip文件内容比较类。是一个非常实用的PHP类文件。分享给大家供大家参考。具体分析如下:
该php zip文件比较类主要实现比较两个zip文件的内容,返回新增,删除,及相同的文件列表。暂时只支持单层。
需求:上传一个zip文件,zip内有很多图片文件。需要对图片文件进行一系列很耗时的处理。当用户再更新zip文件时。判断zip内文件是否一致,只处理不同的文件。这样可以节省资源与时间,因此需要编写一个能够比较zip内文件的类。
ZipCompare.class.php类文件如下:
- <?php
- /** Zip Compare class 比较两个zip文件的内容,返回新增,删除,及相同的文件列表,暂时只支持单层
- * Date: 2014-05-18
- * Author: fdipzone
- * Ver: 1.0
- *
- * Func:
- * public compare 比较zip文件内容
- * private getInfo 获取zip内文件列表
- * private parse 分析两个zip的文件内容
- * private check 检查zip文件是否正确
- * private check_handler 检查服务器是否有安装unzip
- */
- class ZipCompare{ // class start
- /** 比较zip文件内容,列出不相同的部分
- * @param String $zipfile1 zip文件1
- * @param String $zipfile2 zip文件2
- * @return Array
- */
- public function compare($zipfile1, $zipfile2){
- // 检查是否有安装unzip
- if(!$this->check_handler()){
- throw new Exception('unzip not install');
- }
- // 检查zip文件
- if(!$this->check($zipfile1) || !$this->check($zipfile2)){
- throw new Exception('zipfile not exists or error');
- }
- // 获取zip内文件列表
- $zipinfo1 = $this->getInfo($zipfile1);
- $zipinfo2 = $this->getInfo($zipfile2);
- // 分析两个zip的文件内容,返回相同及不同的文件列表
- return $this->parse($zipinfo1, $zipinfo2);
- }
- /** 获取zip内文件列表
- * @param String $zipfile zip文件
- * @return Array zip内文件列表
- */
- private function getInfo($zipfile){
- // unzip -v fields
- $fields = array('Length','Method','Size','Cmpr','Date','Time','CRC-32','Name');
- // zip verbose
- $verbose = shell_exec(sprintf("unzip -v %s | sed '\$d' | sed '\$d' | sed -n '4,\$p'", $zipfile));
- // zip info
- $zipinfo = array();
- $filelist = explode("\n", $verbose);
- if($filelist){
- foreach($filelist as $rowdata){
- if($rowdata==''){
- continue;
- }
- $rowdata = preg_replace('/[ ]{2,}/', ' ', $rowdata); // 将两个或以上空格替换为一个
- $tmp = array_slice(explode(' ', $rowdata), 1); // 去掉第一个空格
- $file = array_combine($fields, $tmp);
- $zipinfo[$file['Name']] = $file['Length'].'_'.$file['CRC-32']; // 文件名,长度,CRC32,用于校验
- }
- }
- return $zipinfo;
- }
- /** 分析两个zip文件内容
- * @param String $zipinfo1
- * @param String $zipinfo2
- * @return Array
- */
- private function parse($zipinfo1, $zipinfo2){
- $result = array(
- 'add' => array(), // 新增
- 'del' => array(), // 缺少
- 'match' => array() // 匹配
- );
- if($zipinfo1 && $zipinfo2){
- // 在zip1但不在zip2的文件
- $result['add'] = array_values(array_diff(array_keys($zipinfo1), array_keys($zipinfo2)));
- // 在zip2但不在zip1的文件
- $result['del'] = array_values(array_diff(array_keys($zipinfo2), array_keys($zipinfo1)));
- // 同时在zip1与zip2的文件
- $match_file = array_values(array_diff(array_keys($zipinfo1), $result['add']));
- // 检查相同文件名的文件内容是否匹配
- for($i=0,$len=count($match_file); $i<$len; $i++){
- if($zipinfo1[$match_file[$i]]==$zipinfo2[$match_file[$i]]){ // match
- array_push($result['match'], $match_file[$i]);
- }else{ // not match, change to add
- array_push($result['add'], $match_file[$i]);
- }
- }
- }
- return $result;
- }
- /** 检查zip文件是否正确
- * @param String $zipfile zip文件
- * @return boolean
- */
- private function check($zipfile){
- // 文件存在且能解压
- return file_exists($zipfile) && shell_exec(sprintf('unzip -v %s | wc -l', $zipfile))>1;
- }
- //www.phpfensi.com
- /** 检查服务器是否有安装unzip
- * @return boolean
- */
- private function check_handler(){
- return strstr(shell_exec('unzip -v'), 'version')!='';
- }
- } // class end
- ?>
demo示例程序如下:
- <?php
- require "ZipCompare.class.php";
- $obj = new ZipCompare();
- $result = $obj->compare('test1.zip','test2.zip');
- print_r($result);
- ?>
执行后输出:
- Array
- (
- [add] => Array
- (
- [0] => 9.jpg
- )
- [del] => Array
- (
- [0] => 5.jpg
- [1] => 6.jpg
- [2] => 7.jpg
- [3] => 8.jpg
- )
- [match] => Array
- (
- [0] => 1.jpg
- [1] => 10.jpg
- [2] => 11.jpg
- [3] => 12.jpg
- [4] => 13.jpg
- [5] => 14.jpg
- [6] => 15.jpg
- [7] => 16.jpg
- [8] => 17.jpg
- [9] => 18.jpg
- [10] => 2.jpg
- [11] => 3.jpg
- [12] => 4.jpg
- )
- )
出处:http://www.phpfensi.com/php/20210414/14278.html
栏目列表
最新更新
nodejs爬虫
Python正则表达式完全指南
爬取豆瓣Top250图书数据
shp 地图文件批量添加字段
爬虫小试牛刀(爬取学校通知公告)
【python基础】函数-初识函数
【python基础】函数-返回值
HTTP请求:requests模块基础使用必知必会
Python初学者友好丨详解参数传递类型
如何有效管理爬虫流量?
SQL SERVER中递归
2个场景实例讲解GaussDB(DWS)基表统计信息估
常用的 SQL Server 关键字及其含义
动手分析SQL Server中的事务中使用的锁
openGauss内核分析:SQL by pass & 经典执行
一招教你如何高效批量导入与更新数据
天天写SQL,这些神奇的特性你知道吗?
openGauss内核分析:执行计划生成
[IM002]Navicat ODBC驱动器管理器 未发现数据
初入Sql Server 之 存储过程的简单使用
这是目前我见过最好的跨域解决方案!
减少回流与重绘
减少回流与重绘
如何使用KrpanoToolJS在浏览器切图
performance.now() 与 Date.now() 对比
一款纯 JS 实现的轻量化图片编辑器
关于开发 VS Code 插件遇到的 workbench.scm.
前端设计模式——观察者模式
前端设计模式——中介者模式
创建型-原型模式