美文网首页程序员iOS plus
iOS APP安装包瘦身

iOS APP安装包瘦身

作者: senpaiLi | 来源:发表于2018-10-25 17:04 被阅读13次

    参考公众号:WeMobileDev

    APP开发中,总会想要去尽可能的优化项目,这是我们作为程序员最基本的追求之一。

    而安装包瘦身,是最能让用户感知的一类优化。大部分APP对用户来说是非必需品,但是如果安装包高达50多M,会吓退一大波的用户。

    而且,现在的APP追求小而精,小程序的火热也减少了传统APP的使用量,安装包瘦身迫在眉睫。

    AppStore安装包由资源和可执行文件两部分组成,安装包瘦身也是从这两部分入手。

    一、资源瘦身

    资源瘦身主要是去除无用资源或者压缩资源。
    资源主要包括图片、音频、视频、多语言包、配置文件等。

    无用资源指的是,项目中没有被引用的资源,找到的办法就是,去项目中搜索该文件名,图片资源去掉@2x,@3x,没有搜索到的就是无用资源。
    当然,资源名在项目中另外拼接的,特殊处理,所以一个APP最好有一个统一的拼接格式。

    压缩资源,一般指图片的压缩,图片资源控制在80k左右(@3x的全屏图片)
    还有就是配置文件的压缩,比如内置的离线资源等。

    二、Xcode's Link Map File

    在讲可执行文件瘦身之前先介绍Xcode的LinkMap文件。LinkMap文件是Xcode产生可执行文件的同时生成的链接信息,用来描述可执行文件的构造成分,包括代码段(__TEXT)和数据段(__DATA)的分布情况。只要设置Project->Build Settings->Write Link Map File为YES,并设置Path to Link Map File,build完后就可以在设置的路径看到LinkMap文件了:


    每个LinkMap由3个部分组成,以微信为例:
    1. Object files:

    [ 0] linker synthesized
    [ 1] /xxxx/WCPayInfoItem.o
    [ 2] /xxxx/GameCenterFriendRankCell.o
    [ 3] /xxxx/WloginTlv_0x168.o
    ...

    第一部分列举可执行文件里所有.obj文件,以及每个文件的编号。
    2. Sections:


    第二部分是可执行文件的段表,描述各个段在可执行文件中的偏移位置和大小。第一列是段的偏移量,第二列是段占用大小,Address(n)=Address(n-1)+Size(n-1);第三列是段类型,代码段和数据段;第四列是段名字,如__text是可执行机器码,__cstring是字符串常量。有关段的概念可参考苹果官方文档《OS X ABI Mach-O File Format Reference》

    3. Symbols:

    Address Size File Name
    0x100005A50 0x00000074 [ 1] +[WCPayInfoItem initialize]
    ...
    0x10231C120 0x00000018 [ 1] literal string: I16@?0@"WCPayInfoItem"8
    ...
    0x10252A41A 0x0000000E [ 1] literal string: WCPayInfoItem
    ...

    第三部分详细描述每个obj文件在每个段的分布情况,按第二部分Sections顺序展示。例如序号1的WCPayInfoItem.o文件,+[WCPayInfoItem initialize]方法在__TEXT.__text地址是0x100005A50,占用大小是116字节。根据序号累加每个obj文件在每个段的占用大小,从而计算出每个obj文件在可执行文件的占用大小,进而算出每个静态库、每个功能模块代码占用大小。这里要注意的地方是,由于__DATA.__bbs是代表未初始化的静态变量,Size表示应用运行时占用的堆大小,并不占用可执行文件,所以计算obj占用大小时,要排除这个段的Size。

    三、可执行文件瘦身

    回到我们的可执行文件瘦身问题,LinkMap文件可以帮助我们寻找优化点。

    1. 查找无用selector

    以往C++在链接时,没有被用到的类和方法是不会编进可执行文件里。但Objctive-C不同,由于它的动态性,它可以通过类名和方法名获取这个类和方法进行调用,所以编译器会把项目里所有OC源文件编进可执行文件里,哪怕该类和方法没有被使用到。

    结合LinkMap文件的__TEXT.__text,通过正则表达式([+|-][.+\s(.+)]),我们可以提取当前可执行文件里所有objc类方法和实例方法(SelectorsAll)。再使用otool命令otool -v -s __DATA __objc_selrefs逆向__DATA.__objc_selrefs段,提取可执行文件里引用到的方法名(UsedSelectorsAll),我们可以大致分析出SelectorsAll里哪些方法是没有被引用的(SelectorsAll-UsedSelectorsAll)。注意,系统API的Protocol可能被列入无用方法名单里,如UITableViewDelegate的方法,我们只需要对这些Protocol里的方法加入白名单过滤即可。

    另外第三方库的无用selector也可以这样扫出来的。

    2. 查找无用oc类

    查找无用oc类有两种方式,一种是类似于查找无用资源,通过搜索"[ClassName alloc/new"、"*ClassName "、"[ClassName class]"等关键字在代码里是否出现。另一种是通过otool命令逆向__DATA.__objc_classlist段和__DATA.__objc_classrefs段来获取当前所有oc类和被引用的oc类,两个集合相减就是无用oc类。

    3. 扫描重复代码

    可以利用第三方工具simian扫描。南非支付copy代码就是这样被发现的。但除此成果之外,扫描出来的结果过多,重构起来也不方便,不如砍功能需求效果好。

    4. protobuf精简改造

    protobuf是Google推出的一种轻量高效的结构化数据存储格式,在微信用于网络协议和本地文件序列化。但google默认工具生成的代码比较冗余,像序列化、反序列化、计算序列化大小等方法都生成在具体的pb类里,每个类的实现大同小异。通过代码分析以及结合protobuf原理,要想把这些方法抽象到基类,派生类提供每个字段相关信息就够了:

    • field number

    • field label, optional, required or repeated

    • wire type, double, float, int, etc

    • 是否packed

    • repeated的数据类型

    <pre>

    typedef struct {
    Byte _fieldNumber;
    Byte _fieldLabel;
    Byte _fieldType;
    BOOL _isPacked;
    int _enumInitValue;
    union {
    __unsafe_unretained NSString* _messageClassName;
    __unsafe_unretained Class _messageClass; // ClassName对应的Class
    IsEnumValidFunc _isEnumValidFunc; // 检测枚举值是否合法函数指针
    };
    } PBFieldInfo;

    </pre>

    另外通过无用selector列表,发现不少pb类属性的getter或setter没有被使用。原先的pb类属性是用@synthesize修饰,编译器会自动生成getter和setter。如果不想编译器生成,则要用@dynamic。甚至我们可以把pb类的成员变量去掉。做法如下:

    • 基类增加id类型数组ivarValues(参考了objc_class结构体ivars做法),用于存放对象的属性值。对象属性值统一用oc对象表示,如果类型是基础类型(primitive,如int、float等),则用NSValue存

    • 重载methodSignatureForSelector:方法,返回属性getter、setter的方法签名

    • 重载forwardInvocation:方法,分析invocation.selector类型。如果是getter,从ivarValues获取属性值并设置为invocation的returnValue;如果是setter,从invocation第二个argument获取属性值,并存放到ivarValues里

    • 重载setValue:forUndefinedKey:valueForUndefinedKey:,防止通过KVO访问属性Crash

    • 做下性能优化,如pb类在initialize做一次初始化,缓存属性名的hash值,属性的getter、setter方法的objcType等;属性值不用std::map(属性名->属性值),而是改用数组;MRC代替ARC(有些时候ARC自动添加的retain/release挺影响性能的);等等

    <pre style="">

    `class PBClassInfo {
    public:
    PBClassInfo(Class cls, PBFieldInfo* fieldInfo);
    ~PBClassInfo();

    public:
    unsigned int _numberOfProperty;
    std::string* _propertyNames;
    size_t* _propertyNameHashes;
    std::string* _getterObjCTypes;
    std::string* _setterObjCTypes;

    PBFieldInfo* _fieldInfos;
    

    };

    @interface WXPBGeneratedMessage () {
    uint32_t has_bits[3]; // 最多96个属性,表示属性是否有赋值
    int32_t _serializedSize;
    PBClassInfo* _classInfo;
    id* _ivarValues;
    }

    • (NSMethodSignature*) methodSignatureForSelector:(SEL) aSelector;
    • (void) forwardInvocation:(NSInvocation*) anInvocation;
    • (void) setValue:(id) value forUndefinedKey:(NSString*) key;
    • valueForUndefinedKey:(NSString*) key;
      @end`

    </pre>

    把冗余代码去掉后,整个类清爽多了。像GameResourceReq只有3个属性的proto结构体,类方法代码行数由以前的127行变成现在的8行。protobuf精简改造中,精简类方法减少了可执行文件8.8M,去掉类成员变量和类属性改用@dynamic减少了2.5M。

    <pre style="">

    message GameResourceReq { required BaseRequest BaseRequest = 1; required int32 PropsCount = 2; repeated uint32 PropsIdList = 3[packed=true]; }

    </pre>

    <pre style="">

    `// 老实现
    @implementation GameResourceReq

    @synthesize hasBaseRequest;
    @synthesize baseRequest;
    @synthesize hasPropsCount;
    @synthesize propsCount;
    @synthesize mutablePropsIdListList;
    @dynamic propsIdList;

    • (id) init {...}
    • (void) SetBaseRequest:(BaseRequest*) value {...}
    • (void) SetPropsCount:(int32_t) value {...}
    • (NSArray*) propsIdListList {...}
    • (NSMutableArray*)propsIdList {...}
    • (void)setPropsIdList:(NSMutableArray*) values {...}
    • (BOOL) isInitialized {...}
    • (void) writeToCodedOutputStream:(PBCodedOutputStream*) output {...}
    • (int32_t) serializedSize {...}
    • (GameResourceReq) parseFromData:(NSData) data {...}
    • (GameResourceReq) mergeFromCodedInputStream:(PBCodedInputStream) input {...}
    • (void) addPropsIdList:(uint32_t) value {...}
    • (void) addPropsIdListFromArray:(NSArray*) values {...}
      @end`

    </pre>

    <pre style="">

    `// 新实现
    @implementation GameResourceReq

    PB_PROPERTY_TYPE baseRequest;
    PB_PROPERTY_TYPE opType;
    PB_PROPERTY_TYPE brandUserName;

    • (void) initialize {
      static PBFieldInfo _fieldInfoArray[] = {
      {1, FieldLabelRequired, FieldTypeMessage, NO, 0, ._messageClassName = STRING_FROM(BaseRequest)},
      {2, FieldLabelRequired, FieldTypeInt32, NO, 0, 0},
      {3, FieldLabelRepeated, FieldTypeUint32, NO, 0, 0},
      };
      initializePBClassInfo(self, _fieldInfoArray);
      }
      @end`

    </pre>

    5. 编译选项优化

    • Strip Link Product设成YES,WeChatWatch可执行文件减少0.3M

    • Make Strings Read-Only设为YES,也许是因为微信工程从低版本Xcode升级过来,这个编译选项之前一直为NO,设为YES后可执行文件减少了3M

    • 去掉异常支持,Enable C++ Exceptions和Enable Objective-C Exceptions设为NO,并且Other C Flags添加-fno-exceptions,可执行文件减少了27M,其中__gcc_except_tab段减少了17.3M,__text减少了9.7M,效果特别明显。可以对某些文件单独支持异常,编译选项加上-fexceptions即可。但有个问题,假如ABC三个文件,AC文件支持了异常,B不支持,如果C抛了异常,在模拟器下A还是能捕获异常不至于Crash,但真机下捕获不了(有知道原因可以在下面留言:)。去掉异常后,Appstore后续几个版本Crash率没有明显上升。个人认为关键路径支持异常处理就好,像启动时NSCoder读取setting配置文件得要支持捕获异常,等等

    6. 其他可探索途径

    • iOS8 Embed-Framework:提取WeChatWatch、ShareExtention和微信主工程的公共代码,可执行文件可以减少5M+,不过这特性需要最低版本iOS8才能用,iOS7设备启动会crash

    • iOS9 App Thinning:严格来说App Thinning不会让安装包变小,但用户安装应用时,苹果会根据用户的机型自动选择合适的资源和对应CPU架构的二进制执行文件(也就是说用户本地可执行文件不会同时存在armv7和arm64),安装后空间占用更小

    7. 建立监控

    通过对LinkMap文件的分析,可以得知每个模块可执行文件占用大小。再对比两个版本,就知道业务模块的增量大小。参考如下:

    image

    相关文章

      网友评论

        本文标题:iOS APP安装包瘦身

        本文链接:https://www.haomeiwen.com/subject/gedctqtx.html