底层原理：性能优化

作者: 飘摇的水草 | 来源:发表于2022-01-05 18:48 被阅读0次

CPU和GPU

在屏幕成像的过程中，CPU和GPU起着至关重要的作用。

CPU（中央处理器）：一个对象的创建和销毁，alloc、init、release都是通过CPU来做的，还有对象属性的调整frame,bounds布局计算、文本的计算和排版、图片的编码和解码、图像的绘制（Core Graphics）等。
GPU（图形处理器）：纹理的渲染，主要与 openGL 有关，纹理就是用来渲染显示到我们屏幕上的数据而已
屏幕上显示的数据是由CPU和GPU共同合作完成的，CPU先计算好要显示的数据，然后将数据提交给GPU，只有通过GPU的渲染过的东西才能显示到屏幕上，也就是说CPU计算出来的这些数据是无法直接显示到屏幕上的，渲染的时候放到一个缓冲区，也就是帧缓存，然后会从缓存区读取数据，将读取的数据放到一个视屏控制器的部件里，视屏控制器会将读取的数据显示至屏幕上，就完成了一个完整的流程。
iOS中是双缓冲机制，有前帧缓冲，后帧缓冲

屏幕成像原理

在iOS中的屏幕成像是由许多帧共同组成的。每一帧都会由屏幕先发出一个垂直同步信号，，然后再发出很多行水平同步信号，，每一行水平同步信号表示处理完一行的数据，直到屏幕发完所有的水平同步信号，表示这一帧的数据全部处理完成了，再会进行下一轮的垂直同步信号

垂直同步信号（VSync）
一页画面也叫一帧
一旦发出垂直同步信号就表示即将要显示一页的数据，即一帧数据，然后发出一个水平同步信号（HSync），如果画满一行则继续画第二行，最后一行画完则继续发出垂直同步信号

卡顿产生的原因

垂直同步信号一旦过来就要将数据显示到屏幕上，如果此时数据还没有计算好，则就会将上一帧的数据显示出来，当前没有计算好的这一帧数据就丢失了，俗称：丢帧，掉帧，丢的这一帧数据等待下一次垂直同步信号过来才显示，中间隔的时间比较长，于是就卡顿。因此解决卡顿的主要思路就是：尽可能减少CPU、GPU的资源消耗，按照60FPS的刷帧率，每隔16ms就会有一次VSync信号，即16ms之内完成CPU和GPU的渲染操作，否则会出现掉帧

卡顿优化

尽量使用轻量级的对象，比如用不到事件处理的地方，可以考虑使用CALayer取代UIView
不要频繁地调用UIView的相关属性，比如frame，bounds，transform等属性，因为一旦你调整了就需要重新计算，因此尽量避免不必要的修改
尽量提前计算好布局，在有需要时一次性调整对应的属性，不要多次修改属性
AutoLayOut会比直接设置frame消耗更多的cpu资源
图片的size最好刚好和UIImageView的size保持一致
控制一下线程的最大并发数量
尽量把耗时性的操作放到子线程里（如文本计算、绘制：label计算高度，图片解码、绘制），文本处理如下所示：

// 文本计算
[@"text" boundingRectWithSize:CGSizeMake(100, MAXFLOAT) options:NSStringDrawingUsesLineFragmentOrigin attributes:nil context:nil];
    
// 文字绘制
[@"text" drawWithRect:CGRectMake(0, 0, 100, 100) options:NSStringDrawingUsesLineFragmentOrigin attributes:nil context:nil];

图片处理如下所示：

// imageNamed：底层会进行对图片的解码和绘制
UIImageView *imageView = [[UIImageView alloc] init];
imageView.image = [UIImage imageNamed:@"timg"];
dispatch_async(dispatch_get_global_queue(0, 0), ^{
    // 获取CGImage
    CGImageRef cgImage = [UIImage imageNamed:@"timg"].CGImage;

    // alphaInfo
    CGImageAlphaInfo alphaInfo = CGImageGetAlphaInfo(cgImage) & kCGBitmapAlphaInfoMask;
    BOOL hasAlpha = NO;
    if (alphaInfo == kCGImageAlphaPremultipliedLast ||
        alphaInfo == kCGImageAlphaPremultipliedFirst ||
        alphaInfo == kCGImageAlphaLast ||
        alphaInfo == kCGImageAlphaFirst) {
        hasAlpha = YES;
    }

    // bitmapInfo
    CGBitmapInfo bitmapInfo = kCGBitmapByteOrder32Host;
    bitmapInfo |= hasAlpha ? kCGImageAlphaPremultipliedFirst : kCGImageAlphaNoneSkipFirst;

    // size
    size_t width = CGImageGetWidth(cgImage);
    size_t height = CGImageGetHeight(cgImage);

    // context
    CGContextRef context = CGBitmapContextCreate(NULL, width, height, 8, 0, CGColorSpaceCreateDeviceRGB(), bitmapInfo);

    // draw
    CGContextDrawImage(context, CGRectMake(0, 0, width, height), cgImage);

    // get CGImage
    cgImage = CGBitmapContextCreateImage(context);

    // into UIImage
    UIImage *newImage = [UIImage imageWithCGImage:cgImage];

    // release
    CGContextRelease(context);
    CGImageRelease(cgImage);

    // back to the main thread
    dispatch_async(dispatch_get_main_queue(), ^{
        self.imageView.image = newImage;
    });
});

尽量减少视图的数量和层次
尽量避免短时间内大量图片的显示，尽可能将多张图片合成一张进行显示
GPU能处理的最大纹理尺寸是4096 * 4096，一旦超过这个尺寸，就会占用CPU资源进行处理，所以纹理尽量不要超过这个尺寸
减少透明的视图（alpha < 1）,不透明的就设置opaque为yes。一旦出现透明度则需要计算混合时的颜色
尽量避免出现离屏渲染

卡顿检测

平时所说的“卡顿”主要是因为在主线程执行了耗时性的操作
可以通过监听Observer到主线程RunLoop中，通过监听RunLoop状态切换的耗时，以此来监控卡顿的目的，可以使用第三方库检测：LXAppFluencyMonitor 检测

离屏渲染

在OpenGL中，GPU有2种渲染方式

On-Screen Rendering：当前屏幕渲染，在当前用于显示的屏幕缓冲区进行渲染操作
Off-Screen Rendering：离屏渲染，在当前屏幕缓冲区以外新开辟一个缓冲区进行渲染操作，新开辟的那个缓冲区的数据是不能直接拿来显示在屏幕上的，之所以会出现离屏渲染是因为做的那些操作比较耗性能，即当前用于显示的缓冲区不够用，即使前后两个不够用，所以才会出现离屏渲染，所以只要出现离屏渲染则代表一定耗性能

离屏渲染消耗性能的原因：

需要创建新的缓冲区
离屏渲染的整个过程，需要多次切换上下文环境，先是从当前屏幕(On-Screen)切换到离屏（Off-Screen），等到离屏渲染结束以后，将离屏缓冲区的渲染结果显示到屏幕上，又需要将上下文环境从离屏切换到当前屏幕。

哪些操作可以触发离屏渲染？

光栅化，layer.shouldRasterize = YES，最好设置为NO
遮罩，layer.mask
圆角，同时设置layer.masksToBounds = YES，layer.cornerRadius大于0，要同时满足，可以考虑通过CoreGraphics绘制裁剪圆角，或者叫美工提供圆角图片
阴影，layer.shadowXXX，如果设置了layer.shadowPath就不会产生离屏渲染

耗电

耗电的主要来源：

CPU处理，Processing
网络，Networking（ XML 数据量大，因此目前都使用的是 JSON ，还有一些公司使用的是 protocol buffer ）
定位，Location
图像，Graphics

耗电优化

尽可能降低CPU、GPU功耗
少用定时器
优化I/O操作，即文件操作
- 尽量不要频繁写入小数据，最好批量一次性写入
- 读写大量重要数据时，考虑用dispatch_io，其提供了基于GCD的异步操作文件I/O的API，用dispatch_io系统会优化磁盘访问。
- 数据量比较大时，建议使用数据库（比如SQLite、CoreData），不要使用UserDefaults
网络优化（减少、压缩网络数据）

XML体积比较大，JSON体积比较小，现在有公司用protocol buffer

如果多次请求的结果是相同的，尽量使用缓存（NSCache）

尽量使用断点续传，否则网络不稳定时可能多次传输相同的内容

网络不可用时，不要尝试执行网络请求

让用户可以取消长时间运行或者速度很慢的网络操作，设置合适的超时时间

批量传输，比如，下载视频流时，不要传输很小的数据包，直接下载整个文件或者一大块一大块地下载，如果下载广告，一次性多下载一些，然后再慢慢展示，如果下载电子邮件，一次下载多封，不要一封一封地下载

定位优化：如果只是需要快速确定用户位置，最好用CLLocationManager的requestLocation方法，定位完成后，会自动让定位硬件断电，而有些方法是实时更新位置。如果不是导航应用，尽量不要实时更新位置，定位完毕就关掉定位服务。尽量降低定位精度，比如尽量不要使用精度最高的CLLocationAccuracyBest
需要后台定位时，尽量设置pauseLocationUpdatesAutomatically为YES，如果用户不太可能移动的时候系统会自动暂停位置更新

启动优化

app的启动可以分为两种：

冷启动（Code Launch）：从零开始启动APP
热启动（Warm Launch）：APP已经在内存中，在后台存活着，再次点击图标启动APP

APP启动时间的优化，主要是针对冷启动的优化
通过添加环境变量可以打印出APP的启动时间分析（Edit scheme - > Run - > Arguments）

在Environment Variables里添加DYLD_PRINT_STATISTICS设置为1
如果需要更加详细的信息，那就将DYLD_PRINT_STATISTICS_DETAILS设置为1

APP的冷启动可以概括为3大阶段

dyld
runtime
main

dyld(dynamic link editor)，Apple的动态链接器，可以用来装载Mach-O文件（可执行文件、动态库等），是在刚点击图标的时候执行

启动APP时，dyld所做的事情有：
- 装载APP的可执行文件，同时会递归加载所有依赖的动态库
- 当dyld把可执行文件、动态库都装载完毕后，会通知Runtime进行下一步的处理
启动APP时，runtime所做的事情有
- 调用map_images进行可执行文件内容的解析和处理
- 在load_images中调用call_load_methods，调用所有Class和Category的+load方法
- 进行各种objc结构的初始化（注册Objc类、初始化类对象等等）
- 调用C++静态初始化器和_attribute_((constructor))修饰的函数
到此为止，可执行文件和动态库中所有的符号（Class，Protocol，Selector，IMP，……），都已经按格式成功加载到内存中，被runtime所管理
总结一下
- APP的启动由dyld主导，将可执行文件加载到内存，顺便加载所有依赖的动态库
- 并由runtime负责加载成objc定义的结构
- 所有初始化工作结束后，dyld就会调用main函数
- 接下来就是UIApplicationMain函数，AppDelegate的applicationcdidFinishLaunchingWithOptions方法

启动优化方案

按照不同阶段
1. dyld
  - 减少动态库、合并一些动态库（定期清理不必要的动态库）
  - 减少Objc类、分类的数量、减少Selector数量（定期清理不必要的类、分类）
  - 减少C++虚函数数量
  - Swift尽量使用struct
2. runtime
  - 用+initialize方法和dispatch_once取代所有的_attribute__((constructor))、C++静态构造器、ObjC的+load
3. main
  - 在不影响用户体验的前提下，尽可能将一些操作延迟，不要全部都放在finishLaunching方法中

安装包瘦身

安装包（ipa）主要由可执行文件、资源组成，可执行文件就是指的代码
资源（图片、音频、视频等）
- 图片采取无损压缩
- 去除没有用到的资源：LSUnusedResources
编译器优化
- Strip Linked Product、Make Strings Read-Only、Symbols Hidden by Default设置为YES
- 去掉异常支持，Enable C++ Exceptions、Enabled Objective-C Exception设置为NO，Other C Flags添加-fno-exceptions
利用AppCode(https://www.jetbrains.com/objc/)检测未使用的代码：菜单栏 - > Code - > Inspect Code
编写LLVM插件检测出重复代码，未被调用的代码
生成LinkMap文件，可以查看可执行文件的具体组成，Build Setting - > Write Link Map File设置为YES，同时在Path to Link Map File里输入写入的.txt文件的地址

可借助第三方工具解析LinkMap的文件：https://github.com/huanxsd/LinkMap，这样可以看出具体哪个类占用多大的空间。

底层原理：性能优化

CPU和GPU

屏幕成像原理

卡顿产生的原因

卡顿优化

卡顿检测

离屏渲染

耗电

启动优化

启动优化方案

安装包瘦身

相关文章

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读