美文网首页
底层原理:性能优化

底层原理:性能优化

作者: 飘摇的水草 | 来源:发表于2022-01-05 18:48 被阅读0次

    CPU和GPU

    在屏幕成像的过程中,CPU和GPU起着至关重要的作用。

    • CPU(中央处理器):一个对象的创建和销毁,allocinitrelease都是通过CPU来做的,还有对象属性的调整frame,bounds布局计算、文本的计算和排版、图片的编码和解码、图像的绘制(Core Graphics)等。
    • GPU(图形处理器):纹理的渲染,主要与 openGL 有关,纹理就是用来渲染显示到我们屏幕上的数据而已
    • 屏幕上显示的数据是由CPU和GPU共同合作完成的,CPU先计算好要显示的数据,然后将数据提交给GPU,只有通过GPU的渲染过的东西才能显示到屏幕上,也就是说CPU计算出来的这些数据是无法直接显示到屏幕上的,渲染的时候放到一个缓冲区,也就是帧缓存,然后会从缓存区读取数据,将读取的数据放到一个视屏控制器的部件里,视屏控制器会将读取的数据显示至屏幕上,就完成了一个完整的流程。
    • iOS中是双缓冲机制,有前帧缓冲,后帧缓冲

    屏幕成像原理

    在iOS中的屏幕成像是由许多帧共同组成的。每一帧都会由屏幕先发出一个垂直同步信号,,然后再发出很多行水平同步信号,,每一行水平同步信号表示处理完一行的数据,直到屏幕发完所有的水平同步信号,表示这一帧的数据全部处理完成了,再会进行下一轮的垂直同步信号

    • 垂直同步信号(VSync
    • 一页画面也叫一帧
      一旦发出垂直同步信号就表示即将要显示一页的数据,即一帧数据,然后发出一个水平同步信号(HSync),如果画满一行则继续画第二行,最后一行画完则继续发出垂直同步信号

    卡顿产生的原因

    垂直同步信号一旦过来就要将数据显示到屏幕上,如果此时数据还没有计算好,则就会将上一帧的数据显示出来,当前没有计算好的这一帧数据就丢失了,俗称:丢帧,掉帧,丢的这一帧数据等待下一次垂直同步信号过来才显示,中间隔的时间比较长,于是就卡顿。因此解决卡顿的主要思路就是:尽可能减少CPU、GPU的资源消耗,按照60FPS的刷帧率,每隔16ms就会有一次VSync信号,即16ms之内完成CPU和GPU的渲染操作,否则会出现掉帧

    卡顿优化

    • 尽量使用轻量级的对象,比如用不到事件处理的地方,可以考虑使用CALayer取代UIView
    • 不要频繁地调用UIView的相关属性,比如frameboundstransform等属性,因为一旦你调整了就需要重新计算,因此尽量避免不必要的修改
    • 尽量提前计算好布局,在有需要时一次性调整对应的属性,不要多次修改属性
    • AutoLayOut会比直接设置frame消耗更多的cpu资源
    • 图片的size最好刚好和UIImageViewsize保持一致
    • 控制一下线程的最大并发数量
    • 尽量把耗时性的操作放到子线程里(如文本计算、绘制:label计算高度,图片解码、绘制),文本处理如下所示:
    // 文本计算
    [@"text" boundingRectWithSize:CGSizeMake(100, MAXFLOAT) options:NSStringDrawingUsesLineFragmentOrigin attributes:nil context:nil];
        
    // 文字绘制
    [@"text" drawWithRect:CGRectMake(0, 0, 100, 100) options:NSStringDrawingUsesLineFragmentOrigin attributes:nil context:nil];
    

    图片处理如下所示:

    // imageNamed:底层会进行对图片的解码和绘制
    UIImageView *imageView = [[UIImageView alloc] init];
    imageView.image = [UIImage imageNamed:@"timg"];
    dispatch_async(dispatch_get_global_queue(0, 0), ^{
        // 获取CGImage
        CGImageRef cgImage = [UIImage imageNamed:@"timg"].CGImage;
    
        // alphaInfo
        CGImageAlphaInfo alphaInfo = CGImageGetAlphaInfo(cgImage) & kCGBitmapAlphaInfoMask;
        BOOL hasAlpha = NO;
        if (alphaInfo == kCGImageAlphaPremultipliedLast ||
            alphaInfo == kCGImageAlphaPremultipliedFirst ||
            alphaInfo == kCGImageAlphaLast ||
            alphaInfo == kCGImageAlphaFirst) {
            hasAlpha = YES;
        }
    
        // bitmapInfo
        CGBitmapInfo bitmapInfo = kCGBitmapByteOrder32Host;
        bitmapInfo |= hasAlpha ? kCGImageAlphaPremultipliedFirst : kCGImageAlphaNoneSkipFirst;
    
        // size
        size_t width = CGImageGetWidth(cgImage);
        size_t height = CGImageGetHeight(cgImage);
    
        // context
        CGContextRef context = CGBitmapContextCreate(NULL, width, height, 8, 0, CGColorSpaceCreateDeviceRGB(), bitmapInfo);
    
        // draw
        CGContextDrawImage(context, CGRectMake(0, 0, width, height), cgImage);
    
        // get CGImage
        cgImage = CGBitmapContextCreateImage(context);
    
        // into UIImage
        UIImage *newImage = [UIImage imageWithCGImage:cgImage];
    
        // release
        CGContextRelease(context);
        CGImageRelease(cgImage);
    
        // back to the main thread
        dispatch_async(dispatch_get_main_queue(), ^{
            self.imageView.image = newImage;
        });
    });
    
    • 尽量减少视图的数量和层次
    • 尽量避免短时间内大量图片的显示,尽可能将多张图片合成一张进行显示
    • GPU能处理的最大纹理尺寸是4096 * 4096,一旦超过这个尺寸,就会占用CPU资源进行处理,所以纹理尽量不要超过这个尺寸
    • 减少透明的视图(alpha < 1),不透明的就设置opaque为yes。一旦出现透明度则需要计算混合时的颜色
    • 尽量避免出现离屏渲染

    卡顿检测

    • 平时所说的“卡顿”主要是因为在主线程执行了耗时性的操作
    • 可以通过监听Observer到主线程RunLoop中,通过监听RunLoop状态切换的耗时,以此来监控卡顿的目的,可以使用第三方库检测:LXAppFluencyMonitor 检测

    离屏渲染

    1. 在OpenGL中,GPU有2种渲染方式
    • On-Screen Rendering:当前屏幕渲染,在当前用于显示的屏幕缓冲区进行渲染操作
    • Off-Screen Rendering:离屏渲染,在当前屏幕缓冲区以外新开辟一个缓冲区进行渲染操作,新开辟的那个缓冲区的数据是不能直接拿来显示在屏幕上的,之所以会出现离屏渲染是因为做的那些操作比较耗性能,即当前用于显示的缓冲区不够用,即使前后两个不够用,所以才会出现离屏渲染,所以只要出现离屏渲染则代表一定耗性能
    1. 离屏渲染消耗性能的原因:
    • 需要创建新的缓冲区
    • 离屏渲染的整个过程,需要多次切换上下文环境,先是从当前屏幕(On-Screen)切换到离屏(Off-Screen),等到离屏渲染结束以后,将离屏缓冲区的渲染结果显示到屏幕上,又需要将上下文环境从离屏切换到当前屏幕。
    1. 哪些操作可以触发离屏渲染?
    • 光栅化,layer.shouldRasterize = YES,最好设置为NO
    • 遮罩,layer.mask
    • 圆角 ,同时设置layer.masksToBounds = YESlayer.cornerRadius大于0,要同时满足,可以考虑通过CoreGraphics绘制裁剪圆角,或者叫美工提供圆角图片
    • 阴影,layer.shadowXXX,如果设置了layer.shadowPath就不会产生离屏渲染

    耗电

    1. 耗电的主要来源:
    • CPU处理,Processing
    • 网络,Networking( XML 数据量大,因此目前都使用的是 JSON ,还有一些公司使用的是 protocol buffer
    • 定位,Location
    • 图像,Graphics
    1. 耗电优化
    • 尽可能降低CPU、GPU功耗

    • 少用定时器

    • 优化I/O操作,即文件操作

      • 尽量不要频繁写入小数据,最好批量一次性写入
      • 读写大量重要数据时,考虑用dispatch_io,其提供了基于GCD的异步操作文件I/O的API,用dispatch_io系统会优化磁盘访问。
      • 数据量比较大时,建议使用数据库(比如SQLiteCoreData),不要使用UserDefaults
    • 网络优化(减少、压缩网络数据)

    1. XML体积比较大,JSON体积比较小,现在有公司用protocol buffer
    2. 如果多次请求的结果是相同的,尽量使用缓存(NSCache
    3. 尽量使用断点续传,否则网络不稳定时可能多次传输相同的内容
    4. 网络不可用时,不要尝试执行网络请求
    5. 让用户可以取消长时间运行或者速度很慢的网络操作,设置合适的超时时间
    6. 批量传输,比如,下载视频流时,不要传输很小的数据包,直接下载整个文件或者一大块一大块地下载,如果下载广告,一次性多下载一些,然后再慢慢展示,如果下载电子邮件,一次下载多封,不要一封一封地下载
    • 定位优化:如果只是需要快速确定用户位置,最好用CLLocationManagerrequestLocation方法,定位完成后,会自动让定位硬件断电,而有些方法是实时更新位置。如果不是导航应用,尽量不要实时更新位置,定位完毕就关掉定位服务。尽量降低定位精度 ,比如尽量不要使用精度最高的CLLocationAccuracyBest
      需要后台定位时,尽量设置pauseLocationUpdatesAutomatically为YES,如果用户不太可能移动的时候系统会自动暂停位置更新

    启动优化

    1. app的启动可以分为两种:
    • 冷启动(Code Launch):从零开始启动APP
    • 热启动(Warm Launch):APP已经在内存中,在后台存活着,再次点击图标启动APP
    1. APP启动时间的优化,主要是针对冷启动的优化

    2. 通过添加环境变量可以打印出APP的启动时间分析(Edit scheme - > Run - > Arguments

    • Environment Variables里添加DYLD_PRINT_STATISTICS设置为1
    • 如果需要更加详细的信息,那就将DYLD_PRINT_STATISTICS_DETAILS设置为1
    1. APP的冷启动可以概括为3大阶段
    • dyld
    • runtime
    • main
    1. dyld(dynamic link editor),Apple的动态链接器,可以用来装载Mach-O文件(可执行文件、动态库等),是在刚点击图标的时候执行
    • 启动APP时,dyld所做的事情有:

      • 装载APP的可执行文件,同时会递归加载所有依赖的动态库
      • 当dyld把可执行文件、动态库都装载完毕后,会通知Runtime进行下一步的处理
    • 启动APP时,runtime所做的事情有

      • 调用map_images进行可执行文件内容的解析和处理
      • load_images中调用call_load_methods,调用所有Class和Category的+load方法
      • 进行各种objc结构的初始化(注册Objc类、初始化类对象等等)
      • 调用C++静态初始化器和_attribute_((constructor))修饰的函数
    • 到此为止,可执行文件和动态库中所有的符号(ClassProtocolSelectorIMP,……),都已经按格式成功加载到内存中,被runtime所管理

    • 总结一下

      • APP的启动由dyld主导,将可执行文件加载到内存,顺便加载所有依赖的动态库
      • 并由runtime负责加载成objc定义的结构
      • 所有初始化工作结束后,dyld就会调用main函数
      • 接下来就是UIApplicationMain函数,AppDelegateapplicationcdidFinishLaunchingWithOptions方法
    启动优化方案
    • 按照不同阶段
      1. dyld

        • 减少动态库、合并一些动态库(定期清理不必要的动态库)
        • 减少Objc类、分类的数量、减少Selector数量(定期清理不必要的类、分类)
        • 减少C++虚函数数量
        • Swift尽量使用struct
      2. runtime

        • +initialize方法和dispatch_once取代所有的_attribute__((constructor))、C++静态构造器、ObjC的+load
      3. main

        • 在不影响用户体验的前提下,尽可能将一些操作延迟,不要全部都放在finishLaunching方法中

    安装包瘦身

    • 安装包(ipa)主要由可执行文件、资源组成,可执行文件就是指的代码
    • 资源(图片、音频、视频等)
      • 图片采取无损压缩
      • 去除没有用到的资源:LSUnusedResources
    • 编译器优化
      • Strip Linked ProductMake Strings Read-OnlySymbols Hidden by Default设置为YES
      • 去掉异常支持,Enable C++ ExceptionsEnabled Objective-C Exception设置为NO,Other C Flags添加-fno-exceptions
    • 利用AppCode(https://www.jetbrains.com/objc/)检测未使用的代码:菜单栏 - > Code - > Inspect Code
    • 编写LLVM插件检测出重复代码,未被调用的代码
    • 生成LinkMap文件,可以查看可执行文件的具体组成,Build Setting - > Write Link Map File设置为YES,同时在Path to Link Map File里输入写入的.txt文件的地址

    相关文章

      网友评论

          本文标题:底层原理:性能优化

          本文链接:https://www.haomeiwen.com/subject/ptjhfrtx.html