美文网首页
性能优化

性能优化

作者: 斑驳的流年无法释怀 | 来源:发表于2018-08-20 16:55 被阅读939次

    CPU和GPU

    1. 在屏幕成像的过程中,CPU和GPU起着至关重要的作用
      • ==CPU==(Central Processing Unit,中央处理器)
        对象的创建和销毁、对象属性的调整、布局计算、文本的计算和排版、图片的格式转换和解码、图像的绘制(Core Graphics)
      • ==GPU==(Graphics Processing Unit,图形处理器)
        纹理的渲染

    在iOS中是双缓冲机制,有前帧缓存、后帧缓存

    image.png

    屏幕成像原理

    image.png

    卡顿产生的原因

    卡顿解决的主要思路

    • 尽可能减少CPU、GPU资源消耗
    • 按照60FPS的刷帧率,每隔16ms就会有一次VSync信号
    image.png

    卡顿优化 - CPU

    • 尽量用轻量级的对象,比如用不到事件处理的地方,可以考虑使用CALayer取代UIView
    • 不要频繁地调用UIView的相关属性,比如frame、bounds、transform等属性,尽量减少不必要的修改
    • 尽量提前计算好布局,在有需要时一次性调整对应的属性,不要多次修改属性
    • Autolayout会比直接设置frame消耗更多的CPU资源
    • 图片的size最好刚好跟UIImageView的size保持一致
    • 控制一下线程的最大并发数量
    • 尽量把耗时的操作放到子线程
    • 文本处理(尺寸计算、绘制)
    (void)text
    {
        // 文字计算
        [@"text" boundingRectWithSize:CGSizeMake(100, MAXFLOAT) options:NSStringDrawingUsesLineFragmentOrigin attributes:nil context:nil];
        
        // 文字绘制
        [@"text" drawWithRect:CGRectMake(100, 100, 100, 100) options:NSStringDrawingUsesLineFragmentOrigin attributes:nil context:nil];
    }
    
    • 图片处理(解码、绘制)

    异步解码

            // 获取CGImage
            CGImageRef cgImage = [UIImage imageNamed:@"timg"].CGImage;
    
            // alphaInfo
            CGImageAlphaInfo alphaInfo = CGImageGetAlphaInfo(cgImage) & kCGBitmapAlphaInfoMask;
            BOOL hasAlpha = NO;
            if (alphaInfo == kCGImageAlphaPremultipliedLast ||
                alphaInfo == kCGImageAlphaPremultipliedFirst ||
                alphaInfo == kCGImageAlphaLast ||
                alphaInfo == kCGImageAlphaFirst) {
                hasAlpha = YES;
            }
    
            // bitmapInfo
            CGBitmapInfo bitmapInfo = kCGBitmapByteOrder32Host;
            bitmapInfo |= hasAlpha ? kCGImageAlphaPremultipliedFirst : kCGImageAlphaNoneSkipFirst;
    
            // size
            size_t width = CGImageGetWidth(cgImage);
            size_t height = CGImageGetHeight(cgImage);
    
            // context
            CGContextRef context = CGBitmapContextCreate(NULL, width, height, 8, 0, CGColorSpaceCreateDeviceRGB(), bitmapInfo);
    
            // draw
            CGContextDrawImage(context, CGRectMake(0, 0, width, height), cgImage);
    
            // get CGImage
            cgImage = CGBitmapContextCreateImage(context);
    
            // into UIImage
            UIImage *newImage = [UIImage imageWithCGImage:cgImage];
    
            // release
            CGContextRelease(context);
            CGImageRelease(cgImage);
    
            // back to the main thread
            dispatch_async(dispatch_get_main_queue(), ^{
                self.imageView.image = newImage;
            });
        });
    

    卡顿优化 - GPU

    • 尽量避免短时间内大量图片的显示,尽可能将多张图片合成一张进行显示
    • GPU能处理的最大纹理尺寸是4096x4096,一旦超过这个尺寸,就会占用CPU资源进行处理,所以纹理尽量不要超过这个尺寸
    • 尽量减少视图数量和层次
    • 减少透明的视图(alpha<1),不透明的就设置opaque为YES
    • 尽量避免出现离屏渲染

    离屏渲染

    在OpenGL中,GPU有2种渲染方式

    • On-Screen Rendering:当前屏幕渲染,在当前用于显示的屏幕缓冲区进行渲染操作
    • Off-Screen Rendering:离屏渲染,在当前屏幕缓冲区以外新开辟一个缓冲区进行渲染操作

    离屏渲染消耗性能的原因

    • 需要创建新的缓冲区
    • 离屏渲染的整个过程,需要多次切换上下文环境,先是从当前屏幕(On-Screen)切换到离屏(Off-Screen);等到离屏渲染结束以后,将离屏缓冲区的渲染结果显示到屏幕上,又需要将上下文环境从离屏切换到当前屏幕

    哪些操作会触发离屏渲染?

    • 光栅化,layer.shouldRasterize = YES
    • 遮罩,layer.mask
    • 圆角,同时设置layer.masksToBounds = YES、 layer.cornerRadius大于0
      可以考虑通过CoreGraphics绘制裁剪圆角,或者叫美工提供圆角图片
    • 阴影,layer.shadowXXX
      如果设置了layer.shadowPath就不会产生离屏渲染

    卡顿检测

    • 平时所说的“卡顿”主要是因为在主线程执行了比较耗时的操作
    • 可以添加Observer到主线程RunLoop中,通过监听RunLoop状态切换的耗时,以达到监控卡顿的目的

    耗电的主要来源

    • CPU处理,Processing
    • 网络,Networking
    • 定位,Location
    • 图像,Graphics

    耗电优化

    1. 尽可能降低CPU、GPU功耗
    2. 少用定时器
    3. 优化I/O操作
    • 尽量不要频繁写入小数据,最好批量一次性写入
    • 读写大量重要数据时,考虑用dispatch_io,其提供了基于GCD的异步操作文件I/O的API。用dispatch_io系统会优化磁盘访问
    • 数据量比较大的,建议使用数据库(比如SQLite、CoreData)
    1. 网络优化
    • 减少、压缩网络数据
    • 如果多次请求的结果是相同的,尽量使用缓存
    • 使用断点续传,否则网络不稳定时可能多次传输相同的内容
    • 网络不可用时,不要尝试执行网络请求
    • 让用户可以取消长时间运行或者速度很慢的网络操作,设置合适的超时时间
    • 批量传输,比如,下载视频流时,不要传输很小的数据包,直接下载整个文件或者一大块一大块地下载。如果下载广告,一次性多下载一些,然后再慢慢展示。如果下载电子邮件,一次下载多封,不要一封一封地下载
    1. 定位优化
    • 如果只是需要快速确定用户位置,最好用CLLocationManager的requestLocation方法。定位完成后,会自动让定位硬件断电
    • 如果不是导航应用,尽量不要实时更新位置,定位完毕就关掉定位服务
    • 尽量降低定位精度,比如尽量不要使用精度最高的kCLLocationAccuracyBest
    • 需要后台定位时,尽量设置pausesLocationUpdatesAutomatically为YES,如果用户不太可能移动的时候系统会自动暂停位置更新
    • 尽量不要使用startMonitoringSignificantLocationChanges,优先考虑startMonitoringForRegion:
    1. 硬件检测优化

      用户移动、摇晃、倾斜设备时,会产生动作(motion)事件,这些事件由加速度计、陀螺仪、磁力计等硬件检测。在不需要检测的场合,应该及时关闭这些硬件

    启动优化

    APP的启动可以分为2种

    • 冷启动(Cold Launch):从零开始启动APP
    • 热启动(Warm Launch):APP已经在内存中,在后台存活着,再次点击图标启动APP

    APP启动时间的优化,主要是针对冷启动进行优化
    通过添加环境变量可以打印出APP的启动时间分析(Edit scheme -> Run -> Arguments)
    DYLD_PRINT_STATISTICS设置为1
    如果需要更详细的信息,那就将DYLD_PRINT_STATISTICS_DETAILS设置为1

    APP的冷启动可以概括为3大阶段

    • dyld
    • runtime
    • main
    image.png

    APP的启动 - dyld

    1. dyld(dynamic link editor),Apple的动态链接器,可以用来装载Mach-O文件(可执行文件、动态库等)

    2. 启动APP时,dyld所做的事情有

    • 装载APP的可执行文件,同时会递归加载所有依赖的动态库
    • 当dyld把可执行文件、动态库都装载完毕后,会通知Runtime进行下一步的处理

    APP的启动 - runtime

    1. 启动APP时,runtime所做的事情有
    • 调用map_images进行可执行文件内容的解析和处理
    • 在load_images中调用call_load_methods,调用所有Class和Category的+load方法
    • 进行各种objc结构的初始化(注册Objc类 、初始化类对象等等)
    • 调用C++静态初始化器和attribute((constructor))修饰的函数
    1. 到此为止,可执行文件和动态库中所有的符号(Class,Protocol,Selector,IMP,…)都已经按格式成功加载到内存中,被runtime 所管理

    APP的启动 - main

    • APP的启动由dyld主导,将可执行文件加载到内存,顺便加载所有依赖的动态库
    • 并由runtime负责加载成objc定义的结构
    • 所有初始化工作结束后,dyld就会调用main函数
    • 接下来就是UIApplicationMain函数,AppDelegate的application:didFinishLaunchingWithOptions:方法

    APP的启动优化

    按照不同的阶段

    dyld

    • 减少动态库、合并一些动态库(定期清理不必要的动态库)
    • 减少Objc类、分类的数量、减少Selector数量(定期清理不必要的类、分类)
    • 减少C++虚函数数量
    • Swift尽量使用struct

    runtime

    用+initialize方法和dispatch_once取代所有的attribute((constructor))、C++静态构造器、ObjC的+load

    main

    • 在不影响用户体验的前提下,尽可能将一些操作延迟,不要全部都放在finishLaunching方法中
    • 按需加载

    耗时检测:LXDAppFluecyMonitor

    冷启动400毫秒以内,才算是合理的

    实践

    • 主UI框架tabBarController的viewDidLoad函数里,去掉一些不必要的函数调用。
    • NSUserDefaults的synchronize函数尽量不要在启动流程中去调用,统一在APP进入后台,
      willTerminate和完全进入前台后把数据落地;

    检测启动耗时

    通过在工程的scheme中添加环境变量DYLD_PRINT_STATISTICS,设置值为1,App启动加载时Xcode的控制台就会有pre-main各个阶段的详细耗时输出

    1. 在main函数外生命变量extern CFAbsoluteTime htmi_startTime;
    2. 在main函数内部初始化htmi_startTime = CFAbsoluteTimeGetCurrent();
    3. 在Appdelegate文件中定义CFAbsoluteTime htmi_startTime;
    • - (BOOL)application:(UIApplication *)application didFinishLaunchingWithOptions:(NSDictionary *)launchOptions方法的最后添加如下代码
        dispatch_async(dispatch_get_main_queue(), ^{//这个dispatch_async中提交的工作会在app主线程启动后的下一个run lopp中运行,此时app已经完成了载入并且将要显示第一帧画面,也就是系统会运行到-[UIApplication _reportAppLaunchFinished]之前
            
            NSLog(@"完成启动 Lauched time = %f 秒",CFAbsoluteTimeGetCurrent() - htmi_startTime);
        });
    

    并不是什么任务都适合放子线程,有些任务在主线程大概10ms,放到子线程需要几百ms,因为某些任务内部可能会用到UIKit的api,或者某些操作是需要提交到主线程去执行的有些SDK并不见得适合放到子线程去初始化,需要具体情况具体去测试和分析。

    安装包瘦身

    • 安装包(IPA)主要由可执行文件、资源组成

    • 资源(图片、音频、视频等)

    • 采取无损压缩

    • 去除没有用到的资源:LSUnusedResources

    • 可执行文件瘦身

    • 编译器优化
      Strip Linked Product、Make Strings Read-Only、Symbols Hidden by Default设置为YES
      去掉异常支持,Enable C++ Exceptions、Enable Objective-C Exceptions设置为NO, Other C Flags添加-fno-exceptions

    • 利用AppCode检测未使用的代码:菜单栏 -> Code -> Inspect Code

    • 编写LLVM插件检测出重复代码、未被调用的代码

    LinkMap

    生成LinkMap文件,可以查看可执行文件的具体组成
    可借助第三方工具解析LinkMap文件:LinkMap

    image.png

    相关文章

      网友评论

          本文标题:性能优化

          本文链接:https://www.haomeiwen.com/subject/muhliftx.html