美文网首页
零碎知识记录

零碎知识记录

作者: 雨夜都行 | 来源:发表于2021-05-27 11:43 被阅读0次

    1. 怎么实现高可用的架构:

    • 通信模型
      NIO
    • 多活模式
    • 减少组件依赖 (核心接口不强依赖非核心接口,需要有相应预案策略,比如降级或者熔断)
      降低由于引入第三方依赖服务导致的服务不可用问题
    • 去中心化
      减少复杂性?选举过程会导致STW?
    • 容灾机制
      主备、数据备份

    2. 定时/延时任务

    3. vim命令总结:

    • gg跳到第一行
    • shift+g跳到最后一行
    • /xxx 匹配某一字符串

    4. linux命令

    • find 文件名(支持模糊匹配) |xargs grep -ri 指定字符 -l :查找指定字符在文件中是否有出现,并且只返回满足条件的文件的文件名
    • awk '{print 1,2..}',用于文本分析,默认空格、制表符为分隔符,0输出整行,1输出第一个被分隔的字符串,以此类推$2...

    5. arthas命令

    每隔10s监控调用情况(请求数等信息):
    monitor -c 10 demo.MathGame primeFactors
    打印调用堆栈信息:
    trace demo.MathGame primeFactors
    观察方法入参和返回值:
    watch demo.MathGame primeFactors {params,returnObj}
    观察方法入参和返回值并且指定第一个参数的值:
    watch com.demo.service.DemoService getUser "{params,returnObj}" "params[0].equals('demo')" -x 2
    ** java.的类不能被arthas代理,这个时候可以参考如下进行解决:*
    https://github.com/alibaba/arthas/issues/47

    image.png

    7. TCP三次握手和四次挥手?

    • 为什么三次握手:保证延迟的消息会被正确的回收
    • 为什么四次挥手:TCP连接的关闭是双方都需要确认的,另外一方面TIME_WAIT的作用:保证连接的正确关闭,等待2MSL,如果在这个时间内,被动关闭方没有收到ACK报文的话,会重新发送FIN报文

    8. 什么是单元化,单元化的作用

    每个单元可以独立的负责用户的请求,能够向其它单元同步数据的单元叫做中心

    • 作用:异地多活,提高稳定性,保证RPC的响应效率
    • 对该单元进行切流+禁写(保证数据的一致性,因为中心还没有把数据同步过来) - 可以类比redis主从异步复制的场景
      步骤可以分为:禁写(禁止更新)、切流、同步、执行(恢复写)

    9. 分布式事务

    XA:两阶段提交之XA,prepare commit/rollback
    TCC:try-precomit-commit
    FMT:在XA和TCC之间找到平衡点(性能和耦合性),通过记录日志,类似于undolog(但是如果数据被改了要如何恢复-依赖框架的事务,需要锁定被修改的行,但是如果这行是热点数据的话,会导致性能的下降)

    XA存在的问题:事务协调器的单点故障、从第一阶段就锁定资源(数据库链接,锁等资源)影响性能
    TCC存在的问题:需要自己实现大量的回滚代码、在第一阶段锁定资源后就释放资源了

    10. mysql索引

    • 大字段如何建立索引?
      使用前缀索引,可以通过
      select count(distinct 索引字段) / count() from 表名; 查询索引的区分度,返回的值越大说明区分度越高
      select count(distinct left(索引字段, 取多少个字段)) / count(
      ) from 表名;
      当两者值大致相近时,说明区分度已经接近了
      为什么使用前缀索引?解决索引占用空间的问题
      会有什么问题?不可以使用覆盖索引了
    • 对于身份证号码这类字段,前缀区分度不高,如何建立索引呢?
      1)可以存储倒序字段,建立倒序字段的前缀索引
      2)通过建立hash字段,但是为了精确匹配,在where条件还得加上hash前字段的等值比较

    11. mysql优化

    • limit如何优化
      假设有如下表:
    create table a (int id,  int fr_id,  varchar field, pk id,  key fr_id)
    

    先来看下面一句sql

    select * from table_a order by fr_id limit 10000,100
    

    上面这一段sql存在的问题:
    虽让fr_id有索引,查询时可以用到fr_id索引,但是由于查询了所有字段会导致回表,并且随机读严重,扫面更多的页,最终会使整体sql的执行性能不佳
    如何优化呢?
    使用延迟关联:第一步先利用覆盖索引查询id,再做关联查询

    select * from table a inner join (select id from table_a order by fr_id limit 10000,100) as b on a.id = b.id
    

    如何进一步优化?
    根据业务场景,如果不需要支持跳页(即只支持翻页,解决深度分页问题),可以考虑用如下进行优化
    第一次查询

    select * from  fr_id > 0 order by fr_id limt 100
    

    第二次查询
    假设第一次查询的结果的最大fr_id为200,那么第二次查询的如下

    select * from  fr_id > 200 order by fr_id limt 100
    

    使用翻页要考虑的问题时,字段一定要是单调自增的,不然在翻页的过程中会有漏数据
    所以整体优化思路为:
    1、使用延迟关联,解决两个问题(1.使用覆盖索引 2.避免随机读,提高性能)
    2、根据业务场景,是否需要支持跳页查询?

    12. jdk工具

    jps:查看进程
    jstack pid:查看进程堆栈
    jstat -gc pid 3000[ms]:查看进程gc情况,每3s一次
    jmap -heap pid:查看进行的堆和堆占用情况
    jmap -histo pid | head -n 10:查看排行前10占用最多的对象

    13. 网络

    三次握手:(不是二次握手的原因:防止已经失效的连接请求报文生效)
    最后一次握手,避免如果是只有两次握手时由于第一次握手由于网络延迟的问题,导致后续服务端占用了无效连接资源


    image.png

    四次挥手:
    在主动关闭方收到第三次挥手时发送ack后会进入time_wait:维持2msl,即报文的最大持续时间
    1)解决第三次挥手报文丢失(不是真正丢失的意思,比方说滞留时间过长),服务端可以进行重发
    2)如果没有time_wait的话,此时如果允许创建连接,可能会出现新创建的连接收到之前丢失的报文,导致后续程序处理出现异常

    14. 线程池

    池化管理的思想,提供的好处:

    • 降低资源消耗
      创建和销毁带来的开销,可以做到线程复用
    • 提高响应速度
      请求到达时,无需耗费创建线程带来的开销
    • 线程管理
      统一管理,避免线程泛滥
    • 提供高级功能
      延迟任务、定时任务

    15. 关于异常处理

    image.png

    16. 关于日志的正确使用

    image.png image.png

    17. 数据迁移经验

    image.png

    18. mvn:deploy

    该命令用于将maven项目打包,并上传自本地和远程的maven仓库
    release和snapshot的区别:
    使用snapshot,假如远程仓库发生变化了,依赖了snapshot的项目会从远程仓库加载依赖
    使用release,假如某个版本号的依赖在远程仓库发生变化了,依赖了该版本号的maven项目会优先从本地仓库加载依赖

    19.G1回收器

    CMS的缺点:内存碎片、对大堆回收不友好(需要扫描整个堆)、浮动垃圾
    何时使用G1:

    • 堆内存大、多核CPU
    • 期望停顿时间可预测,避免停顿时间无法预估导致的服务雪崩
    • 不期望有太多的内存碎片

    20、守护线程

    守护线程的作用是为普通、非守护线程提供服务的,比如GC线程。假如虚拟机运行过程中,没有非守护线程在执行了,那么虚拟机可以退出
    使用守护线程,必须注意:
    1、setDaemon(true)必须在调用start方法之前,否则会抛出异常
    2、不要在守护线程中做业务逻辑操作,因为无法预测非守护线程执行完毕之后,守护线程是否已经执行完毕该做的任务
    3、守护线程中创建的线程也属于守护线程

    21、线程和线程池的状态

    https://blog.csdn.net/qq_24384579/article/details/93199116

    22、git rebase 和 git merge

    git rebase称作变基,会以rebase的分支为基准,将当前分支提交的记录提交到rebase的分支的最后提交记录之后
    git rebase :带来的影响:会篡改修改记录、无法确认当前分支是从哪个节点checkout出来的
    git merge:历史提交记录都在,每次merge会生成一条新的提交记录

    23、idea中查看类、方法、属性的调用链/引用链

    https://blog.csdn.net/qq_37126357/article/details/101055230

    24、性能优化

    如何找到可优化点:压测、arthas
    日志、json.toJsonString, json.ParseObject、批量查询、预热(热点代码JIT即使编译)

    25、stream流优化

    https://blog.csdn.net/weixin_29088655/article/details/114935548
    几个概念:水平执行、垂直执行

    26、内存管理

    Linux中Swap与Memory内存区别
    https://blog.csdn.net/xili2532/article/details/122875250

    相关文章

      网友评论

          本文标题:零碎知识记录

          本文链接:https://www.haomeiwen.com/subject/lfcssltx.html