美文网首页青春校园java高级开发群Spring-Boot
面试现场:如果让你实现一个短链接服务,你会怎么设计?

面试现场:如果让你实现一个短链接服务,你会怎么设计?

作者: Java技术剑 | 来源:发表于2019-08-03 14:47 被阅读5次

    面试官:你平时是否留意过一些垃圾短信中包含短链接?

    候选人:有的,就像下面这样!

    面试官:

    为什么选择这种短链接这种方式?

    有什么好处?

    如果让你实现一个短链接的生成服务,你会怎么设计?

    这篇文章,我们就来聊聊上述问题!

    首先,短url的好处:

    短. 短信和许多平台(微博)有字数限制,太长的链接加进去都没有办法写正文了.

    好看. 比起一大堆不知所以的参数,短链接更加简洁友好.

    方便做一些统计.你点了链接会有人记录然后分析的.

    安全. 不暴露访问参数.

    这就是为什么我们现在收到的垃圾短信大多数都是短URL的原因了.

    那么短URL是怎么做到的呢?

    短URL基础原理

    短URL从生成到使用分为以下几步.

    有一个服务,将要发送给你的长URL对应到一个短URL上.例如 www.baidu.com->www.t.cn/1

    把短url拼接到短信等的内容上发送.

    用户点击短URL,浏览器用301/302进行重定向,访问到对应的长URL.

    展示对应的内容.

    那么,如何将一个长URL对应到短URL上呢?

    服务设计

    如果你在往长短URL真实的对应关系上想,那么就走远了.

    最理想的情况: 我们用一种算法,对每一个长URL,唯一的转换成短URL.还能保持反向转换的能力.

    但是这是不可能的,如果有这样的算法,世界上的所有压缩算法都可以原地去世了.

    正确的思路是建立一个发号器,每次有一个新的长URL进来,我们就增加一,并且将新的数值返回.第一个来的url返回"www.x.cn/0",第二个返回"www.x.cn/1".

    接下来以QA形式写几个小问题:

    对应关系如何存储?

    这个对应数据肯定是要落盘的,不能每次系统重启就重新排号,所以可以采用mysql等数据库来存储.而且如果数据量小且qps低,直接使用数据库的自增主键就可以实现.

    如何保证长短链接一一对应?

    按照上面的发号器策略,是不能保证长短链接的一一对应的,你连续用同一个URL请求两次,结果值都是不一样的.

    为了实现长短链接一一对应,我们需要付出很大的空间代价,尤其是为了快速响应,我们可以需要在内存中做一层缓存,这样子太浪费了.

    但是可以实现一些变种的,来实现部分的一一对应, 比如将最近/最热门的对应关系存储在K-V数据库中,这样子可以节省空间的同时,加快响应速度.

    短URL的存储

    我们返回的短URL一般是将数字转换成32进制,这样子可以更加有效的缩短URL长度

    那么32进制的数字对计算机来说只是字符串,怎么存储呢?直接存储字符串对等值查找好找,对范围查找等太不友好了.

    其实可以直接存储10进制的数字,这样不仅占用空间少,对查找的支持较好,同时还可以更加方便的转换到更多/更少的进制来进一步缩短URL.

    高并发

    如果直接存储在MySQL中,当并发请求增大,对数据库的压力太大,可能会造成瓶颈,这时候是可以有一些优化的.

    缓存

    上面保证长短链接一一对应中也提到过缓存,这里我们是为了加快程序处理速度.

    可以将热门的长链接(需要对长链接进来的次数进行计数),最近的长链接(可以使用redis保存最近一个小时的)等等进行一个缓存,保存在内存中或者类似redis的内存数据库中

    如果请求的长URL命中了缓存,那么直接获取对应的短URL进行返回,不需要再进行生成操作.

    批量发号

    每一次发号都需要访问一次MySQL来获取当前的最大号码,并且在获取之后更新最大号码,这个压力是比较大的.

    我们可以每次从数据库获取10000个号码,然后在内存中进行发放,当剩余的号码不足1000时,重新向MySQL请求下10000个号码.在上一批号码发放完了之后,批量进行写入.

    这样可以将对数据库持续的操作移到代码中进行,并且异步进行获取和写入操作,保证服务的持续高并发.

    分布式

    上面设计的系统是有单点的,那就是发号器是个单点,容易挂掉.

    可以采用分布式服务,分布式的话,如果每一个发号器进行发号之后都需要同步给其他发号器,那未必也太麻烦了.

    换一种思路,可以有两个发号器,一个发单号,一个发双号,发号之后不再是递增1,而是递增2.

    类比可得,我们可以用1000个服务,分别发放0-999尾号的数字,每次发号之后递增1000.这样做很简单,服务互相之间基本都不用通信,做好自己的事情就好了.

    实现

    由于我懒得写JDBC代码,更懒得弄Mybatis,所以代码中使用到MySQL的地方都使用了Redis.

    最后分享一份面试宝典【Java核心知识点整理】覆盖了JVM、锁、高并发、反射、Spring原理、微服务、Zookeeper、数据库、数据结构等等”,还有Java208道面试题(含答案)!加入我的粉丝群(Java填坑之路:659655594)即可免费获取到!掌握了这些知识点,面试时在候选人中又可以夺目不少,暴击9999点。机会都是留给有准备的人,只有充足的准备,才可能让自己可以在候选人中脱颖而出。

    相关文章

      网友评论

        本文标题:面试现场:如果让你实现一个短链接服务,你会怎么设计?

        本文链接:https://www.haomeiwen.com/subject/liujdctx.html