前几天,一个朋友去面试,他回来告诉我,
面试官问他:
IP 地址是怎么存在数据库的?
他当时也没多想,直接就回答:存字符串啊
心想:这么简单的问题,怕不是看不起我吧
IP地址 本来就是一个字符串,存放在数据库作为字符穿类型,也是无可厚非的。
但是,换位思考,站在面试官的角度,你觉得我会问这么一个低级的问题么?那么答案当然是否定的。所以,面试官想知道的是你对这个问题会不会有深度思考,从此来一定程度的判断你在平常的开发中只是一个单纯的 "搬砖" 的码农,还是一个有灵魂的 Coder 。
序言
针对这个问题,首先声明一下,将 IP地址 以字符串的形式保存在数据库是完全没问题的
。那么你可能就有疑问了?既然没问题,那你还在这里瞎比比什么呢?
虽然,这是一个前后矛盾的话题,但是除了存字符串以外,我们还有其他的存储方式。例如比较常用的,将 IP地址 存成 int 型的数据
,这种存储方式虽然实现起来不复杂,但是能想到该方法,也从一定程度上表明了你是一个善于思考,对数据底层基础把握的比较到位。
因为一个 int 型的数据占 4 个字节
,每个字节 8 位
,其范围就是 0~(2^8-1)
,而 ipv4地址 可以分成4段,每段的范围是 0~255
刚刚好能存下,所以将其稍稍转换,就巧妙的将 IP地址 用最小的空间
存在了数据库中(接下来的描述若无特殊说明,则都是指的 ipv4地址)。可能你会觉得这个小小的改变没有什么关系,但是当数据量越来越多的时候,15个字节和4个字节相差的数据量会让你吃惊。所以在设计数据库的时候,字段类型用合适的,够用就行,能省则省。
正如在《高性能MySQL 第3版》第4.1.7节时,作者建议当存储IPv4地址时,应该使用32位的无符号整数(UNSIGNED INT)来存储IP地址
,而不是使用字符串的原理一样。
相对字符串存储,使用无符号整数来存储有如下的好处:
- 节省空间,不管是数据存储空间,还是索引存储空间
- 便于使用范围查询(BETWEEN...AND),且效率更高
通常,在保存IPv4地址时,一个IPv4最小需要7个字符
,最大需要15个字符
,所以,使用VARCHAR(15)
即可。MySQL在保存变长的字符串时,还需要额外的一个字节来保存此字符串的长度。而如果使用无符号整数来存储,只需要4个字节
即可。另外还可以使用 4个字段
分别存储IPv4中的各部分,但是通常这不管是存储空间和查询效率应该都不是很高(虽然有的场景适合使用这种方式存储)。不过使用无符号整数来存储也有不便于阅读和需要手动转换的缺点。
工具类实现转换
而要实现将IP地址存储成 int 型保存在数据库中,一种是通过java代码中的 移位操作
和 &
计算得到相应的值:
package com.java.mmzsit;
其实这是一种二进制的思维,也是计算技术中广泛采用的一种数制,虽然平时用的不多,但是熟练掌握后,有助于加强我们对机器语言的理解和提升我们的编码水平,特别是面对资源紧张(运存)的场景时,有助于我们分析和优化问题。
数据库函数实现转换
另一种方式就是通过数据库自带的函数 INET_ATON
和 INET_NTOA
进行转化:
mysql> SELECT INET_ATON('192.168.0.1');
如果是 IPv6地址 的话,则使用函数 INET6_ATON
和 INET6_NTOA
进行转化:
mysql> SELECT HEX(INET6_ATON('1030::C9B4:FF12:48AA:1A2B'));
然后数据库定义为 varbinary 类型,分配 128bits 空间(因为 ipv6采用的是128bits,16个字节);或者定义为 char 类型,分配 32bits 空间。
用数据库的函数的话,只需要在 IP地址 入库时,稍稍做一下转换即可,方便快捷;而且到了这里,你不觉得将 IP地址 转换成数字存储是一种不错的选择么,毕竟数据库都帮我们考虑到了这一点,也间接性的证明了这的确是一种可行、并且不错的存储方式。
网友评论