Lua(模糊查找):判断两个字符串(含中文)是否存在至少一个相同

Lua(模糊查找):判断两个字符串(含中文)是否存在至少一个相同

作者: 大理王段功 | 来源:发表于2020-03-08 22:25 被阅读0次

Lua(模糊查找):判断两个字符串(含中文)是否存在至少一个相同
ES6几个好用的字符串操作方法
python编码问题
Lua实现继承的方法
正则计算中英文混合长度位数/emoj 特殊字符整形空判断 o
golang判断字符串是否含中文
shell 判断字符串是否存在数组中
常用算法
Python 判断字符串中是否包含中文
lua字符串查找中文字符

用过Lua的,应该知道lua有一个截取字符串的接口,string.sub(s,i,j),就是截取字符串s,从第i个字符到第j个字符的字串,这里的一个字符是一个字节,对于英文字母还是阿拉伯数学,不管是utf8编码,还是ansi(GBK)编码,都是一样的,而且对于汉字,前者占3个字节,后者占2个字节,当然还有4个字节的汉字,那如何从一个字符串比如"bg%好-+03打@/f"中准确截取出我们需要的汉字呢,这就是我们今天需要解决的问题.

其实,在今天之前,我也不知道怎么做,我是因为要解决一个模糊查找的需求来学习到了这些

首先当前游戏代码是以utf8编码格式,因为我们要面向中国玩家,而且很多英语不是非常好,哈哈,所以全写英文的,玩家就看不懂了,如果ui显示文字全是英文,下面的就不需要看了

1.字符是由几个字节组成:(16进制)

[0, 0xc0) 表示这个字符仅由1个字节构成 [0,192)

[0xc0, 0xe0) 表示这个字符由2个字节构成 [192,225)

[0xe0, 0xf0) 表示这个字符由3个字节构成 [225,240)

[0xf0, 0xff) 表示这个字符由4个字节构成 [240,255)

2.如何取得字节ASCII码 :

string.byte(s,i) 或 s:byte(i)

3.我们先写一个判断utf8字符byte长度的函数:

4.在Lua中，表（table）是十分重要的一种数据结构，实际上Lua对于复杂数据类型也仅提供了表给我们，我们通过表可以实现我们需要的大部分重要的数据结构，比如数组。我们现在只需要知道有没有相同的中文字符,其他不关心,所以把字符串变成数据中文字符串的表就好了

我们传入两个参数,一个是字符串,一个是用来装汉字的表

通常来说，汉字范围从0x4E00到0x9FA5，转换为UTF-8编码为11100100 10111000 10000000(228, 184, 128) 到 11101001 10111110 10100101(233, 190, 165)

因此，中文UTF-8编码用3个字节表示，要遵守格式：1110xxxx 10xxxxxx 10xxxxxx

即第一个字节的取值区间为 [11100000, 11110000) = [0xe0, 0xf0) = [224, 240) 左开右闭

后两个字节的取值区间为[10000000, 10111111] = [0x80，0xbf] = [128, 191] 开区间

所以我们可以一个字节的去截取,然后计算出byte长度,如果大于3,就截取存入表中

5.写好算法以后,我们只需传入不同的字符串,得到不同的表,进行比较就可以了:

我们只比较两个字符串都含有中文的情况

相关文章

Lua(模糊查找):判断两个字符串(含中文)是否存在至少一个相同
用过Lua的,应该知道lua有一个截取字符串的接口,string.sub(s,i,j),就是截取字符串s,从第...
ES6几个好用的字符串操作方法
字符串查找判断是否在开头判断是否在结尾复制字符串
python编码问题
今天写python程序，在python2环境下，中文显示非常恶心，我都快自闭了。需求：判断两个中文字符串是否相同...
Lua实现继承的方法
lua通过元表实现继承 lua查找一个表元素的规则如下 1.在表中查找，如果找到，则返回这个元素 2.判断该表是否...
正则计算中英文混合长度位数/emoj 特殊字符整形空判断 o
正则查找中文的数量，然后加上字符串的长度其他判断
golang判断字符串是否含中文
一个使用unicode判断，一个是正则判断。结论，使用IsChinese unicode判断，效率更高。效率...
shell 判断字符串是否存在数组中
扩展：这种方式不仅可以判断字符串是否存在数组中，也快判断字符串是否存在一个文本中。
常用算法
求最大公约数判断字符串是否为回文串判断数字是否为质数判断数组中是否存在相同元素求阶乘二进制中1的个数
Python 判断字符串中是否包含中文
Python 判断字符串中是否包含中文
lua字符串查找中文字符
Lua字符串查找问题在utf-8编码一个字母符号占一个字节而一个中文占三个字节在lua中也是中文字符一个占...

网友评论

本文标题：Lua(模糊查找):判断两个字符串(含中文)是否存在至少一个相同

本文链接：https://www.haomeiwen.com/subject/kbzjdhtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

互联网科技

热点阅读

程序员

互联网科技

关于我们|服务条款|联系我们|Lua(模糊查找):判断两个字符串(含中文)是否存在至少一个相同|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！