美文网首页
商品规格标准化-文本内容标准化

商品规格标准化-文本内容标准化

作者: EasyNetCN | 来源:发表于2020-02-26 21:59 被阅读0次

全角转半角

def sbc_to_dbc(ustring):
    ss = []
    
    for s in ustring:
        rstring = ""
        
        for uchar in s:
            inside_code = ord(uchar)
            
            if inside_code == 12288:  # 全角空格直接转换
                inside_code = 32
            elif (inside_code >= 65281 and inside_code <= 65374):  # 全角字符(除空格)根据关系转化
                inside_code -= 65248
                
            rstring += chr(inside_code)
            
        ss.append(rstring)
    return ''.join(ss)

替换内容,此处实际应用中可以根据规则定义在配置文件,或者数据库表中。type为1,表示文本替换,type为2表示正则替换,注意的是,这个替换规则是有处理顺序的

replaces =[
    {"src":"毫克","type":1,"dest":"mg"},
    {"src":"克","type":1,"dest":"g"},
    {"src":"毫升","type":1,"dest":"ml"},
    {"src":"升","type":1,"dest":"l"},
    {"src":"公斤","type":1,"dest":"kg"},
    {"src":"。","type":1,"dest":" "},
    {"src":",","type":1,"dest":" "},
    {"src":"x","type":1,"dest":"*"},
    {"src":"×","type":1,"dest":"*"},
    {"src":" +","type":2,"dest":" "}
]
def text_replace(txt):
    for item in replaces:
        replace_type = item["type"]
        src = item["src"]
        dest = item["dest"]
        
        if replace_type == 1:
            txt = txt.replace(src,dest)
        elif replace_type == 2:
            txt = re.sub(src,dest,txt)
    
    return txt

标准化方法,移除两边空格和换行符,并转换成小写

def normalize(txt):
    return text_replace(sbc_to_dbc(txt.strip().lower()))

相关文章

  • 商品规格标准化-文本内容标准化

    全角转半角 替换内容,此处实际应用中可以根据规则定义在配置文件,或者数据库表中。type为1,表示文本替换,typ...

  • Python实现商品规格标准化

    以下代码主要处理商品规格含有“每”的特殊处理(如:每袋5g,标准化为:5g/袋),默认处理方式可以参考上一篇随笔:...

  • 关于电商SPU与SKU的了解

    SPU:标准化产品单元 SPU = Standard Product Unit (标准化产品单元),SPU是商品信...

  • 2018-11-15

    情绪不能解决任何问题。 由于商品标准化,对各商品的质量评估指标也因此可以标准化(模块运行速度、稳定性等),因此,有...

  • 以信息化的思维看商业的价值

    商业所带来的,就说是产品的标准化。货币就是最标准化的商品,简称通货,它可以评价一切商品服务的价值。虽然咤听起来,好...

  • 景观标准化指引,好方案的基础,行业发展的趋势,不同产品各异

    方案解读 景观标准化,行业新风向 今天给大家分享关于景观标准化的内容,本资料在2017年就已形成,标准化的思路非常...

  • 商业核心是标准化

    标准化需求选择,标准化解决方案,标准化运营拓展手段,标准化人才培养。

  • 数据标准化的性质及用处

    什么是数据标准化 ? 为什么要标准化 ? 标准化有什么好处 ? 1. 什么是数据标准化 ? 标准化后的变量 满足...

  • 电商后台(商品中心)

    一、商品的基本概述 SKU:库存量单位,库存控制的最小可用单位。 SPU:标准化产品单位,是一组标准化信息的组合。...

  • 商务平台的业务设计

    概念定义 SPU:Standard Product Unit (标准化产品单元),即商品列表里展示的一项商品,例如...

网友评论

      本文标题:商品规格标准化-文本内容标准化

      本文链接:https://www.haomeiwen.com/subject/pplgchtx.html