美文网首页
个人常用函数

个人常用函数

作者: 是东东 | 来源:发表于2022-09-04 20:10 被阅读0次

    字段排序

    sorted_result = sorted(item.items(),key=lambda x:x[1],reverse=True)
    

    清理字符串中的特殊字符,可用于文件命名

    clean_txt = lambda str: re.sub(r'[\/\\\:\*\?\"\<\>\|]' , "_", str) 
    

    节格式化为kb、mb、gb,可用于文件大小转换

    def format_size(bytes):
        try:
            bytes = float(bytes)
            kb = bytes / 1024
            if kb > 1024:
                mb = kb / 1024
                if mb > 1024:
                    gb = mb / 1024
                    return '%.2fGB' % gb
                else:
                    return '%.2fMB' % mb
            else:
                return '%.2fKB' % kb
        except:
            return 'error'
    

    PC UA随机生成

    def get_ua():
        first_num = random.randint(55, 62)
        third_num = random.randint(0, 3200)
        fourth_num = random.randint(0, 140)
        os_type = [
            '(Windows NT 6.1; WOW64)', '(Windows NT 10.0; WOW64)', '(X11; Linux x86_64)',
            '(Macintosh; Intel Mac OS X 10_12_6)'
        ]
        chrome_version = 'Chrome/{}.0.{}.{}'.format(first_num, third_num, fourth_num)
        ua = ' '.join(
            [
                'Mozilla/5.0', random.choice(os_type), 'AppleWebKit/537.36',
                '(KHTML, like Gecko)', chrome_version, 'Safari/537.36'
            ]
        )
        return ua
    

    正则匹配汉字

    match_zh_words = lambda text: re.findall(r'[\u4e00-\u9fa5]+',text)
    

    输出彩色字体

    print('\033[35;46m正常\033[0m')
    print('\033[31;43m警告\033[0m')
    print('\033[31;44m错误\033[0m')
    
    彩色字体效果图

    判断关键字是否在文本中出现

    keyword_list=['a','b','c',]
    flag=any(True if keyword in text else False for keyword in keyword_list)
    

    谷歌翻译语言表

    language_table={'auto': '自动选择', 'af': '南非荷兰语', 'sq': '阿尔巴尼亚语', 'am': '阿姆哈拉语', 'ar': '阿拉伯语', 'hy': '亚美尼亚语', 'az': '阿塞拜疆语', 'eu': '巴斯克语', 'be': '白俄罗斯语', 'bn': '孟加拉语', 'bs': '波斯尼亚语', 'bg': '保加利亚语', 'ca': '加泰罗尼亚语', 'ceb': '宿务语', 'zh': '中文(简体)', 'zh-TW': '中文(繁体)', 'co': '科西嘉语', 'hr': '克罗地亚语', 'cs': '捷克语', 'da': '丹麦语', 'nl': '荷兰语', 'en': '英语', 'eo': '世界语', 'et': '爱沙尼亚语', 'fi': '芬兰语', 'fr': '法语', 'fy': '弗里西语', 'gl': '加利西亚语', 'ka': '格鲁吉亚语', 'de': '德语', 'el': '希腊语', 'gu': '古吉拉特语', 'ht': '海地克里奥尔语', 'ha': '豪萨语', 'haw': '夏威夷语', 'he': '希伯来语', 'hi': '印地语', 'hmn': '苗语', 'hu': '匈牙利语', 'is': '冰岛语', 'ig': '伊博语', 'id': '印尼语', 'ga': '爱尔兰语', 'it': '意大利语', 'ja': '日语', 'jw': '爪哇语', 'kn': '卡纳达语', 'kk': '哈萨克语', 'km': '高棉语', 'ko': '韩语', 'ku': '库尔德语', 'ky': '吉尔吉斯语', 'lo': '老挝语', 'la': '拉丁语', 'lv': '拉脱维亚语', 'lt': '立陶宛语', 'lb': '卢森堡语', 'mk': '马其顿语', 'mg': '马尔加什语', 'ms': '马来语', 'ml': '马拉雅拉姆语', 'mt': '马耳他语', 'mi': '毛利语', 'mr': '马拉地语', 'mn': '蒙古语', 'my': '缅甸语', 'ne': '尼泊尔语', 'no': '挪威语', 'ny': '尼杨扎语(齐切瓦语)', 'ps': '普什图语', 'fa': '波斯语', 'pl': '波兰语', 'pt': '葡萄牙语', 'pa': '旁遮普语', 'ro': '罗马尼亚语', 'ru': '俄语', 'sm': '萨摩亚语', 'gd': '苏格兰盖尔语', 'sr': '塞尔维亚语', 'st': '塞索托语', 'sn': '修纳语', 'sd': '信德语', 'si': '僧伽罗语', 'sl': '斯洛文尼亚语', 'so': '索马里语', 'es': '西班牙语', 'su': '巽他语', 'sw': '斯瓦希里语', 'sv': '瑞典语', 'tl': '塔加洛语(菲律宾语)', 'tg': '塔吉克语', 'ta': '泰米尔语', 'te': '泰卢固语', 'th': '泰语', 'tr': '土耳其语', 'uk': '乌克兰语', 'ur': '乌尔都语', 'uz': '乌兹别克语', 'vi': '越南语', 'cy': '威尔士语', 'xh': '班图语', 'yi': '意第绪语', 'yo': '约鲁巴语', 'zu': '祖鲁语'}
    

    时间戳转日期时间

    get_date = lambda n: time.strftime("%Y-%m-%d %H:%M:%S", time.localtime(time.time() - 60 * 60 * 24 * n))
    
    def convert_to_datetime(timestamp):
        timeArray = time.localtime(timestamp)
        datetime= time.strftime("%Y-%m-%d %H:%M:%S", timeArray)
        return datetime
    

    B站AV号转BV号

    alphabet = 'fZodR9XQDSUm21yCkr6zBqiveYah8bt4xsWpHnJE7jL5VG3guMTKNPAwcF'
    def dec(x):
        # bv to av
        r = 0
        for i, v in enumerate([11, 10, 3, 8, 4, 6]):
            r += alphabet.find(x[v]) * 58 ** i
        return (r - 0x2_0840_07c0) ^ 0x0a93_b324
    def enc(x):
        # av to bv
        x = (x ^ 0x0a93_b324) + 0x2_0840_07c0
        r = list('BV1**4*1*7**')
        for v in [11, 10, 3, 8, 4, 6]:
            x, d = divmod(x, 58)
            r[v] = alphabet[d]
        return ''.join(r)
    print(dec(alphabet))  # -4566132193
    print(enc(dec(alphabet)))  # BV1dR4X1D7Um
    

    展示日期信息,便于天气展示

    import datetime
    def show_date():
        """
        展示日期信息,便于天气展示
        :return:
        """
        date = str(datetime.date.today())
        year, month, day = date.split('-')
        week_day_dict = {
            0: '星期一',
            1: '星期二',
            2: '星期三',
            3: '星期四',
            4: '星期五',
            5: '星期六',
            6: '星期日 ',
        }
        now = datetime.datetime.now()
        date_index = now.weekday()
        date_time = f'{year}年{month}月{day}日 {week_day_dict[date_index]}'
        return date_time
    print(show_date())  # 2022年09月03日 星期六
    

    解决最新Pyecharts无Map

    pip install pyecharts==0.5.1
    

    图片base64硬编码

    import base64
    def img_to_base64(filename):
        with open(filename, 'rb') as open_icon:
            b64str = base64.b64encode(open_icon.read())
            return b64str
    

    提取url中的参数

    import urllib.parse
    def extractParams(url):
        parsed = urllib.parse. urlparse(url)
        querys = urllib.parse.parse_qs(parsed.query)
        querys = {k: v[0] for k, v in querys.items()}
        return querys
    print(extractParams('https://www.baidu.com/s?ie=UTF-8&wd=python'))  # {'ie': 'UTF-8', 'wd': 'python'}
    

    分块下载文件

    import requests
    
    link="http://www.xxxx/com/video/123.mp4"
    file_name="123.mp4"
    rsp = requests.get(link, stream=True)
    chunk = 2048  # 每次读取2M,分块读取
    with open(file_name, 'wb') as f:
        for i in rsp.iter_content(chunk):
             f.write(i)
    

    自动解码text,用于requests得到的response.content二进制解码

    def text_encoding(text):
        try:
            import cchardet
            if isinstance(text, bytes):
                encoding = cchardet.detect(text)['encoding']
                print('encoding', encoding)
                if encoding is None:
                    encoding = 'UTF-8'
                text = text.decode(encoding, 'ignore')
        except ModuleNotFoundError as e:
            print(e)
            e = repr(e).split("\'")[-2]
            print(f'now install module:{e}')
            import os
            os.system('pip install cchardet')
            return text_encoding(text)
        return text
    

    相关文章

      网友评论

          本文标题:个人常用函数

          本文链接:https://www.haomeiwen.com/subject/bxpunrtx.html