TIL

作者: zzzzzzzeng | 来源:发表于2020-09-23 11:00 被阅读0次

    20200902

    pydata

    pd.df批量转换列的类型

    • 使用字典
    • 列名和类型名都需要使用字符串形式
    df = df.astype({'overdue_guid_y':'int64', 'quit_guid_y':'int64'\
                , 'login_succ_guid_y':'int64', 'first_login_guid_y':'int64'})
    

    Jupyter notebook将展示宽度设置为整个屏幕

    from IPython.core.display import display, HTML
    display(HTML("<style>.container { width:100% !important; }</style>"))
    

    其他

    windows的密码更改,git凭据报错

    错误信息
    fatal: Authentication failed for ....
    解决方法
    控制面板-凭据管理器-管理windows凭据-找到对应的git凭据-更正密码为当前锁屏密码

    AB实验 统计学

    样本容量的计算

    MDE

    20200914

    pandas

    pd.merge不能跨字段类型连接,如果两者字段类型不同需要转换成相同字段。

    • Object最好转换成str。

    20200916

    hive

    1. 表类型

    EXTERNAL_TABLE
    INDEX_TABLE
    MANAGED_TABLE
    VIRTUAL_VIEW

    20200923

    1. pydata pandas

    • 设置查看的最大行和列
    
    import pandas as pd
    pd.set_option('display.max_columns', None)#相应的我们可以设置显示的最大行数
    pd.set_option('display.max_rows', None)#其中None可以是具体数字,例如10,100等等
    
    • 筛选非空行
    df[df['Column'].notna()]
    
    • 修改列名的两种方法
    # 1.使用列表修改全部列名。
    df.columns = ['A','B']
    
    # 2.使用字典修改指定列
    df.rename(columns={'a':'A'})
    

    20200929

    调整Dataframe预览表格时显示表格线

    %%HTML
    <style type="text/css">
    table.dataframe td, table.dataframe th {
        border: 1px  black solid !important;
      color: black !important;
    }
    

    20201003

    dataframe两列中较大列

    df[['x', 'y']].max(axis=1)
    

    df中解析 a=1&b=2&b=3的a值的方法

    from urllib.parse import urlparse, parse_qs, parse_qsl
    import json
    
    def parse_url(astr):
        jsonobj = json.loads(astr)
        qua = jsonobj['qua']
        query = urlparse('https://someurl.com/with/query_string?'+qua).query
        pr = dict(parse_qsl(query))['a']
        return pr
    

    DataFrame对某列截取指定位的字符

    df['colname'].str[1:4]
    

    DF实现类似SQL的COUNT(DISTINCT colname1) GROUP BY colname2

    table.groupby('colname2 ').colname1.nunique()
    

    相关文章

      网友评论

          本文标题:TIL

          本文链接:https://www.haomeiwen.com/subject/dzinyktx.html