美文网首页
比赛-以企业为服务目标的政策大数据应用

比赛-以企业为服务目标的政策大数据应用

作者: 致Great | 来源:发表于2021-01-11 23:02 被阅读0次

    报名链接:https://www.kesci.com/home/competition/5fcef670807ccb002cb62113

    赛题&数据

    赛题题目

    以企业为服务目标的政策大数据应用

    赛题背景

    对于小型企业来说,掌握政策动向,对于政策积极响应,并且结合政策的落实调整战略有助于企业自身拓展业务,增加营收。对于大型企业来说,政策的掌握不光能够为企业创收,并且有助于大型企业承担其应有的社会责任。企业对于政策的响应和反馈也有利于政策风向调整,使得政府效率提升,更好地服务大众。因此借助数字化的手段分析和管理政策是一个有意义的研究方向。

    赛题任务

    本次任务提供重庆地区的政策信息,参赛者需要合理运用文本处理技术与自然语言处理技术,对于提供的信息进行分析。通过分析政策文本,总结政策趋势,结合企业相关的信息,讨论包括但不限于如下问题:

    1. 重庆地方企业政策趋势及其特点
    2. 疫情下的企业与政策特点
    3. 量化评价政策在协助企业发展方面的效用
    4. 在政策影响下的地方企业活力特点

    探究此类问题鼓励参赛队伍深入了解地方政策特点与地方经济与企业特点,获取其他公开政策信息与数据进行综合分析,利用数据做观点支持,对于用政策精益化服务企业提出建设性方案。本次任务原则上鼓励参赛队伍大胆创新,对于政策指导方式建言献策,敢于对政策服务企业相关的数据与信息在相关性和因果性上进行大胆的假设和严谨的探究与论证。

    赛题数据

    1. 重庆地区网页政策文本
    2. 其他地区政策文本
    3. 企业工商信息

    数据使用

    1. 本赛题提供的数据将会以数据集的形式分发到比赛平台中
    2. 数据提供方授权参赛人员使用提供的数据进行指定比赛的模型训练工作,参赛人员不得将数据用于任何商业用途
    3. 数据集位置:报名后,在数字重庆平台的页面右上角 工作台 > 数据源 > 他人共享 > 政策板块数据,点击文件一栏显示有相关数据集;
    4. 数据使用方式:
      1. 项目添加:在数字重庆平台的页面右上角 工作台 > 右上角 加号 > 创建项目 > 添加数据源 > 他人共享 > 选择政策板块数据添加 > 创建
      2. 数据源添加:政策板块数据页面右上角 创建项目 > 创建
    5. 工作台 ModelWhale使用:请参考用户手册

    数据说明

    • 重庆地区网页政策文本
      • 数据为 utf-8 格式的 CSV 文本文件
      • 政策内容均为带有 CSS 式样的 HTML 内容,参赛者需自行提取有用的文本信息,并进行数据清洗。
      • 字段说明表
    字段名 数据类型 说明
    id int(11) id 列
    title varchar(180) 标题
    srcName varchar(255) 来源名称
    srcUrl varchar(255) 来源Url
    policyFileType varchar(120) 政策类别。1,申报通知;2,项目征集;3,公示名录;4,政策解读;5,政府文件
    issuedNumber varchar(120) 发文字号
    writtenDepartment varchar(255) 发文机构
    publishDepartment int(11) 机构类别。1,政府,2,科技,3,经信委,4,发改,5,财税,6,商务,7,农业,8,市场监管,9,金融,10,国资,11,工商联,12,人社,13,其他
    level int(11) 适用级别。1,国家,2,省市
    policyPublishDate varchar(120) 发文日期
    executionStartDate varchar(120) 实施开始日期
    executionEndDate varchar(120) 实施结束日期
    onlineStartDate varchar(120) 网上截止开始日期
    onlineEndDate varchar(120) 网上截止结束日期
    applyStartDate varchar(120) 纸质材料开始日期
    applyEndDate varchar(120) 纸质材料结束日期
    tagValues varchar(120) 主题标签。1,成果转化;2,资金扶持;3,资格资质;4,人才引育;5,双创投资;6,减税降费;7,资源共享;8,知识产权;9,其他;10,技术创新;11,疫情政策;12,营商环境
    content longtext 政策内容
    isConfirm int(1) 是否人工确认;0 否 1 是 2 不推送
    isPost int(4) 是否已推送;0 否 1 是 2 推送失败
    updateTime timestamp 入库时间
    country varchar(240) 适用地区(国家地区行政编吗)
    supportIndustry varchar(120) 所属行业
    keyWord varchar(500) 关键词
    supportDirection varchar(120) 扶持方向
    accossry varchar(800)
    supportProfession varchar(120) 所属产业
    summary varchar(1500) 摘要
    • 其他地区政策文本
      • 数据为 utf-8 格式的 json 文本文件
      • 包含其他地区的相关政策以及发布的 URL
      • json格式说明表
    字段名 说明
    bbd_url 链接地址
    policy_org 发文机构
    policy_title 标题
    policy_code 发文字号
    pubdate 发布日期
    substr_title 标题精华
    policy_province 所属省份
    policy_theme 政策主题
    policy_industry 所属行业
    • 企业工商信息
      • 数据为 utf-8 格式的 json 文本文件
      • 包含重庆当地企业的工商信息
      • json 格式说明表
    字段名 说明
    regno_or_creditcode 注册号/统一社会信用代码
    credit_code 统一社会信用代码
    regno 注册号
    company_name 企业名称
    company_type 类型
    frname 法定代表人
    frname_compid 法定代表人唯一ID
    regcap 注册资金
    realcap 实收资本
    esdate 成立日期
    approval_date 核准日期
    opento 营业期限至
    address 注册地址
    operate_scope 经营范围
    regorg 登记机关
    enterprise_status 登记状态
    parent_firm 派出企业名称
    regcapcur 注册币种
    operating_period 经营期限
    bbd_history_name 历名名称
    company_industry 行业分类
    regcap_currency 注册资本_币种
    realcap_currency 实收资本_币种
    company_province 省份_映射结果
    company_enterprise_status 登记状态_映射结果
    company_companytype 企业类型代码
    company_regorg 登记机关代码
    ipo_company 上市公司标识
    company_county 企业注册地行政区划代码

    相关文章

      网友评论

          本文标题:比赛-以企业为服务目标的政策大数据应用

          本文链接:https://www.haomeiwen.com/subject/quijaktx.html