截至年前,工作时长已达6个月零20天,期间完成了大大小小的工作,很多都是新的知识/能力区块。故选择在此记录,希望能够温故而知新。
Ⅰ 舆情监测
· 用R实现自动化文本抓取
- 爬虫基本原理
关注点:① 基础代码/常用函数(如read_html等)
② 网页基本构成,巩固CSS选择器(小游戏:http://flukeout.github.io/)
③ 先把抓取下来的页面内容保存成本地文件(如txt格式),再做进一步的数据抓取/整理/解析。注意本地存取时的文件分类、命名规则等
④ 可行性:行为是否敏感/反爬壁垒(如汽车之家,可能需要无头浏览器/OCR图像识别)/一些网站可以直接购买API接口(如天眼查)
⑤ 简便性:比如爬取小鹏网点信息的时候用了很多复杂的解析,结果发现网点信息就储存在一个格式较为规整的JSON文件中(现在又改了);网页一旦更新,爬取规则也要相应地做出改变
- 正则表达式(很重要,但是不用就会忘)

· 车主座谈会(成都)
鉴于部门的特殊性,有机会到第一线倾听了真实的(潜在)车主声音。这次座谈会是品牌项目的一部分,和益普索合作,在很多城市进行了推进,算是小样本的定性调研。于我而言,坐在单向玻璃后翻看问卷和记录了车主基本信息的表格是一种全新的体验,知道了座谈会的前期准备、主要流程,赞叹于主持人的控场能力,观察不同人的表达是一件有趣的事。
也是在这一过程中,渐渐开始明白发现问题并不是最重要的一件事。如何解决问题,怎样在铺天盖地的问题中抓住要害、做出有重点、有层次的反应才是关键。这一点对于创业公司而言更为明显。
Ⅱ 出行大屏
· 可视化组件选取(准备工作)
· 人工智能大会(话术)
也是新体验!算是蛮大的活动,分主论坛-分会场-厂家展厅,威马在这次有一个不大不小的展台,一般像这样的活动/车展,都需要按面积*每平方米报价*时间收费,对接部门主要是公关。
公关大屏主要有四块,包括订单大屏(售价/ 配置/ 偏好)、出行大屏(地图-轨迹图/ 地理分布/ 行驶里程) 、 充电大屏(接入的充电桩平台/ 数量/ 充电行为) 、 网联大屏(一些比较有意思的结论),在公关没有承接展示流程之前,一直是由大为老师负责对外场合下的公关大屏的说明。这种场合要注意的几个关键:① 数字的准确性,要严谨;② 要对背景知识比较了解;③ 随机应变。
事实上,在现在的商业场合,“大屏”这一可视化形式也用得越来越多了。
Ⅲ 城市面板
· 产品意识
- 什么是数据产品?和一般的产品有什么区别?
一般流程:数据处理-指标提取-模型构建-指标设计、面板框架-产品工具(word/PPT)
- 客户导向(主要使用者是谁?他们的需求是什么?如何理解?)
· 城市排名体系
- 指标设计
- 标准化与归一化
· 前端能力(数据科学家的工具箱)
- CSS
- JS
- Echarts
- D3
- VUE
Ⅳ 大客户线索
· FRM客户价值评估模型
Ⅴ 其它
· 工作态度
- 不要迟到早退
· 工作效率
你花了多少时间 不等于你所做工作的价值大小
不要随便感动自己,要明白真正的工作节奏不会是惬意的
在保持项目及时、准确交付的同时,尽量让自己保持高效,否则痛苦的只会是自己
· 工作方法
- 职业技能/ 职业素养
- 专业技能
明确发展方向-需要基础技能支撑需补足短板
学习项目管理,抓大放小
少走弯路
网友评论