人靠衣装,马靠鞍;鲁迅说:“好看的姑娘有两种:一种是长的好看,一种是穿的好看”。年龄的差异与气质变化,在服装选择上可以显而易见。基于2万多条女性用户的服装购买记录,一起探索女性年龄与服装选择的别样色彩。
一生中我们选择的服装类型,大部分都在下图中可以找到。结尾的结论也是很亮眼;对女性来说,岁月无情,愿美丽仍在。
下图是部分数据预览:女性服装的商业交易数据,其中包含年龄,标题,评分,服装类型等一些数据,这里只显示部分列名。
这里选择 age, tag(服装类型的标签)两列数组,我们需要对年进行分组。数据曲线基本上符合正态分布,年龄区间在[25-99]。75岁以上的数据量很少,有离群状态,这里直接过滤掉不做分析。
根据经典的人生7年的周期来对年龄进行分组。
#用sqldf分析
tagd<- sqldf("select age,count(1) as cnt from wd group by age")ggplot(tagd, aes(age, cnt ,colour=age,scales="free"))+geom_line()
summary(tagd$age)
Min. 1st Qu. Median Mean 3rd Qu. Max. 18.0037.0056.0056.1475.0099.00
数据年龄分组:
agetag<-sqldf("select tt as age, tag, count(1) as cnt from tagd group by age, tag")
# 对应分析函数需要宽数据,这里将长数据转为宽数据
library(tidyr)long2short = spread(agetag,key=tag,value=cnt)
#删除你不想要的列
shortd<-long2short[,-which(names(long2short)%in%c("V1"))]
#用0来替代NA值
shortd[is.na(shortd)] <- 0
对应分析开始闪亮登场喽:
rownames(shortd) <- c('18-25','25-32','32-39','39-46','46-53','53-60','other')
juzheng<-shortd[,-which(names(shortd)%in%c("age","Fine gauge","Pants","Sleep","Swim","Trend","Casual bottoms"))]
library(ca)options(digits=3)brand.ca=ca(juzheng)#输出相关矩阵(主成分的思想)
plot(brand.ca)
新发现:从对应分析的可视化图中,我们有理由得到如下结论:
1,随着年龄的变化,女性的服装选择有明显的变化,适合的年龄穿适合的衣服是成熟的一种体现。
2,只有年轻的女孩,才有可能选择 :贴身衬裙(ntimates,Chemises),彰显年轻的气息;
3,18-25岁,25-32岁 都喜欢选择:Legwear, Shorts, Layering;
4,32-39岁大众的选择:Skirts(半身裙),Lounge(休闲),Dresses(洋装),也是这就是职场女性的常态着装之选吧。
5,随着年龄的增大,女性的选择越来越少,也许服装的市场的主力军永远属于年轻的女性吧;选择的风格也比较稳重,也许容颜易老,不需要太多成本的服装艳妆了吧。
愿所有女性,不管是女儿,妻子,母亲永远美丽,永远开心。
推荐阅读:
文章底部点个「在看」,坚持为你创作!
网友评论