美文网首页数据专栏
美女 “十八” 变,服装看到见

美女 “十八” 变,服装看到见

作者: 数据砖家 | 来源:发表于2020-04-26 19:59 被阅读0次

    人靠衣装,马靠鞍;鲁迅说:“好看的姑娘有两种:一种是长的好看,一种是穿的好看”。年龄的差异与气质变化,在服装选择上可以显而易见。基于2万多条女性用户的服装购买记录,一起探索女性年龄与服装选择的别样色彩。

    一生中我们选择的服装类型,大部分都在下图中可以找到。结尾的结论也是很亮眼;对女性来说,岁月无情,愿美丽仍在。

    下图是部分数据预览:女性服装的商业交易数据,其中包含年龄,标题,评分,服装类型等一些数据,这里只显示部分列名。

    这里选择 age, tag(服装类型的标签)两列数组,我们需要对年进行分组。数据曲线基本上符合正态分布,年龄区间在[25-99]。75岁以上的数据量很少,有离群状态,这里直接过滤掉不做分析。

    根据经典的人生7年的周期来对年龄进行分组。

    #用sqldf分析

    tagd<- sqldf("select age,count(1) as cnt from wd group by age")ggplot(tagd, aes(age, cnt ,colour=age,scales="free"))+geom_line()

    summary(tagd$age)  

     Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 18.0037.0056.0056.1475.0099.00

    数据年龄分组:

    agetag<-sqldf("select tt as age, tag, count(1) as cnt from tagd group by age, tag")

    # 对应分析函数需要宽数据,这里将长数据转为宽数据

    library(tidyr)long2short = spread(agetag,key=tag,value=cnt)

    #删除你不想要的列

    shortd<-long2short[,-which(names(long2short)%in%c("V1"))]

    #用0来替代NA值

    shortd[is.na(shortd)] <- 0

    对应分析开始闪亮登场喽:

    rownames(shortd) <- c('18-25','25-32','32-39','39-46','46-53','53-60','other')

    juzheng<-shortd[,-which(names(shortd)%in%c("age","Fine gauge","Pants","Sleep","Swim","Trend","Casual bottoms"))]

    library(ca)options(digits=3)brand.ca=ca(juzheng)#输出相关矩阵(主成分的思想)

    plot(brand.ca)

    新发现:从对应分析的可视化图中,我们有理由得到如下结论:

    1,随着年龄的变化,女性的服装选择有明显的变化,适合的年龄穿适合的衣服是成熟的一种体现。

    2,只有年轻的女孩,才有可能选择 :贴身衬裙(ntimates,Chemises),彰显年轻的气息;

    3,18-25岁,25-32岁 都喜欢选择:Legwear, Shorts, Layering;

    4,32-39岁大众的选择:Skirts(半身裙),Lounge(休闲),Dresses(洋装),也是这就是职场女性的常态着装之选吧。

    5,随着年龄的增大,女性的选择越来越少,也许服装的市场的主力军永远属于年轻的女性吧;选择的风格也比较稳重,也许容颜易老,不需要太多成本的服装艳妆了吧。

    愿所有女性,不管是女儿,妻子,母亲永远美丽,永远开心。

    推荐阅读:

    数据分析的“六字决”

    美英澳印的痴心:借“疫”索赔?

    鹤岗哭诉:一个鬼城的诞生

    文章底部点个「在看」,坚持为你创作!

    相关文章

      网友评论

        本文标题:美女 “十八” 变,服装看到见

        本文链接:https://www.haomeiwen.com/subject/sntjvctx.html