淘寶大碼連衣裙女裝店鋪(淘寶連衣裙數(shù)據(jù)分析)

昨晚,很多人都默默打開淘寶,搜索了一下連衣裙。甚至有幾個男性朋友也很好奇搜了一下——他們從來沒在網(wǎng)上買過連衣裙,甚至很少在上面購物。

但他們就像被某種病毒感染一樣,想看一下第二條和第三條推薦結(jié)果。

這種莫名其妙的行為藝術(shù),源頭是網(wǎng)友“風(fēng)中的廠長”發(fā)的一條微博:淘寶連衣裙客單價低于128,會被淘寶方面標(biāo)注為“低價人群”。

這位網(wǎng)友進(jìn)一步論證,淘寶連衣裙客單價低于128元,或者滴滴好評率低于4.8的女性,電商行業(yè)的人都不會和她們戀愛,因為這樣的人往往會比較“難搞”、“難伺候”。

很多女性“嚇得”趕緊打開淘寶,然后紛紛曬出自己連衣裙的客單價。我朋友圈里,很多女性朋友曬出的客單價大多遠(yuǎn)遠(yuǎn)高于128元。

相信這些朋友不但長舒一口氣,內(nèi)心也很是滿足:這個數(shù)字,雖然證明自己花了不少錢,但也讓自己脫離了“低價人群”的嫌疑。

這種“行為藝術(shù)”,形成了某種輿論,淘寶官方很快出來回應(yīng)稱,所謂128元客單價以下被系統(tǒng)默認(rèn)為“低價人群”的事并不存在。用戶的偏好不是靜態(tài)的,算法難就難在要做出個性化推薦,對每個人的推薦,都是基于對其消費習(xí)慣的動態(tài)捕捉上。

一、大數(shù)據(jù)正在捕獲我們,這是真的

淘寶官方的回應(yīng)大抵是可信的:如果說消費習(xí)慣和人的性格之間真的有某種可靠的聯(lián)系,那也一定有更復(fù)雜的解釋,否則花那么多錢搞數(shù)據(jù)分析就完全是浪費了。

但是,這么多人相信“風(fēng)中的廠長”所發(fā)布的“128定律”,并不是毫無來由。

到了2019年,一個普通的電商用戶,也知道了“大數(shù)據(jù)”這個詞。有過網(wǎng)購經(jīng)歷的人都知道,平臺會根據(jù)自己的購買行為,做進(jìn)一步的推薦。

你買了一件連衣裙,會給你推薦連衣裙。更高明的算法,可能還會給你推薦一款用來搭配的涼鞋。

如果你買的連衣裙是128元的,推薦的涼鞋價格也不會高到哪里去——價格,畢竟是一個考慮的因素。

把連衣裙客單價低于128(也可能是別的數(shù)字)的人統(tǒng)一劃分為一個人群,用來分析她們的消費習(xí)慣、投訴數(shù)量,也不是沒有可能,因為這可以改進(jìn)平臺的工作效率。

但是,把用戶稱作“低價人群”,總是不太禮貌的行為。更重要的是,一個花128元買連衣裙的女士,也完全有可能花幾千塊買一個包包。

網(wǎng)友紛紛曬出自己在某購物APP中的搜索結(jié)果。

真正厲害的算法,應(yīng)該琢磨的恰恰是更個性的東西,最終讓自己的推薦更打動消費者。

換句話說,大數(shù)據(jù)對人的捕獲能力,可能已經(jīng)遠(yuǎn)遠(yuǎn)超過了用128客單價來區(qū)分人群這種低級階段。我們可能被以別的標(biāo)準(zhǔn)做了區(qū)分,或者被貼的標(biāo)簽遠(yuǎn)遠(yuǎn)不止價格這一個。大數(shù)據(jù)為我們提供了方便,更為商家提供了方便。

很多人相信這個“128定律”,本質(zhì)上就是把大數(shù)據(jù)想得太簡單了。他們是把“自己的數(shù)據(jù)”理解為大數(shù)據(jù)。

事實上,大數(shù)據(jù)不但動態(tài)捕捉你自己的數(shù)據(jù),還會在海量的數(shù)據(jù)中進(jìn)行計算,背后有復(fù)雜的模型——這可能不是多數(shù)非專業(yè)人士所能想象的,而大多數(shù)相信“128定律”的人,這時候的表現(xiàn)就像典型的文科生(并非黑文科生)。

二、標(biāo)簽與認(rèn)同:為自己標(biāo)一個價

更值得注意的,其實是網(wǎng)友的反應(yīng)。他們相信“128定律”,除了對大數(shù)據(jù)的誤解外,還有一種情感因素。

很多朋友并沒有感到被這個所謂的“128定律”冒犯,她們樂此不疲地去看自己的連衣裙價格,甚至連男人們也行動了起來,跑去搜索——大家想知道,自己是否屬于這個“低價人群”。

“128定律”是否靠譜并不重要,大家需要的是一個可以區(qū)分自己的標(biāo)簽,最好是一個“價格標(biāo)簽”。

在互聯(lián)網(wǎng)時代,每個人都想“脫穎而出”,提高自己的“能見度”,如果能被淘寶這樣的大平臺標(biāo)注為“高端人群”,我相信很多人都會毫不猶豫地發(fā)朋友圈曬出來。

其實,不少以“低價人群”自居的,其實也在以自嘲的形式,來標(biāo)榜自己的身價。

想想吧,每年底,有多少人在曬自己的年度支付賬單,一方面假裝后悔地反省,一方面在曬自己是多么有錢,花錢越多的人,曬得就越開心。

支付寶2018年度賬單。圖/視覺中國

很少有人在乎,這個賬單其實也是個人數(shù)據(jù)。

這是一種新的尋求認(rèn)同的方式。大數(shù)據(jù)在“捕獲”我們,在分析我們,甚至在算計我們,但是我們似乎不在乎。我們愛它呈現(xiàn)出來的“客觀性”,我們發(fā)自內(nèi)心地認(rèn)可它給我們的“定義”。

三、警惕反向塑造自己

這才是最值得警惕的。我們似乎正在喪失對“自我”的掌控,越來越依靠這些大數(shù)據(jù)平臺為我們描繪的“畫像”。

更進(jìn)一步,我們會根據(jù)這些“畫像”來調(diào)整自己,讓自己更符合平臺對我們的設(shè)定。

這可能就是那些算法工程師夢寐以求的:他們不但要懂我們、分析我們,還要真正影響我們。

最終,我們會變得越來越像一個數(shù)據(jù)。或許有那么一天,系統(tǒng)會提示我們,“根據(jù)你的習(xí)慣,這件128元的連衣裙就是最適合你的”,而我們也會心安理得地接受。

但可以肯定,大數(shù)據(jù)算法不可能僅僅從你的某一個行為就定義你好不好打交道,適不適合做女朋友。把穿128塊錢連衣裙等同于“低價人群”,是對大數(shù)據(jù)算法的降維打擊,不準(zhǔn)確,也不客觀。

□ 張豐(媒體人)

編輯 王言虎 實習(xí)生 李文雋 校對 陸愛英

1、數(shù)據(jù)爬取

爬取對象:淘寶“連衣裙 夏”的搜索結(jié)果。爬取對象的選擇分析我在文章中也有提及。

工具:Scrapy。

代碼:我把當(dāng)時實現(xiàn)的代碼放在了GitHub上,地址:
https://github.com/younghz/TBBKAnalysis,感興趣的可以看一下。關(guān)于Scrapy的知識與爬蟲的編寫可以見專欄:
http://blog.csdn.net/column/details/younghz-scrapy.html

2、數(shù)據(jù)分析

分析內(nèi)容可見上述Repository的Wiki(
https://github.com/younghz/TBBKAnalysis/wiki)。我也會將其寫在下面。或者直接看上面知乎問題中我寫的答案。

工具:ipython & matplotlib。

3、分析內(nèi)容

分析內(nèi)容放在了Wiki中,鏈接:
https://github.com/younghz/TBBKAnalysis/wiki?;蛘咧苯右娤旅嬲?。(注意:如果Wiki中圖片無法打開,請使用較高版本的Chrome瀏覽器。)

4、正文

一、案例選擇。

現(xiàn)在著手分析的對象是能讓你在三個月獲得大把鈔票的“爆款”。這 當(dāng)然得拿最有代表性的商品當(dāng)例子,最有代表性就是最火的??纯词裁醋罨稹O旅媸翘詫氈笖?shù)(
http://shu.taobao.com/top/16/search)數(shù)據(jù)。

圖一 搜索排行

圖二 成交排行

很明顯,那么就取商品的搜索量和成交量二者交集——“連衣裙 夏”做案例進(jìn)行分析。

二、案例分析

在淘寶中搜索“連衣裙 夏”,首先提取有用數(shù)據(jù),這里我基于Scrapy框架實現(xiàn)了一個爬蟲,爬取按銷量排行的前五頁數(shù)據(jù)(聽說前五頁是所有商家的夢哦),銷量在三千到三萬,銷量低于三千的款也不夠‘爆’吧(我也不清楚,呵呵)。 這里提取每個寶貝銷量、寶貝價格、店鋪性質(zhì)以及店鋪名稱等分析。

三、數(shù)據(jù)分析

下面對提取的數(shù)據(jù)進(jìn)行分析,分析分為兩種:首頁和前五頁。(以下圖表使用ipython基于matplotlib生成) 如果說前五頁屬于‘爆’級別,那么首頁就是‘爆爆’了吧。

(1)最關(guān)心的當(dāng)然還是銷量

基于上面抓取的數(shù)據(jù),分析。

圖三 前五頁銷量趨勢

圖四 首頁銷量趨勢

看過了什么感受,這怎么成指數(shù)下降趨勢啊。即便是爆款,銷量差距還是很懸殊的啊。即使在‘爆爆’級別的首頁銷量老大和老二都不是一個級別的啊。競爭好激烈不是嗎。

我們繼續(xù)進(jìn)行局部放大,看看銷量在一萬以上的是什么情況。

圖五 銷量大于一萬趨勢

小伙伴,是不是有種要做就做老大的感腳。

(2)看價格

下面是前五頁商品的價格曲線。

圖六 前五頁商品價格及平均價格圖

其中紅色的線是所有商品的平均價格,低于50塊。而且價格可分為三個區(qū)間:

  • 區(qū)間一:50以下。這部分商品最密集,大部分商品價格集中在這個區(qū)域。
  • 區(qū)間二:50到100。這屬于第二階梯。
  • 區(qū)間三:100以上,看上去這部分好刺眼啊,總有零星的幾個拔出來。相對比例很少。

有什么感想,要是你做,把你的東西價位定義在哪個區(qū)間呢。繼續(xù)看下首頁的價格數(shù)據(jù)。

圖七 首頁商品價格走勢圖

要是感覺這個不夠明顯,我們還是來看銷量高于一萬的走勢圖。

圖八 銷量大于10000商品價格走勢圖

下面來研究下這些爆款都來自哪里。

(3)賣家地點

來看看這些做爆款的賣家都在哪,地點是不是也為他們提供了一定的優(yōu)勢?

圖九 賣家地點分布

從高到低分別是——廣東、浙江、北京、上海、江蘇、山東、湖北、河南、遼寧、江西。

(4)店鋪是否是天貓賣家

圖十 是否是天貓(前五頁數(shù)據(jù))

圖十一 是否是天貓(首頁數(shù)據(jù))

這個比例看起來都差不多??磥硪矝]什么必然的關(guān)系。

(5)商品名字

給你舉兩個: “夏季新款女式連衣裙莫代爾背心長裙波西米亞氣質(zhì)長裙打底裙子” “14夏季新款韓版短袖V領(lǐng)波西米亞連衣裙大碼女裝沙灘裙子” “夏裝新款女連衣裙短袖韓國性感修身顯瘦包臀V領(lǐng)大碼” 呵呵,想沒想好你的叫什么名字了? 如果買的是內(nèi)褲,按照上面的規(guī)則應(yīng)該就叫:“14夏季新款波西米亞修身顯瘦包臀韓國氣質(zhì)新版安全防盜內(nèi)褲”,呵呵。

(6)買家分析

剛才說的都是賣家的,現(xiàn)在看看消費者??纯搓P(guān)鍵詞喜好度(
http://shu.taobao.com/searchindex?spm=0.0.0.0.3Mt2Y2&query=
%E8%BF%9E%E8%A1%A3%E8%A3%99%20%E5%A4%8F)對你有沒有幫助。

圖十二 搜索喜好度

第一是黑龍江,遼寧也入圍前十了。

[ 作者:piikee   分類:女裝]