預(yù)測,是供應(yīng)鏈繞不開的話題。其復(fù)雜性和難度,在所有供應(yīng)鏈問題中可謂“首屈一指”。
同時,預(yù)測,又是統(tǒng)計分析里內(nèi)容最為繁雜的。你甚至可以認(rèn)為,整個統(tǒng)計分析理論,就是以預(yù)測為唯一目標(biāo)的。
從本篇起,我們就來看看,供應(yīng)鏈可以如何面對預(yù)測問題。
(按照本號開篇談及的方法論,每個案例將分為三個部分。首先是從技術(shù)方向?qū)忣},其次是從現(xiàn)實方向?qū)忣},最后是關(guān)于實用方案的總結(jié)。)
**************************************************************************
已知過去四年的銷售數(shù)據(jù)如下:
我們是否可以搭建合適模型,用于預(yù)測未來?
**************************************************************************
連續(xù)4年48個月的銷售數(shù)據(jù),數(shù)據(jù)按照時間順序展開……并不意外,就像大多數(shù)供應(yīng)鏈預(yù)測問題一樣,這是個時間序列分析問題。
對于時間序列分析,我們首先需要回答的第一個問題是:這是不是個平穩(wěn)序列?
(知識點:時間序列分為兩類,即,平穩(wěn)序列、非平穩(wěn)序列。 所謂“平穩(wěn)序列”,也即序列中只有隨機(jī)波動。
所謂“非平穩(wěn)序列”,是指序列中包含著趨勢、季節(jié)性、周期性等一種或者多種成分。當(dāng)然, 隨機(jī)波動,也一樣可以存在于“非平穩(wěn)序列”之中。)
顧名思義,如果我們面前是個“平穩(wěn)序列”,那么我們甚至可以說,這種序列是不需要“預(yù)測”的。因為,該序列本身的均值、方差等特征就已經(jīng)足夠描述未來了。
如何確認(rèn)是否是平穩(wěn)序列呢?
按照統(tǒng)計學(xué)語言,這是個“假設(shè)檢驗”,這個問題可以重新表述為:這個序列是否滿足“平穩(wěn)序列”的假設(shè)?--按照定義我們知道,平穩(wěn)序列,應(yīng)該是圍繞著均值而隨機(jī)波動的序列。
(統(tǒng)計假設(shè)的檢驗方法其實很多。我們這里僅推薦兩種簡單易用并且在Excel里非常容易實現(xiàn)的方式: 1、相關(guān)性分析。兩個序列之間的統(tǒng)計相關(guān)性,值范圍[-1,1],>0.7為強(qiáng)正相關(guān),<-0.7為強(qiáng)負(fù)相關(guān)。Excel函數(shù)CORREL。
2、RMSE剩余標(biāo)準(zhǔn)差分析。先計算預(yù)測序列相對于原始序列的剩余標(biāo)準(zhǔn)差,然后以其相對于序列均值的比值來判定。要求該比值低于15%)
原序列的均值為808,“平穩(wěn)序列”假設(shè)的涵義是,該數(shù)列每一個值都是圍繞均值808波動的。因此,假定的“平穩(wěn)序列”即為均值序列: {808,808,808,808,……,808,808}
這里直接進(jìn)入計算結(jié)果和結(jié)論。后面的“非平穩(wěn)序列”分析中將詳細(xì)說明計算過程。
********************************************************************************
計算結(jié)果:相關(guān)性結(jié)果為-3.18918E-16,基本上等于0,完全不相關(guān)。 剩余標(biāo)準(zhǔn)差分析結(jié)果得到比值32%,未通過。
結(jié)論:該序列不是“平穩(wěn)序列”。
********************************************************************************
既然不是“平穩(wěn)序列”,那就意味著序列中應(yīng)當(dāng)含有趨勢、季節(jié)性、周期性等成分。我們現(xiàn)在需要做的,是第二個問題:求解該序列中的趨勢性、季節(jié)性和周期性。
首先,該序列的“季節(jié)性”。
自相關(guān)分析,可以清楚地揭示時間序列的季節(jié)性,尤其是季節(jié)周期的長度。
(知識點:所謂“自相關(guān)分析”,是指序列自身的相關(guān)性。
具體涵義是:原序列是從第1個數(shù)據(jù)開始的,如果我們剔除掉最前面的n-1個數(shù)據(jù),
就得到了從第n個數(shù)據(jù)(n>1)開始的新序列,這個新序列與原序列的相關(guān)性,
就稱之為原數(shù)列的第n階自相關(guān)系數(shù)。)
對于48個值的原始序列,這里計算了1~36階自相關(guān)系數(shù),如下表所示。
可以很清晰地看到,在第12、24、36階,自相關(guān)系數(shù)明顯提高到0.7左右的水平。這就清晰地告訴我們,原始序列具有明顯的“季節(jié)性”,并且這種季節(jié)性表現(xiàn)為年度正相關(guān)關(guān)系。也即,每年12個月的走勢都具有相似性,正所謂“年年月月花相似”。
***下表展示了實際計算過程,注意隱去了中間的一大部分列和行。主要的計算公式在單元格"B2","C3"(公式可以下拉自動填充至“C36”)和"A3"(公式可以下拉自動填充至“A36”)。A列的計算結(jié)果即為1~36階自相關(guān)系數(shù)。
其次,該序列的“趨勢性”。
趨勢性,描述的是時間序列季節(jié)性之上的增長趨勢,也即,每一個季節(jié)周期,對上一個季節(jié)周期的增長趨勢。
由于已經(jīng)查明原始序列的季節(jié)周期為年(12個月),因此,這里的趨勢性其實就是年度增長趨勢。簡單計算結(jié)果如下表:
連續(xù)三年的增長率為8%,40%,19%。年均增長率22%。
正常接下來我們就應(yīng)該分析這個年度增長趨勢了。但是很遺憾,對于本序列,這個分析沒啥意義。因為樣本數(shù)據(jù)量只有3個,我們只能簡單估計年度增長期望值為22%,而這個期望值的均方差高達(dá)59%。
這意味著:我們只能預(yù)測年度增長為22%,并且我們很清楚知道這個預(yù)測基本等同于拍腦袋。(所以,放棄吧少年 ^_^)
當(dāng)然,這也并不意味著我們沒辦法處理“趨勢性”。我們只是需要更多的數(shù)據(jù)才能處理這類趨勢性問題,以及,我們或許需要查找其背后邏輯相關(guān)的宏觀經(jīng)濟(jì)數(shù)據(jù)然后通過建模分析來解釋或者描述原始序列中的趨勢性。
最后,該序列的“周期性”。
周期性,也就是時間序列的循環(huán)波動,是時間序列所呈現(xiàn)的圍繞長期趨勢的一種波浪形或震蕩式波動。通常,周期性是由商業(yè)和經(jīng)濟(jì)活動引起的,不同于趨勢變動也不同于季節(jié)變動,而是一種漲落相間的交替波動,其變動周期多在一年以上并且周期長短不一。
所以,我們幾乎不可能從前述4年數(shù)據(jù)中求得“周期性”。當(dāng)然,除非是5~10年及以上尺度的供應(yīng)鏈規(guī)劃問題,否則我們也完全不需要介入這個問題。
********************************************************************************
討論結(jié)果:該時間序列具有明顯的以12個月為周期的“季節(jié)性”。 該時間序列的趨勢性為持續(xù)正增長,但增長率可預(yù)測性差。
********************************************************************************
正兒八經(jīng)講了半天,說實話我都累。
其實,真實工作沒這么復(fù)雜,圖形觀察通常是最簡易快捷通向結(jié)論的。請看下圖:
看著這個圖,所謂的“12個月周期的季節(jié)性”是不是顯而易見呢?(除了相對特殊的Y2)
所以,現(xiàn)實中,大多情況下你只需要直接檢驗各年度序列之間的相關(guān)性即可。
前文洋洋灑灑千言,您只需要作為知識背景了解一下即可,或者,以備不時之需——如果很悲催你所面對的不是年度季節(jié)性序列,那么你就照葫蘆畫瓢從頭開始來一遍好了……
我們已經(jīng)完成了對案例1的定性解答,但是,實際工作總是要求我們給出定量工具的。
所以,第三個問題:如何構(gòu)建定量模型來支持未來預(yù)測?
基于前述定性討論,我們知道,定量預(yù)測未來所需要的參數(shù)包括:(1)年度增長趨勢值(期望值22%,誤差可能很大);(2)12個月各自的季節(jié)趨勢值。
對于季節(jié)趨勢值,簡單粗暴的計算方式如下:
也即,我們的時間序列預(yù)測模型將長成下面的樣子:
Y(t) M(n) = Y(o) * (1 + Year Growth Rate) ^(t-o) * Season Factor(n)
這里的o表示基準(zhǔn)年份,t 表示待預(yù)測年份,第t年;n表示待預(yù)測月份,n=1~12。 Y(o)表示基準(zhǔn)年份的年度總和,Y(t) M(n)表示第t年的第n月的預(yù)測值。
可以看到,它不同于所有應(yīng)用統(tǒng)計學(xué)書上能夠看到的乘法或者加法模型。但這不是重點,畢竟乘法或者加法都是表述方式而已。重點在于,搭出來的模型,是否是統(tǒng)計意義上可用的?
最后一個問題:模型的檢驗。
前文提及了兩種統(tǒng)計檢驗的簡單方法:相關(guān)性分析、剩余標(biāo)準(zhǔn)差分析。
但是首先,我們得依據(jù)預(yù)測模型生成預(yù)測序列,或者說,擬合序列。如下表:
請注意,這里忽略了明知道誤差很大的年度增長趨勢值,改采用了真實值。這么做的原因,會在下篇文章中解釋。
1、相關(guān)性分析計算過程如圖:
***下表展示了實際計算過程,注意隱去了中間的一大部分行。主要的計算公式在單元格"B4",即相關(guān)系數(shù)
2、剩余標(biāo)準(zhǔn)差分析
計算過程如圖:
***下表展示了實際計算過程,預(yù)測偏差即為對應(yīng)預(yù)測值與原始序列值的差,預(yù)測方差為預(yù)測偏差的平方。 RMSE剩余標(biāo)準(zhǔn)差,計算公式=SQRT(SUM(C31:N34)/(48-2))。這里,C31:N34即為48個預(yù)測偏差的平方,“48-2”的含義是序列數(shù)48減去自由度2。這里的“減2”是計算剩余標(biāo)準(zhǔn)差是必須的。
RMSE/ave,即“剩余標(biāo)準(zhǔn)差 / 均值”,結(jié)果是個比值。判定標(biāo)準(zhǔn)為“<15%”
********************************************************************************
計算結(jié)果:相關(guān)性結(jié)果為0.945,遠(yuǎn)大于0.7,預(yù)測模型與原始序列高度相關(guān)。 剩余標(biāo)準(zhǔn)差分析結(jié)果得到比值10%,通過,該模型擬合度可以接受。
結(jié)論:(在不考慮年度增長預(yù)測誤差的前提下,)該定量預(yù)測模型可接受。
********************************************************************************
案例1所提供的時間序列,為非平穩(wěn)序列,有著明顯的以12個月為周期的季節(jié)性。
即便基于最簡單的移動平均法的季節(jié)因子定量模型,模型的擬合程度也是可以接受的。
(本篇完)
下一篇我們將繼續(xù)從現(xiàn)實方向討論案例1。
從“知其然”到“知其所以然”,我們就能夠理解,本篇技術(shù)方向討論中以“或繁或簡甚至有些隨心所欲地”調(diào)用不同統(tǒng)計學(xué)技術(shù)的原因所在。
下周日再見~~
義烏漲完廣州漲 通達(dá)兔等快遞全年或增收數(shù)十億!
1472 閱讀多多買菜:悶聲增長
1417 閱讀又出傷人事件!買A退B、簽收訛詐、押金不退……快遞小哥如何避坑?
1204 閱讀歐盟《關(guān)鍵原材料法案》:全球資源戰(zhàn)略格局的重大轉(zhuǎn)變及應(yīng)對策略
1220 閱讀18天抵歐!寧波舟山港迎來史上最快中歐航線
1162 閱讀2025年1-6月港口貨物、集裝箱吞吐量
1065 閱讀傳網(wǎng)絡(luò)貨運“獎補”全面暫停,誰破防了?
1047 閱讀興滿物流華北首個樞紐落戶普洛斯?jié)蠄@區(qū),開啟零擔(dān)物流新格局
1007 閱讀國家鐵路集團(tuán)950億成立新藏鐵路公司
750 閱讀2025年7月中國快遞發(fā)展指數(shù)報告
723 閱讀