Bewegende gemiddelde vooruitskatting Inleiding. Soos jy kan raai ons is op soek na 'n paar van die mees primitiewe benaderings tot vooruitskatting. Maar hopelik dit is ten minste 'n waardevolle inleiding tot sommige van die rekenaar kwessies wat verband hou met die implementering van voorspellings in sigblaaie. In dié opsig sal ons voortgaan deur te begin by die begin en begin werk met bewegende gemiddelde voorspellings. Bewegende gemiddelde voorspellings. Almal is vertroud met bewegende gemiddelde voorspellings ongeag of hulle glo hulle is. Alle kollege studente doen dit al die tyd. Dink aan jou toetspunte in 'n kursus waar jy gaan vier toetse gedurende die semester het. Kom ons neem aan jy het 'n 85 op jou eerste toets. Wat sou jy voorspel vir jou tweede toetstelling Wat dink jy jou onderwyser sou Ongeag voorspel vir jou volgende toetstelling Wat dink jy jou vriende kan voorspel vir jou volgende toetstelling Wat dink jy jou ouers kan voorspel vir jou volgende toetstelling al die blabbing jy kan doen om jou vriende en ouers, hulle en jou onderwyser is baie geneig om te verwag dat jy iets kry in die gebied van die 85 wat jy nou net gekry. Wel, nou kan aanneem dat ten spyte van jou self-bevordering van jou vriende, jy oorskat jouself en vind jy minder vir die tweede toets te studeer en so kry jy 'n 73. Nou wat is al die betrokkenes en onbekommerd gaan verwag jy sal op jou derde toets te kry Daar is twee baie waarskynlik benaderings vir hulle om 'n skatting, ongeag of hulle dit sal met julle deel te ontwikkel. Hulle mag sê om hulself, quotThis man is altyd waai rook oor sy intelligensie. Hes gaan na 'n ander 73 as hes gelukkig te kry. Miskien sal die ouers probeer meer ondersteunend te wees en sê, quotWell, tot dusver youve gekry 'n 85 en 'n 73, so miskien moet jy dink oor hoe om oor 'n (85 73) / 2 79. Ek weet nie, miskien as jy minder gedoen partytjies en werent swaaiende die mol al oor die plek en as jy begin doen 'n baie meer studeer jy kan kry 'n hoër score. quot Beide van hierdie vooruitskattings eintlik bewegende gemiddelde voorspellings. Die eerste is net met jou mees onlangse telling tot jou toekomstige prestasie te voorspel. Dit staan bekend as 'n bewegende gemiddelde vooruitskatting gebruik van een tydperk van data. Die tweede is ook 'n bewegende gemiddelde voorspelling, maar die gebruik van twee periodes van data. Kom ons neem aan dat al hierdie mense breker op jou groot gees soort het dronk jy af en jy besluit om goed te doen op die derde toets vir jou eie redes en 'n hoër telling in die voorkant van jou quotalliesquot sit. Jy neem die toets en jou telling is eintlik 'n 89 Almal, insluitende jouself, is beïndruk. So nou het jy die finale toets van die semester kom en soos gewoonlik jy voel die behoefte om almal te dryf in die maak van hul voorspellings oor hoe sal jy doen op die laaste toets. Wel, hopelik sien jy die patroon. Nou, hopelik kan jy die patroon te sien. Wat glo jy is die mees akkurate Whistle Terwyl ons werk. Nou moet ons terugkeer na ons nuwe skoonmaak maatskappy wat begin is deur jou vervreemde halfsuster genoem Whistle Terwyl ons werk. Jy het 'n paar verkope verlede data wat deur die volgende artikel uit 'n sigblad. Ons bied eers die data vir 'n drie tydperk bewegende gemiddelde skatting. Die inskrywing vir sel C6 moet wees Nou kan jy hierdie sel formule af na die ander selle C7 kopieer deur C11. Let op hoe die gemiddelde beweeg oor die mees onlangse historiese data, maar gebruik presies die drie mees onlangse tye beskikbaar wees vir elke voorspelling. Jy moet ook sien dat ons nie regtig nodig om die voorspellings vir die afgelope tyd maak om ons mees onlangse voorspelling ontwikkel. Dit is beslis anders as die eksponensiële gladstryking model. Ive ingesluit die quotpast predictionsquot omdat ons dit sal gebruik in die volgende webblad om voorspellingsgeldigheid meet. Nou wil ek die analoog resultate aan te bied vir 'n periode van twee bewegende gemiddelde skatting. Die inskrywing vir sel C5 moet wees Nou kan jy hierdie sel formule af na die ander selle C6 kopieer deur C11. Let op hoe nou net die twee mees onlangse stukke historiese data gebruik vir elke voorspelling. Weereens het ek die quotpast predictionsquot vir illustratiewe doeleindes en vir latere gebruik in vooruitskatting validering ingesluit. Sommige ander dinge wat van belang om te let. Vir 'n m-tydperk bewegende gemiddelde voorspelling net die m mees onlangse data waardes word gebruik om die voorspelling te maak. Niks anders is nodig. Vir 'n m-tydperk bewegende gemiddelde voorspelling, wanneer quotpast predictionsquot, agterkom dat die eerste voorspelling kom in periode m 1. Beide van hierdie kwessies sal baie belangrik wees wanneer ons ons kode te ontwikkel. Die ontwikkeling van die bewegende gemiddelde funksie. Nou moet ons die kode vir die bewegende gemiddelde voorspelling dat meer buigsaam kan word ontwikkel. Die kode volg. Let daarop dat die insette is vir die aantal periodes wat jy wil gebruik in die vooruitsig en die verskeidenheid van historiese waardes. Jy kan dit stoor in watter werkboek wat jy wil. Funksie MovingAverage (Historiese, NumberOfPeriods) as 'n enkele verkondig en inisialisering veranderlikes Dim punt Soos Variant Dim Counter As Integer Dim Akkumulasie as 'n enkele Dim HistoricalSize As Integer Inisialiseer veranderlikes Counter 1 Akkumulasie 0 bepaling van die grootte van Historiese skikking HistoricalSize Historical. Count Vir Counter 1 Om NumberOfPeriods opbou van die toepaslike aantal mees onlangse voorheen waargeneem waardes Akkumulasie Akkumulasie Historiese (HistoricalSize - NumberOfPeriods toonbank) MovingAverage Akkumulasie / NumberOfPeriods die kode sal in die klas verduidelik. Jy wil die funksie te posisioneer op die sigblad sodat die resultaat van die berekening verskyn waar dit wil die following. R - vooruitskatting Ons sal bespreek hoe die metodes werk en hoe om dit te gebruik. Voorspelling pakket oorsig wysig Eksponensiële Smoothing wysig Name AKA: eksponensieel geweeg bewegende gemiddelde (EWMA) Ekwivalent aan ARIMA (0,1,1) model met geen konstante term wat gebruik word vir stryk data vir voorlegging maak voorspellings eenvoudige bewegende gemiddelde: verlede waarnemings geweeg ewe eksponensiële smoothing: ken eksponensieel afneem gewigte met verloop van tyd Formule xt - rou data volgorde ST - uitset van die eksponensiële gladstryking algoritme (skatting van die volgende waarde van x) - glad faktor. 0160lt160160lt1601.Choosing reg geen formele manier van keuse statistiese tegniek kan gebruik word om die waarde van (bv OLS) te optimaliseer hoe groter die afsluiting dit raak te naïef vooruitskatting (dieselfde hawens as oorspronklike reeks met 'n tydperk lag) Double Eksponensiële Smoothing wysig Eenvoudige eksponensiële gladstryking nie goed doen wanneer daar 'n tendens (daar sal altyd vooroordeel wees) Double eksponensiële gladstryking is 'n groep van metodes wat handel oor die probleem Holt-Winters dubbele eksponensiële gladstryking te wysig en vir t gt 1 deur waar is die data glad faktor. 0160lt160160lt1601, en is die tendens glad faktor. 0160lt160160lt1601. Uitset F TM - 'n skatting van die waarde van x op tyd TM, mgt0 gebaseer op die rou data tot tyd t Drie eksponensiële gladstryking wysig in ag neem seisoenale veranderinge sowel as tendense eerste voorgestel deur Holts student, Peter winters, in 1960 Input XT - rou data volgorde van waarnemings t 1601600 L lengte 'n siklus van seisoenale verandering die metode bereken: 'n tendens lyn vir die data seisoenale indekse wat gewig die waardes in die tendens lyn op grond van waar daardie tyd punt val in die siklus van lengte L. s t verteenwoordig die stryk waarde van die konstante deel van tyd t. BT verteenwoordig die volgorde van die beste raming van die lineêre tendens wat bo-op die seisoenale veranderinge CT is die volgorde van seisoenale korreksiefaktore CT is die verwagte persentasie van die voorspel tendens te eniger tyd t mod L in die siklus wat die waarnemings te neem aan inisialiseer die seisoenale indekse c TL daar moet ten minste een volledige siklus in die data die uitset van die algoritme weer as F TM is geskryf wees. 'n skatting van die waarde van x op tyd TM, mgt0 gebaseer op die rou data tot tyd t. Drie eksponensiële gladstryking word gegee deur die formule waar is die data smoothing faktor. 0160lt160160lt1601, is die tendens glad faktor. 0160lt160160lt1601, en is die seisoenale verandering glad faktor. 0160lt160160lt1601. Die algemene formule vir die eerste tendens skatting b 0 is: Die opstel van die aanvanklike ramings vir die seisoenale indekse C I want ek 1,2. L is 'n bietjie meer betrokke. As N is die aantal volledige siklusse teenwoordig is in die data, dan: Let daarop dat 'n j is die gemiddelde waarde van x in die j de siklus van jou data. ETS wysig Herdefiniërende parameters wysig In die praktyk sal die bewegende gemiddelde 'n goeie raming van die gemiddelde van die tydreeks te verskaf indien die gemiddelde konstant of stadig verander. In die geval van 'n konstante gemiddelde, sal die grootste waarde van m die beste raming van die onderliggende gemiddelde gee. 'N langer tydperk waarneming sal gemiddeld uit die gevolge van variasie. Die doel van die verskaffing van 'n kleiner m is om voorsiening te maak die voorspelling om te reageer op 'n verandering in die onderliggende proses. Om te illustreer, stel ons 'n datastel wat veranderinge in die onderliggende gemiddelde van die tydreeks inkorporeer. Die figuur toon die tyd reeks gebruik ter illustrasie saam met die vraag gemiddelde waaruit die reeks was gegenereer. Die gemiddelde begin as 'n konstante by 10. Vanaf die tyd 21, verhoog dit met 'n eenheid in elke tydperk totdat dit die waarde van 20 ten tye 30. bereik Dan weer konstant raak dit. Die data word gesimuleer deur die byvoeging van die gemiddelde, 'n ewekansige geluid van 'n normale verspreiding met 'n nul gemiddelde en standaardafwyking 3. Die resultate van die simulasie is afgerond tot die naaste heelgetal. Die tabel toon die gesimuleerde Waarnemings wat gebruik word vir die voorbeeld. Wanneer ons die tafel gebruik, moet ons onthou dat op enige gegewe tyd, word slegs die afgelope data bekend. Die raming van die model parameter, vir drie verskillende waardes van m word saam met die gemiddelde van die tydreeks in die figuur hieronder. Die figuur toon die bewegende gemiddelde skatting van die gemiddelde by elke keer en nie die voorspelling. Die vooruitskattings sal die bewegende gemiddelde kurwes skuif na regs deur periodes. Een gevolgtrekking is onmiddellik duidelik uit die figuur. Vir al drie skattings loop die bewegende gemiddelde agter die lineêre tendens, met die lag verhoog met m. Die lag is die afstand tussen die model en die raming in die tydsdimensie. As gevolg van die lag, die bewegende gemiddelde onderskat die waarnemings as die gemiddelde is aan die toeneem. Die vooroordeel van die beramer is die verskil op 'n spesifieke tyd in die gemiddelde waarde van die model en die gemiddelde waarde voorspel deur die bewegende gemiddelde. Die vooroordeel wanneer die gemiddelde is aan die toeneem is negatief. Vir 'n dalende gemiddelde, die vooroordeel is positief. Die vertraging in die tyd en die vooroordeel wat in die raming is funksies van m. Hoe groter die waarde van m. hoe groter die omvang van die lag en vooroordeel. Vir 'n voortdurend toenemende reeks met tendens a. die waardes van die lag en vooroordeel van die beramer van die gemiddelde is in die onderstaande vergelykings. Die voorbeeld krommes stem nie ooreen hierdie vergelykings omdat die voorbeeld model is nie voortdurend aan die toeneem, eerder dit begin as 'n konstante, veranderinge aan 'n tendens en dan weer word konstant. Ook die voorbeeld krommes geraak word deur die lawaai. Die bewegende gemiddelde voorspelling van periodes in die toekoms word verteenwoordig deur die verskuiwing van die kromme na regs. Die lag en vooroordeel te verhoog proporsioneel. Die onderstaande vergelykings dui die lag en vooroordeel van 'n voorspelling tydperke in die toekoms in vergelyking met die model parameters. Weereens, hierdie formules is vir 'n tyd reeks met 'n konstante lineêre tendens. Ons moet nie verbaas wees oor die resultaat wees. Die bewegende gemiddelde beramer is gebaseer op die aanname van 'n konstante gemiddelde, en die voorbeeld het 'n liniêre tendens in die gemiddelde tydens 'n gedeelte van die studietydperk. Sedert real time reeks sal selde presies die aannames van enige model te gehoorsaam, moet ons bereid wees om vir sulke resultate. Ons kan ook aflei uit die figuur dat die variasie van die geraas het die grootste effek vir kleiner m. Die skatting is baie meer wisselvallig vir die bewegende gemiddelde van 5 as die bewegende gemiddelde van 20. Ons het die botsende begeertes te m verhoog die effek van variasie te verminder as gevolg van die geraas, en om m te verminder die voorspelling meer reageer op veranderinge aan te bring in die gemiddelde. Die fout is die verskil tussen die werklike data en die geskatte waarde. As die tyd reeks is werklik 'n konstante waarde van die verwagte waarde van die fout is nul en die variansie van die fout bestaan uit 'n term wat 'n funksie is van en 'n tweede termyn wat die variansie van die geraas,. Die eerste kwartaal is die variansie van die gemiddelde geskatte met 'n monster van m waarnemings, die aanvaarding van die data kom uit 'n bevolking met 'n konstante gemiddelde. Hierdie term word tot die minimum beperk deur m so groot as moontlik. 'N Groot m maak die voorspelling nie reageer op 'n verandering in die onderliggende tydreekse. Die voorspelling reageer op veranderinge aan te bring, wil ons m so klein as moontlik (1), maar dit verhoog die foutvariansie. Praktiese vooruitskatting vereis 'n intermediêre waarde. Vooruitskatting met Excel Die vooruitskatting add-in implemente die bewegende gemiddelde formules. Die voorbeeld hieronder toon die analise wat deur die byvoeging in vir die voorbeeld van die data in kolom B. Die eerste 10 waarnemings word geïndekseer -9 deur 0. In vergelyking met die tabel hierbo, is die tydperk indekse verskuif deur -10. Die eerste tien Waarnemings verskaf die begin waardes vir die beraming en gebruik word om die bewegende gemiddelde vir tydperk 0. Die MA (10) kolom (C) toon die berekende bewegende gemiddeldes te bereken. Die bewegende gemiddelde parameter m is in sel C3. Vore (1) kolom (D) toon 'n voorspelling vir een periode na die toekoms. Die voorspelling interval is in sel D3. Wanneer die voorspelling interval verander word na 'n groter aantal van die getalle in die kolom vore geskuif af. Die kolom Fout (1) (e) toon die verskil tussen die waarneming en die voorspelling. Byvoorbeeld, die waarneming by die tyd 1 is 6. Die geskatte waarde uit die bewegende gemiddelde op tydstip 0 is 11.1. Die fout dan is -5,1. Die gemiddeldes en standaardafwykings Gemiddelde Afwyking (MAD) word bereken in selle E6 en E7 respectively.8.4 Moving gemiddelde modelle Eerder as om te gebruik afgelope waardes van die voorspelling veranderlike in 'n regressie, 'n bewegende gemiddelde model gebruik afgelope voorspelling foute in 'n regressie-agtige model . y c et theta e theta e kolle theta e, waar et is wit geraas. Ons noem dit 'n MA (Q) model. Natuurlik, ons het nie die waardes van et waarneem, so dit is nie regtig regressie in die gewone sin. Let daarop dat elke waarde van yt gesien kan word as 'n geweegde bewegende gemiddelde van die afgelope paar voorspel foute. Maar bewegende gemiddelde modelle moet nie verwar word met bewegende gemiddelde smoothing ons in Hoofstuk 6. 'n bewegende gemiddelde model bespreek word gebruik vir die voorspelling van toekomstige waardes, terwyl bewegende gemiddelde smoothing word gebruik vir die bepaling van die tendens-siklus van verlede waardes wees. Figuur 8.6: Twee voorbeelde van data uit bewegende gemiddelde modelle met verskillende parameters. Links: MA (1) met y t 20e t 0.8e t-1. Regs: MA (2) met y t e t-e t-1 0.8e t-2. In beide gevalle, is e t normaalverdeelde wit geraas met gemiddelde nul en variansie een. Figuur 8.6 toon 'n mate van data uit 'n MA (1) model en 'n MA (2) model. Die verandering van die parameters theta1, kolle, thetaq resultate in verskillende tyd reeks patrone. Soos met outoregressiemodelle, sal die afwyking van die term fout et net verander die skaal van die reeks, nie die patrone. Dit is moontlik om 'n stilstaande AR (p) model as 'n MA (infty) model skryf. Byvoorbeeld, met behulp van herhaalde vervanging, kan ons hierdie bewys vir 'n AR (1) model: begin yt amp phi1y et amp phi1 (phi1y e) et amp phi12y phi1 e et amp phi13y phi12e phi1 e et amptext einde verstande -1 Dit phi1 Dit 1, sal die waarde van phi1k kleiner te kry as k groter word. So uiteindelik kry ons yt et phi1 e phi12 e phi13 e cdots, 'n MA (infty) proses. Die omgekeerde gevolg het as ons 'n paar beperkinge op te lê op die MA parameters. Toe die MA-model is omkeerbaar genoem. Dit wil sê, dat ons 'n omkeerbare MA (Q) proses as 'n AR (infty) proses kan skryf. Omkeerbare modelle is nie net om ons in staat stel om van MA modelle om modelle AR. Hulle het ook 'n paar wiskundige eienskappe wat maak dit makliker om te gebruik in die praktyk. Die inverteerbaarheid beperkings is soortgelyk aan die stasionariteit beperkings. Vir 'n MA (1) model: -1lttheta1lt1. Vir 'n MA (2) model: -1lttheta2lt1, theta2theta1 GT-1, theta1 - theta2 Dit 1. Meer ingewikkelde voorwaardes hou vir qge3. Weereens, sal R sorg van hierdie beperkings te neem wanneer die beraming van die models. Basic Vooruitzichten verwys na die proses van die gebruik van statistiese prosedures om toekomstige waardes van 'n tydreeks gebaseer op historiese tendense te voorspel. Vir besighede, in staat meter verwagte uitkomste vir 'n gegewe tydperk is noodsaaklik vir die bestuur van bemarking, beplanning, en finansies. Byvoorbeeld, kan 'n advertensie-agentskap wil verkope voorspellings gebruik om te bepaal watter toekomstige maande toegeneem bemarking uitgawes mag vereis. Maatskappye kan ook voorspellings gebruik om te bepaal watter verkope persone ontmoet hul verwagte doelwitte vir 'n fiskale kwartaal. Daar is 'n aantal tegnieke wat aangewend kan word om kwantitatiewe voorspellings te genereer. Sommige metodes is redelik eenvoudig, terwyl ander meer robuuste en inkorporeer eksogene faktore. Ongeag van wat gebruik word, moet die eerste stap altyd wees om die data met behulp van 'n lyngrafiek te visualiseer. Jy wil om te oorweeg hoe die metrieke veranderinge met verloop van tyd, of daar is 'n duidelike tendens, of indien daar duidelike patrone wat opmerklik is. Daar is verskeie belangrike konsepte wat ons bewus van die beskrywing van tydreeksdata moet wees. Hierdie eienskappe sal die manier waarop ons pre-proses stel die data en kies die toepaslike modelle tegniek en parameters. Uiteindelik, die doel is om die patrone in die historiese data te vereenvoudig deur die verwydering van bekende bronne van variatiion en maak die patrone meer konsekwent oor die hele datastel. Eenvoudiger patrone sal oor die algemeen lei tot meer akkurate voorspellings. Tendens: 'n tendens bestaan wanneer daar 'n toename of afname langtermyn in die data. Seisoenaliteit: 'n seisoenale patroon vind plaas wanneer 'n tydreeks is wat geraak word deur seisoenale faktore soos die tyd van die jaar of die dag van die week. Outokorrelasie: Verwys na die pheneomena waardeur waardes van Y op tydstip t is geraak deur die vorige waardes van Y op t-i. Om die behoorlike lag struktuur en die aard van die motor gekorreleer waardes in jou data te vind, gebruik die outokorrelasie funksie plot. Stilstaande: 'n tydreeks is gesê skryfbehoeftes te wees indien daar geen sistematiese tendens, geen sistematiese verandering in variansie, en as streng periodieke variasies of seisoenaliteit nie bestaan Kwantitatiewe vooruitskatting tegnieke word gewoonlik gebaseer op reression analise of tydreekse tegnieke. Regressie benaderings te ondersoek die verhouding tussen die geskatte veranderlike en ander verklarende veranderlikes met behulp van deursnee-data. Tydreeksmodelle gebruik hitorical data that8217s ingesamel met gereelde tussenposes met verloop van tyd vir die teiken variablle sy toekomstige waardes te voorspel. Daar isn8217t tyd om die teorie agter elkeen van hierdie benaderings in hierdie pos te dek, so I8217ve gekies om 'n hoë vlak konsepte dek en verskaf kode vir die uitvoering van tydreekse vooruitskatting in R. Ek raai Inzicht die statistiese teorie agter 'n tegniek voordat jy die kode. In die eerste plek kan ons die ma funksie gebruik in die vooruitsig pakket te voorspelling uit te voer met behulp van die bewegende gemiddelde metode. Hierdie tegniek skat toekomstige waardes op tydstip t deur die gemiddeld van waardes van die tydreeks binne k periodes van t. Wanneer die tyd reeks stilstaan, kan die bewegende gemiddelde baie effektief wees as die waarnemings is naby oor tyd. Die eenvoudige eksponensiële smooting is ook goed as die data het geen tendens of seisoenale patrone. In teenstelling met 'n bewegende gemiddelde, hierdie tegniek gee meer gewig aan die mees onlangse waarnemings van die tydreeks. In die voorspelling pakket, daar is 'n outomatiese voorspelling funksie wat deur moontlike modelle sal loop en kies die mees geskikte model gee die data. Dit kan 'n motor regressiewe model van die eerste oder wees (AR (1)), 'n ARIMA model met die regte waardes vir p, d, en Q, of iets anders wat is meer gepas. Daar gaan jy, 'n basiese nie-tegniese inleiding tot vooruitskatting. Dit moet 'n mens vertroud is met die sleutelbegrippe en hoe om uit te voer 'n paar basiese vooruitskatting in R Nooit mis 'n update Skryf R-bloggers om e-posse te ontvang met die nuutste R poste kry. (Jy sal hierdie boodskap nie weer sien nie.)
No comments:
Post a Comment