MSc. in Finance and International Business

Department of Business Studies

Master’ Thesis

Stock Market Predictability:

A Sectoral Investigation

Tommy Drammestrup Christiansen

Academic Supervisor Stig Vinther Møller

Aarhus School of Business, University of Aarhus 2010

Executive summary

Title:

Stock Market Predictability: A Sectoral Investigation

Background:

Stock market predictability is one of the most controversial and debated issues in empirical finance. A voluminous literature on the question of whether it is possible to predict stock returns has evolved over the last two decades, making an overall assessment extremely difficult. Researchers dealing with stock market forecast differentiate between three possible causes of predictability: It may be due to time-varying risk premiums, irrational behavior of market participants, and finally there is a possibility that predictability doesn’t exist in the data, and that the current empirical results are linked to poor statistical inference. Currently, there is no consensus about whether stock markets are predictable, nor the causes in case stock markets are predictable. All this despite the fact that there are a myriad of scientific papers, which together cover most markets and even investigate different time periods and uses several different complicated statistical methods.

Consequently there isn’t much room for exploration in the area of traditional stocks market predictability. One area however isn’t investigated; sectorialstockmarket prediction. Different sectors of the economy are subjected to influence of many varied economic, political and financial factors. Each influencing factor can be modelled with different degree of readiness. The aggregate effects of factors acting on one segment of the economy can be very different from the effects on another segment, thus causing stock indexes of various segments to move in different directions and magnitudes.

Purpose:

A better way for stockmarket analysis could be to focus on the different sectors of the stockmarket rather than predicting the overall market index. The purpose of this thesis is to investigate several interesting questions in regard to sectorial predictability. Firstly it’s examined whether aggregated or sectorial predictor variables deliver the best explanatory power on a sectorial level. In addition it is examined how the prediction ability of macro predictor variables are on a sectorial level. On the other hand it could be interesting to investigate whether sectorial predictor variables are better at predicting the overall market index,so this is investigatedas well. And finally, it might be interesting to investigate whether there generally are some sectors that are easier to predict than others.

Method:

This thesis undertake an extensive analysis of both in-sample and out-of-sample tests of stock return predictability in an effort to better understand the empirical evidence on return predictability. The out-of-sample methodology is based on McCracken (2004) and Clark and McCracken (2001). American data is used, both quarterly and annual, spanning from 1973 to 2009. Three of the most traditional predictors’ variables are examined. They are; the dividend-yield ratio, the price-earnings ratio and the consumption-wealth ratio.

Conclusion:

All the aggregated predictor variables have significant in-sample predictive ability at both the 3-month and 1-year horizon in regards to predicting the market index. The consumption-wealth ratio is by far the best of the three predictor variables.

Most of the sectorial predictor variables also have significant in-sample predictive ability as well when looking at the sectorial level, only a few sectors are insignificant. Aggregate predictor variables appeared generally to be worse in predicting at the sectorial level returns compared with the sectorial predictor variables. But this isn’t the case with the consumption-wealth ratio and overall it outperforms the other two sectorial predictor variables.

More interesting when using the sectoral dividend-price predictor from the health care sector to predict the market index explanatory power increased by one percentage point, or 9.5 percent. When using consumer service sector the explanatory power is the same as with the aggregated predictor variables. The sectoral price-earnings predictor from the health care sector to predict market index the explanatory power increased of three percentage points or 24 percent. Using consumer service sector the explanatory power increased by five percentage points, or 37.5 percent.

Overall, there is relatively little discrepancy between the results from in-sample and out-of-sample tests of predictability. Only the consumption-wealth ratio show disappointing ability in the out-of-sample. This is probably because of the out-of-sample period ranging from 2000 to 2009.

Indholdsfortegnelse

Executive summary

1. Indledning

1.1 Problemformulering

1.2 Opbygning af afhandlingen

1.3 Afgrænsninger

1.4 Valg af variable

1.5 DATA

1.7 Definition af afkast

2. Forudsigelighed af aktieafkast

2.1 Forudsigelighed i efficiente markeder

2.1 Finansiel teori og forudsigelighed af aktieafkast

2.2 Dividende-pris ratioen

2.3 Pris-indtjenings-ratioen

2.4 Forbrugs-formue ratioen

2.5 Andre prædiktorvariable til forudsigelse af aktieafkast

3. Analyse af prædiktorer

3.1 Metodologi til den univariate analyse

3.2 Univariat analyse

3.3 Beskrivende statistik for prædiktorvariablene

3.4 Potentielle økonometriske problemer

3.5 Stationæritet og root testing

3.6 Strukturelle ændringer

3.7 Endogenitet, small sample bias og overlappende observationer

3.8 Data snooping bias

3.9 Out-of-sample metodologi

3.10 Resultaterne fra in-sample analysen

3.11 Out-of-sample

4. Konklusion

Litteraturliste

Appendiks A

Appendiks B

Appendiks C

Appendiks D

1.Indledning

Forudsigelighed af aktieafkast er et af de mest kontroversielle og debatterede spørgsmål i empirisk finansiering. En omfangsrig litteratur omkring spørgsmålet om hvorvidt det er muligt at forudsige aktieafkast, har udviklet sig i løbet af de sidste to årtier, hvilket gør en samlet vurdering yderst vanskelig. Forskere der beskæftiger sig med markedsforudsigelse,differentierer mellem tre mulige årsager til forudsigelighed: Det kan skyldes tids-varierende risikopræmier, irrationel adfærd blandt markedsdeltagerne, og endelig er der en mulighed for, at forudsigelighed slet ikke er til stede i dataene, og at den nuværende empiri er behæftet med dårlig statistisk inferens.Der er således ingen generel konsensus omkring hvorvidt aktiemarkeder er forudsigelige, eller hvilken form forudsigelighed der igivet fald eksisterer, ogdet er på trods af, at der er udarbejdet et utal af videnskabelige artikler, der tilsammen dækker de fleste markeder, og det enddamed forskellige tidsperioder og komplicerede statistiske metoder.

Et område, der imidlertid stort set er uberørt indenfor litteratur omkring markedsforudsigelighed, er sektoralforudsigelse. Normalt er markedsforudsigelighed implicit forbundet med forudsigelse af et bestemt markedsindeks, der spænder over flere sektorer, enten ved at brugeen aggregeret prædiktorvariabel,derer baseret på finansielle nøgletal samlet fra alle sektorer, eller ved at bruge makroøkonomiske nøgletal.Sektoralforudsigelse er derfor et interessant og uberørt emne, der rejser en række ubesvarede spørgsmål. Herunder kunne det eksempelvis være interessant at vide, om aggregerede prædiktorvariable på grund af synergieffekter i korrelationen blandt sektorerklarer sig bedre end sektorspecifikke prædiktorvariable på sektorniveau, og endvidere hvordan makroøkonomiske prædiktorvariable relativt klarer sig på sektorniveau. Det er også interessant at undersøge om det omvendte fænomen gør sig gældende, altså om sektorspecifikke prædiktorer er bedre end aggregerede prædiktorvariable på markedsindekset. Og endelig kunne det være interessant at undersøge, om der generelt er visse sektorer, der er nemmere, at forudsige end andre, når man anvender de mest traditionelle prædiktorvariable.

Implikationerne af sektoralforudsigelse afhænger naturligvis til en vis grad af resultaterne, men uanset udfaldet, vil det give et større overblik over, hvordan prædiktorvariable reagerer på forskellige sektorer, og det kan være med til at vurdere, om en given prædiktorvariable er universalt anvendelig.

1.1 Problemformulering

Formålet med nærværende afhandling er, at undersøge forudsigelighed af aktieafkast. Herunder er hovedfokus at undersøge, i hvilken grad forudsigelighed af aktieafkast er sektorafhængigt. Til det formål undersøges både prædiktorvariable bestående af finansielle og makroøkonomiske nøgletal.

Udover en generel undersøgelse af sektoralforudsigelse ønskes følgende tre spørgsmål besvaret:

1.Fungerer aggregerede prædiktorvariable bedre på sektorniveau set i forhold til sektorspecifikke prædiktorvariable?

Rationalet bag oprindelsen af spørgsmåleter, at den store korrelation, der findes imellem forskellige sektorer, måske har en positivt indvirkning på forklaringsgraden. Sat på spidsen vil et stort kursfald indenfor en sektor udgøre en systematisk risiko og derved påvirke alle sektorerne. På samme måde kan en sektorspecifik prædiktorvariabel, der indikerer nedgang i en sektor påvirke andre sektorer. Hvis man alt andet lige kun ser på én sektorspecifik prædiktorvariabel kan denne information gå tabt, såfremt informationen ikke afspejles i alle de sektorspecifikke prædiktorvariable med det samme.Der kan således være forsinkede ”spill-over” effekter. IT-boblen kunne være et muligt eksempel herpå.

Desuden er nogle prædiktorvariable baseret på finansielle nøgletal og andre på makroøkonomiske nøgletal. Finansielle nøgletal kan beregnes ud fra den enkelte virksomheds regnskab, og det er derfor forholdsvis let at konstruere finansielle nøgletal, der er tilpasset en gruppe af virksomheder eksempelvis en bestemt sektor. Makroøkonomiske variable kan naturligvis ikke opdeles på sektor niveau, og det kan derfor være nærliggende at tro, at de ikke er ligeså anvendelige på sektorniveau, som på aggregeret niveau.

2.Fungerer sektorspecifikke prædiktorvariable bedre på sektorniveau set i forhold til aggregerede prædiktorvariable?

Dette spørgsmål er modstykket til det forrige spørgsmål. Her antages det, at langtde fleste informationer er indeholdt i de sektorspecifikke prædiktorvariable, og man derfor kun sjældent kan tale om bobler i bestemte sektorer, der kan være indikeret ved sektorspecifikke prædiktorvariable. Rationalet for at undersøge spøgsmålet er, at man ved at anvende sektorspecifikke prædiktorvariable bruger al den information, der er tilgængelig, og undgår ubrugelig information eller ”støj” (korrelation).

3. Er sektorspecifikke prædiktorvariable den bedste løsning til forudsigelse af aktieafkast påmarkedsindekset?

Spørgsmål et og to opstiller på sin vis et trade-off mellem værdifuld korrelation på den ene side (spørgsmål 1) og mere specifik information og mindre ”støj” på den anden side (spørgsmål 2). Spørgsmål tre udnytter, at der er høj korrelation mellem sektor og markedsniveau, og forsøger samtidig, at reducere ”støjen” ved at undlade sektorer, der ikke er følsomme over for en given prædiktorvariabel. Hvis man forestiller sig et tænkt eksempel, hvor halvtreds procent af aktierne i markedsindekset i høj grad påvirkes af den pågældende prædiktorvariabel, imens den resterende del stor set ikke påvirkes.I det tilfælde kan man muligvis opnå et bedre resultat ved at bruge en sektorspecifik prædiktorvariabel, således at man forsøger at forklare så meget som muligt af de halvtreds procent af aktier i markedsindekset, der er meget følsomme over for prædiktorvariablen.

For at undersøge de tre overstående spørgsmål, anvendes et udsnit af de mest efterprøvede modeller inden for litteraturen. Pris-indtjenings-ratioen, dividende-pris-ratioen samt den nyere model forbrugs-formue-ratioen. Alle variable er standardprædiktorer, der er godt funderede teoretisk, og har vist sig at være blandt de variable med størst præcision.

1.2 Opbygning af afhandlingen

Afhandlingen er, foruden den indledende del,opdelt i yderligere tre dele. En teoretisk, en analytisk og til sidst en konkluderende del.

Den teoretiske del lægger ud med en beskrivelse af den efficiente markedshypotese og en diskussion om, hvorvidt hypotesen er forenelig med ideen om forudsigelige markedsafkast. Herefter følger en generel beskrivelse af prædiktorvariable efterfulgt af en gennemgang af de tre prædiktorvariable, der undersøges i nærværende afhandling. Først dividende-pris-ratioen, dernæst pris-indtjenings-ratioenog til sidst forbrugs-formue-ratioen. Hvert af de tre afsnit indeholder en gennemgang af det teoretiske fundament, der ligger til grund for, at variablene indeholder en forudsigelsesevne, samt intuitionen bag, og endelig vil jeg se nærmere påden mest anerkendte eksisterende empiri.

Den analytiske del indeholder selve analysen af prædiktorvariablene. Afsnittet indledes med en gennemgang af den anvendte metodologi bag analyserne. Derudover ses der nærmere på eventuelle økonometriske problemer, og hvordan disse kan overkommes. Herefter følger en in-sample analyse, hvor der er anvendt simpel lineær regressionsanalyse, og en out-of-sample analyse baseret på McCrackens (1999) MSE-F og ENC-NEW. Endelig sammenholdes og diskuteres alle resultaterne sidst i afsnittet.

I konklusionensammenfattesafhandlingens resultater.

1.3Afgrænsninger

Som nævnt i indledningen er emnet bredt, og jeg har derfor valgt, at fokusere på tre variable, der er blandt de mest klassiske prædiktorer i litteraturen. Desuden skaber den begrænsede datatilgængelighed en naturlig begrænsning i form af den tidshorisont, der analyseres.

Yderligere findes der en lang række metodologier, der kan anvendes til at undersøge problemformuleringen. I afhandlingen er det valgt udelukkende at anvende en simpel lineær regression analyse in-sample, samt enout-of-sample tilgang. Denne metodologi er også blandt de mest anvendte indenfor litteraturen, og jeg har derfor valgt at forfølge metoden ukritisk.

Til sidst skal det nævnes at afhandlingen udelukkende ser på univariate modeller og ikke på multivariate modeller. Det skyldes igen afhandlingens begrænsninger. På den måde bevares fokus på afhandlingens problemformulering.

Endelig har det ikke været muligt at finde eksisterende litteratur indenfor sektoralforudsigelse, og afhandlingen er derfor naturligt præget heraf.

1.4Valg af variable

Som nævnthar jeg valgt at undersøge tre prædiktorer. Pris-indtjenings-ratioen, dividende-pris-ratioen, og forbrugs-formue-ratioen. Årsagen til, at netop disse prædiktorer undersøges, er, dels at de er velfunderet i økonomiske teorier, dels at data grundlaget for at undersøge disse prædiktorer er størst.Endeliger pris-indtjenings-ratioen ogdividende-pris-ratioen blandt de bedste finansielle prædiktorvariable, og forbrugs-formue-ratioen er den bedste makroøkonomiske prædiktorvariabel.

1.5DATA

I dette afsnit gennemgås datagrundlaget for afhandlingen. Jeg har valgt udelukkende at undersøge det amerikanske aktiemarked. Årsagen hertil er delvist, på grund af adgang til mere omfattende data. En anden årsag er, at visse prædiktorer viser sig at virke bedst på det amerikanske marked. Det kan skyldes, at aktiemarkeder verden over er højt korrelerede, specielt i krisetider. Det vil sige, at en krise i et land kan have en afsmittende effekt på andre lande, hvis økonomi, alt andet lige, fundamentalt set er i balance. Da USA gennem de sidste 75 år har været en dominerende økonomi, der i høj grad har sat dagsordenen på verdensøkonomien, vil en undersøgelse af det amerikanske aktiemarked sandsynligvis eliminere mest muligt af den afsmittende korrelation over landegrænser.

Data perioden er begrænset af den tilgængelige datamængde og strækker sig fra 2. kvartal 1973 til 2. kvartal 2010 - det vil sige i alt 37 år. På grund af den relativt korte periode, har jeg valgt, at undersøge prædiktorernesevne til at forudsige aktiemarkedet over en horisont på 3 og 12 måneder. Det skaber tilstrækkeligt statistisk grundlag for at lave statistisk inferens. Hvis længere horisonter anvendes, vil man være nødsaget til at anvende overlappende observationer, hvilket skaber statistiske problemer i form af seriekorrelation.

På den anden side kan kortsigtede forudsigelser være svære, at have med at gøre because of the high volatility of equity returns.på grund af den høje volatilitet på aktieafkast, og prædiktorernes forklaringsgrad er ofte større over længere horisonter. Dette kan dog variere, alt efter hvilke prædiktorer der anvendes.Et enkelt lyspunkt kan dog være, at man ved at anvende de nyeste data minimerer risikoen for strukturelle skift.

Alle data til forbrugs-formue-ratioen er hentet fra Ludvigsons hjemmeside ( De resterende data er indsamlet ved hjælp af Datastream, herunder alle sektor- og indeksafkast samt pris-indtjenings- og dividende-pris-ratioenpå både sektor og indeksniveau (Tickers til alle dataene kan findes i appendiks A).

Endelig er alle dataserier undersøgt grafisk for at undersøgepotentielle problemer med strukturelle pauser og ekstreme observationer (appendiks B).

1.7 Definition af afkast

Dette afsnit redegør for hvordan jeg har valgt at definere begrebet aktieafkast. Ligning 1 viser det totale afkast for en portefølje, der holdes fra slutningen af år t-1 til slutningen af år t, inklusiv dividende. er afkastet, er kursen til tidspunktet t og er dividende udbetalt i periode t:

Ligning 1 beskriver det nominelle aktieafkast. Derudover undersøges realafkastet. I litteraturen er der ingen konsensus omkring, hvilken definition af afkast der er mest korrekt, og ydermere beskæftiger denne afhandling sig med et nyt område, der ikke tidligere er undersøgt, og der er som bekendt ingen fodspor at følge, når man går nye veje. Derfor har jeg valgt, at benytte beggeafkast definitioner.

Problemet med nominelle afkast er den manglende evne til at kompensere for inflation, hvilket især er relevant, når man arbejder med lange tidsserier. For at korrigere herfor, deflateres dennominelle tidseries are deflated using the CPI‐index, such that the time series are in real terms.sserie med forbrugerprisindekset, således at tidsserier optræder i faste priser. Hereby oneHerved beregnes realafkastet.Lastly, the excess return is defined as the difference between To correct for this, the nominal time

Endelig er der også merafkastet, hvilket ikke er en del af denne analyse. Merafkastet er defineret som forskellen mellemnominal return and the risk free rate, and it is therefore approximate real. nominelle afkast og den risikofri rente. Merafkastetresembles the reward for holding stocks compared to treasury bills. er et relativitets mål der udtrykker belønningen for at holde aktier frem for korte risikofrie statsobligationer. Den langsigtede investor erobviously concerned about excess return and to a lesser extent nominal return, since what naturligvis bekymret for merafkastet og en mindre grad nominel forrentning, idet detmatters is purchasing power and not high nominal returns eroded by inflation. spørgsmål er købekraft og ikke høje nominelle afkast udhulet af inflationen.

I denne afhandling undersøges både forudsigeligheden af nominelle og realafkast. This is done as some Dette sker eftersom noglevariables work best on nominal returns, while others only predict real return etc. As a result variable virker bedst på nominelle afkast, mens andre er bedre til at forudsige reale afkast.

2. Forudsigelighed af aktieafkast

2.1 Forudsigelighed i efficiente markeder

The aim of this chapter is to provide the reader with an understanding of theFormålet med dette afsnit er at give en forståelse afefficient market hypothesis, its origins and the different levels of market efficiency. Den Effektive Markedshypotese, (EMH) dets forskellige niveauer af markedets effektivitet og undersøge, om hypotesen er forenelig med forudsigelighed af aktieafkast.

Løst formuleret forsøger EMH at forklare, hvor meget information der er reflekteret i aktiepriser. Fama (1970) definerer et efficient marked som ”A market in which prices always ‘fully reflect’ availableinformation is called ‘efficient’”.I et sådant effektivt marked vil alle forventninger og informationer fra alle markedsdeltagerne være indregnet i aktieprisen, og det er derfor ikke muligt at forudsige aktiekurser. Rationalet herfor er, at hvis aktiekurser kan forudsiges ved hjælp af eksisterende tilgængelig information, vil det være muligt at profitere heraf. Rationelle investorer vil handle på denne mulighed, indtil al profitabel information er reflekteret i aktiekursen, og på det tidspunkt vil aktiekursen kun reagere på nye informationer. Nye informationer er af natur uforudsigelige, og derfor er aktiekursen ligeså. Further, arguments for and against the hypothesis are discusDen effektive markedshypotese tilsiger ikke, at aktiver ikke kan afvige fra deres virkelige pris, men når de gør, så er det altid tilfældigt. Det vil sige, at en investor kun kan klare sig bedre end gennemsnittet ved at være heldig, og investorer, der historisk set har klaret sig bedre end markedet i teorien blot tilhører et statistisk ydrepunkt. Fama (1970) argues that there are three levels of market efficiency; weak efficiency,Fama (1970) inddeler markedets effektivitet i tre niveauer; svag effektivitet, semi-strong efficiency, and strong efficiency.semi-stærk effektivitet, og en stærk effektivitet. Den første grad, svag effektivitet, indebærer, at de nuværende aktiekurser afspejler alle historical information of past share prices.historiske oplysninger om tidligere aktiekurser. Due to the weak efficiency of the marketUnder den svage markedseffektivitetit is impossible for investors to predict and outperform the market by using er det umuligt for investorerne at forudsige og klare sig bedre end markedet ved hjælp af historical data, so called technical analysis. historiske data, eksempelvis tekniske analyser.Semi-strong market efficiency means that all public information is included in the Semi-stærk markedseffektivitet betyder, at alle offentlige oplysninger er indeholdt i dencurrent share price and an investor cannot outperform the market by either the aktuelle aktiekurs, og en investor kan derfor ikke klare sig bedre end markedet trods anvendelse af tekniske eller grundlæggende analyser af offentlig information. (FamaUnder det tredje niveau af markedets effektivitet, stærk effektivitet, er alle oplysninger, bådeprivate and public, is included in the stock price. private og offentlige, inkluderet i aktiekursen. This implies that not even insiders Dette indebærer, at ikke engang insiderecan have superior information and thereby profit from it. kan have overlegen information og dermed drage fordel heraf.This extreme level of Denne ekstreme grad afefficiency is not meant to be a description of reality. effektivitet er ikke videre realistisk, men Instead it is formulated to serve tjeneras a benchmark that can be used to estimate the importance of deviations from the som en benchmark, der kan bruges til at vurdere betydningen af afvigelser fraefficient market. effektivt marked. (Fama 1970) In figure 2.1 on the next page, the relationship