Forstå beta og alfa med simpel lineær regression

Forstå beta og alfa med simpel lineær regression

Har du nogensinde tænkt over, hvorfor nogle aktier hopper som kænguruer, mens andre knap nok rokker sig, når markedet gynger? Eller hvordan professionelle forvaltere kan prale af et merafkast, selv når børsen står stille? Svaret gemmer sig ofte i to små græske bogstaver: β (beta) og α (alfa).

I denne artikel tager vi dig i hånden og viser, hvordan du – med noget så jordnært som simpel lineær regression – kan aflure både aktiers markedsfølsomhed og deres potentielle merafkast. Undervejs får du ikke bare formler kastet i hovedet; du får også den praktiske ramme for, hvad du kan (og ikke kan) konkludere, når graferne og statistikken har talt.

Vi starter med at klæde dig på til at forstå grundbegreberne, går videre til den afgørende datasnitning, viser selve estimeringen – og runder af med konkrete anvendelser og klassiske faldgruber, der kan koste både tid og penge. Kort sagt: Alt, hvad du skal bruge for at gøre beta og alfa til mere end blot buzzwords.

Klar til at skifte fra “det lyder komplekst” til “det her kan jeg faktisk bruge”? Så læs videre og bliv klogere på, hvordan to græske bogstaver kan blive din nye investeringstermostat.

Hvad er beta og alfa – og hvorfor bruge simpel lineær regression?

Når professionelle investorer siger, at en aktie har en beta på 1,3 eller leverer 50 bp alfa om året, taler de reelt om to tal, der kommer direkte ud af simpel lineær regression – en statistisk metode de fleste af os lærte i gymnasiet. I sin mest basale form estimerer regressionen en ret linje, der forbinder to dataserier: aktivets overskudsafkast og markedets overskudsafkast.

Beta – Mål for markedsfølsomhed

Beta (β) er regressionslinjens hældning. Tallet viser, hvor meget aktivets afkast i gennemsnit bevæger sig, når markedet flytter sig én procentenhed:

  • β < 1: Defensivt aktiv. Afkastet svinger mindre end markedet.
  • β ≈ 1: Markedsneutral. Bevæger sig cirka én-til-én med benchmark.
  • β > 1: Agressivt aktiv. Overreagerer relativt til markedsudsving.

I CAPM-terminologi beskriver beta den systematiske risiko – den risiko, du ikke kan diversificere væk, fordi den er drevet af selve markedets humør.

Alfa – Merafkast ud over markedsrisiko

Alfa (α) er regressionslinjens skæring med y-aksen. Den svarer til det gennemsnitlige overskudsafkast, aktivet har leveret efter at markedsbevægelser er renset væk:

  • α > 0: Aktivet har historisk slået CAPM-forventningen.
  • α < 0: Aktivet har underperformet i forhold til sin beta-justerede risiko.

Bemærk, at alfa oftest udtrykkes i procent pr. periode, fx 0,2 % pr. måned, og kan omregnes (annualiseres) hvis perioderne er ensartede.

Sådan kobler regressionen sig til capm-intuitionen

Den simple regression estimerer følgende model:

ri,t − rf,t = α + β · (rm,t − rf,t) + εt

Hvor ri,t er aktivets afkast, rm,t er markedsafkastet, og rf,t er den risikofri rente.

  • Hældningen β kvantificerer eksponeringen mod markedsfaktoren.
  • Interceptet α måler merafkastet givet den estimerede beta.

Derved bliver regressionsoutputtet et praktisk værktøj til at teste CAPM-hypotesen om, at forventet alfa er nul.

Hvad kan – Og kan du ikke – Konkludere?

Du kan konkludere Du kan ikke konkludere
  1. Hvor markedsfølsomt aktivet har været i den analyserede periode.
  2. Om aktivet historisk har givet mer- eller underafkast relativt til sin markedsrisiko.
  3. Om alfa og beta er statistisk signifikante (hvis du anvender t-tests).
  1. At den estimerede beta vil være konstant fremadrettet – beta kan ændre sig med tiden.
  2. At en positiv alfa nødvendigvis fortsætter – merafkast kan skyldes tilfældigheder.
  3. At hele aktivets risiko fanges af beta – andre faktorer (størrelse, value, momentum) kan spille ind.

Kort sagt giver simpel lineær regression dig et hurtigt, gennemsigtigt temperaturtjek på, hvor et aktiv ligger på risiko-/afkast-spektret relativt til markedet. Men tallene er kun så gode som de data, perioden og antagelserne bag modellen. Resten af artiklen dykker ned i præcis, hvordan du vælger data, kører regressionen og bruger resultaterne ansvarligt.

Data og opsætning: Fra priser til regressionsklare afkast

Før du kaster lineal og regressionsværktøj efter dine tal, skal datafundamentet være på plads. Uden et velkonsolideret datasæt risikerer du, at beta og alfa mest af alt afspejler målefejl. Nedenfor gennemgår vi de vigtigste trin – fra valg af aktiv og benchmark til rensning af ekstreme observationer.

1. Vælg aktiv og benchmark – og sørg for konsistens

  1. Geografi: Dansk large-cap-aktie ↔ OMXC25; global ETF ↔ MSCI ACWI.
  2. Sektor: Vælg et sektorspecifikt indeks (f.eks. MSCI World Healthcare), hvis aktien opererer i en niche, som bevæger sig anderledes end det brede marked.
  3. Valuta: Kun i samme valuta undgås kunstige udsving fra valutakursen. Alternativt afdækkes valuta, eller data omregnes.
  4. Likviditet & investerbarhed: Brug et benchmark, du faktisk kan handle eller spejle – ellers mister alfa-tolkningen sin praktiske relevans.

2. Frekvens: Daglig, ugentlig eller månedlig?

  • Daglig – flest observationer, fanger korte chok, men støj og micro-structure-effekter dominerer.
  • Ugentlig – god balance; reducerer nonsynkronitet mellem aktier og indeks.
  • Månedlig – mindst støj, men færrest datapunkter (≥ 36 måneder anbefales for simpel regression).

Husk, at beta ændrer sig med tidsopløsningen; sammenlign derfor kun betaværdier estimeret på samme frekvens.

3. Fra priser til afkast – simple vs. log

Metode Formel Fordele Ulemper
Simple afkast (Pt − Pt−1) / Pt−1 Nemt at forstå; matcher lineær procentskala Bliver >100 % ved ekstreme stigninger; ikke tidsadditivt
Log-afkast ln(Pt/Pt−1) Tidsadditive; bedre teoretisk grounding (normalitet) Mindre intuitive; kræver omregning til % for præsentation

Til regressioner får du sjældent substantielt forskellige betas ved valg af log vs. simple afkast, men log-afkast giver ofte pænere residualer.

4. Indregn risikofri rente korrekt

  1. Træk risikofri rente (risk-free rate) fra aktiv- og benchmarkafkast, så du arbejder med overskudsafkast.
  2. Match frekvens: Brug årlig statsobligationsrente/360 for daglige data; eller 3-måneders T-bill rullet ned til ugentlig/månedlig.
  3. Sørg for simultan dating: Brug enten slut-på-perioden-rente eller gennemsnit over perioden – bare du gør det ensartet.

5. Tidsjusteringer: Dividender, splits og corporate actions

  • Anvend total return-serier (justeret for dividender og reinvestering) – ellers undervurderer du både afkast og beta.
  • Sørg for, at splits og bonusaktier allerede er korrigeret i kurshistorikken, så ingen kunstige spring opstår.
  • Benchmarket skal også være total return for at undgå systematisk skæv alfa.

6. Rensning for outliers

  • Ekstreme enkeltdage kan dominere koefficienterne. Overvej:
    1. Winsorizing (f.eks. ±3 σ) – mildt indgreb, bibeholder reelle shocks.
    2. Fjern observationer tydeligt forårsaget af datafejl (dubletter, mis-prints).
  • Tjek grafisk med scatter-plot og tidsserie af residualer.

7. Datagrundlagets længde og kvalitet

  1. Tom­melfingerregel: Minimum 36-60 observationer for simpel regression; flere ved høj volatilitet.
  2. Undgå survivorship bias: Brug hele historikken, også for aktier der senere er afnoteret eller fusioneret.
  3. Overvej regimeskift: Beta fra finanskrisen ≠ beta efter Covid-19. Segmentér perioden eller brug rullende vinduer.

Når disse skridt er fulgt, ligger et regressionsklart datasæt klar. Kvaliteten af dine estimater kommer nu til at afspejle aktivets virkelige markedsdynamik – i stedet for fejl i datavasken.

Estimering og tolkning: Fra model til meningsfulde nøgletal

Efter at have hentet og renset vores datasæt (jf. foregående afsnit) bygger vi en simpel lineær regression på formen:

(ri,t – rf,t) = α + β · (rm,t – rf,t) + εt

  • ri,t: Afkast på aktiv i i periode t
  • rm,t: Afkast på benchmark-indekset
  • rf,t: Risikofri rente (match frekvensen!)
  • α: Merafkast justeret for markedsrisiko (alfa)
  • β: Følsomhed over for markedet (beta)
  • εt: Residual – den del modellen ikke kan forklare
import statsmodels.api as smrf = rf_series.align(price_series, join='right')[0] # juster datointervalri = price_series.pct_change().dropna() # simple afkastrm = index_series.pct_change().dropna()excess_i = ri - rfexcess_m = rm - rfX = sm.add_constant(excess_m) # tilføj 1-kolonne til alfamodel = sm.OLS(excess_i, X).fit(cov_type="HC3") # robuste standardfejlprint(model.summary())

2. Tolk nøgletallene

Parameter Økonomisk intuition Typisk tommelfingerregel
β < 1 Defensiv – bevæger sig mindre end markedet Søvnvenlige porteføljer, lav gearing
β ≈ 1 Markedskopi – “gennemsnitlig” risiko Penge spildt på aktivet, hvis det blot replikerer benchmark
β > 1 Aggressiv – forstørrer markedsbevægelser Kræver stærke nerver eller hedge
α > 0 Potentielt skill: merafkast efter markedsrisiko Tjek signifikans – se t-stat & p-værdi
α < 0 Betaler du for lidt ­-performance? Kan skyldes høje omkostninger eller dårlig timing
R2 Forklaringsgrad – hvor meget af variationen i aktivets afkast der kan tilskrives markedet > 0,8: indeks-lignende
< 0,3: idiosynkratisk

Statistisk vs. Økonomisk signifikans

  • Standardfejl fortæller, hvor præcist vi har estimeret α og β.
  • t-statistik = koefficient / standardfejl. Som tommelfinger: |t| > 2 ⇒ 5 %-signifikans.
  • Konfidensinterval giver et helt spænde, fx β ∈ [0,9 ; 1,1], hvilket er mere informativt end et enkelt punktestimat.
  • Vurder økonomisk effekt: Et årligt alfa på 20 bp kan være statistisk signifikant, men ædes hurtigt op af kurtage.

Annualisér alfa – Men ikke beta

  • Hvis du bruger månedlige data, kan du multiplicere den estimerede α med 12 for at få årligt merafkast.
  • β er en hældning – den er allerede skaleringsuafhængig og må ikke annualiseres.

3. Residualdiagnostik: Er modellen god nok?

  1. Plot residualer: Udvisker de et mønster? Systematiske mønstre tyder på manglende faktorer eller ikke-linearitet.
  2. Normalitetstests (Jarque-Bera): CAPM antager ikke normalitet, men ekstreme haler influerer standardfejl.
  3. Autokorrelation (Durbin-Watson): Signifikant autokorrel. ⇒ Overvej Newey-West standardfejl eller lavere frekvens.
  4. Heteroskedasticitet (White-test): Varierende volatilitet ⇒ anvend robuste standardfejl (HC3/White).

4. Til sidst: Tjek virkeligheden

Regressionen giver historiske estimater. Beta kan skifte i nye markedsregimer, og alfa kan forsvinde, når kapital jagter den. Brug derfor resultaterne som et startpunkt for portefølje-beslutninger – ikke som en facitliste.


Note: Ovenstående kodeeksempel er til demonstration og forudsætter rensede data. Husk at justere for dividender, valutakurser og tidszoner, før du konkluderer på tallene.

Anvendelser og faldgruber: Fra porteføljepraksis til modeludvidelser

Den estimerede beta og alfa er ikke kun akademiske øvelser – de kan oversættes til konkrete beslutninger i porteføljeforvaltningen. Men deres værdi afhænger af, at man både udnytter dem rigtigt og kender deres begrænsninger.

Anvendelser i praksis

  1. Risikostyring
    Beta giver et kvantitativt bud på, hvor hårdt en position vil blive ramt, hvis markedet bevæger sig. En porteføljeforvalter kan justere den samlede portefølje-beta for at overholde et Value-at-Risk-budget eller andre risikorammer.
  2. Hedging
    Har du en lang aktieposition med en beta på 1,3 mod MSCI World, kan du søge at neutralisere (en del af) markedsrisikoen ved at shorte 1,3 gange så meget i indeksfutures eller ETF’er. Jo mere præcist beta er estimeret, desto mindre basisrisiko bæres videre.
  3. Beta-neutral positionering
    Mange markedsneutrale fonde forsøger at skabe ren alfa ved at gå lang i undervurderede aktiver og kort i overvurderede – i et miks, hvor den samlede beta er tæt på nul. Regressionen sætter tal på, hvor meget long- og short-benene skal vægtes.
  4. Performance-attribution
    Over- eller underperformance kan opdeles i (a) kompensation for den markedsrisiko porteføljen har båret (beta) og (b) true skill – alfa. Det gør dialogen med investorer langt mere gennemsigtig.

Faldgruber du bør gardere dig imod

Problem Konsekvens Mulige løsninger
Tidsvarierende beta En “gammel” beta fanger ikke ændret forretningsmodel eller gearing. Rullende regressioner, eksponentielle vægte, regimeskifte-modeller.
Regimeskift Finanskriser eller pandemier kan ændre beta strukturelt. Segmentér data i før/efter-perioder; brug dummy-variable.
Ikke-linearitet En enkelt hældning (beta) beskriver ikke optioner, value-tilt m.m. Tilføj kvadratiske eller interaktionsled; overvej splines.
Autokorrelation Underestimerede standardfejl → falsk signifikant alfa. Newey-West robuste standardfejl eller lavere datafrekvens.
Heteroskedasticitet Samme fejl som ovenfor, især for volatile aktier. White-robuste standardfejl; GARCH-justering.
Benchmark-bias Forkert eller for snævert indeks giver misvisende beta og alfa. Vælg indeks med samme valuta, sektor, markeds-cap og geografi.
Survivorship bias Historiske data mangler konkursramte selskaber, alfa ser kunstigt høj ud. Brug databaser med døde aktier; test følsomhed mod datasæt.

Når én faktor ikke er nok: Modeludvidelser

  • Fama-French 3/5-faktor: Tilføjer størrelses- (SMB), value- (HML) og kvalitets-/momentum-præmier. Kan reducere residual-støj og give bedre alfa-målinger.
  • Carhart momentum: Eksplicit faktor for pris-momentum, vigtig for hedgefonde.
  • Makro-faktorer: Inflation, renter, råvarepriser eller valutaer kan forklare afkast bedre end et bredt aktieindeks alene – især for multi-asset porteføljer.
  • Statisk vs. dynamisk modellering: State-space modeller, Kalman-filtre og machine learning gør det muligt at lade beta variere glidende over tid.

Glem ikke transaktionsomkostningerne

Selv den mest imponerende statistiske alfa kan blive ædt af handelsomkostninger, slippage og skat. Indbyg derfor en friktion i dine backtests og beregn en netto-alfa. Husk også implementeringsrisiko: Jo mere kompleks hedge- eller factor-porteføljen er, desto større risiko for fejl i praksis.

Konklusionen er klar: Simpel lineær regression er et stærkt udgangspunkt – men den virkelige edge opstår, når du kan oversætte tallene til handling, samtidig med at du holder øje med de statistiske miner i terrænet.

Indhold

Type above and press Enter to search. Press Esc to cancel.