Ny rekord på Oslo Børs
- 4. April 2024
- #statistics
I dag (4. april 2024) satte Oslo Børs ny rekord for fjerde dag på rad!
Overskriften “Ny rekord på Oslo Børs” har lenge vært populær. Here er ti eksempler fra ulike medier, sortert i kronologisk rekkefølge:
Ser vi på tidsserien oppdager vi at ny rekord på Oslo Børs er langt fra uvanlig. Rekorder blir satt de fleste årene, og ofte mange ganger per år.
Rekorder i uavhengige observasjoner
Oslo Børs er en stigende tidsserie, så rekorder er å forvente. Desto mindre støy (volatilitet), desto flere rekorder. Hva med tilfeldige tall uten noen stigende trend? Til og med da kan vi forvente en del rekorder. Her en en tidsserie med \(50\) uavhengige normalfordelte observasjoner.
Det ble satt \(6\) rekorder i denne tidsserien.
Hva er forventet antall rekorder? Vi kan simulere oss frem til svaret, som er omtrent \(4.5\). (Det analytiske svaret er den harmoniske rekken \(H_n = \sum_{i=1}^{n} 1/i\), og \(H_{50} \approx 4.49921\))
import numpy as np
NUM_SIMULATIONS = 1_000_000
rng = np.random.default_rng(42)
timeseries = rng.normal(size=(50, NUM_SIMULATIONS))
# Boolean array indicating whether an observation was a record
records = np.maximum.accumulate(timeseries, axis=0) == timeseries
# Expected number of records
print(records.sum(axis=0).mean()) # 4.500538
Hva er sannsynligheten for at observasjon \(n\) er en ny rekord?
records.mean(axis=1) # [1.0, 0.5003, 0.3335, 0.2504, 0.1999, 0.1663, ...]
Vi kan enkelt resonnere oss frem til at svaret er \(1/n\):
- Sannsynligheten for at observasjon \(1\) er en ny rekord er \(1\).
- Sannsynligheten for at observasjon \(2\) er en ny rekord er det samme som sannsynligheten for at observasjon \(2\) er større enn observasjon \(1\), og denne sannsynligheten er \(1/2\).
- Sannsynligheten for at observasjon \(3\) er en ny rekord er det samme som sannsynligheten for at observasjon \(3\) er større enn både observasjon \(1\) og \(2\). Av totalt \(3\) observasjoner er det \(1/3\) sannsynlighet for at hver av dem er størst, så sannsynligheten for at den tredje er størst er \(1/3\).
- Sannsynligheten for at observasjon \(n\) er en ny rekord er det samme som sannsynligheten for at observasjon \(n\) er større enn de \(n-1\) andre. Det er \(1/n\) sannsynlig at hver av dem er størst, så sannsynligheten for at at den \(n\)‘te er størst er \(1/n\).
Tidsserier går opp, ned, og endrer seg
Å rapportere på tidsserier kan være god journalistikk, men journalister glemmer ofte det mest grunnleggende: å visualisere tidsserien. Uten en figur er det vanskelig å vite om det som rapporteres er tilfeldig variasjon eller en reell endring. At en tidsserie setter ny rekord betyr ikke nødvendigvis at noe betydningsfullt har skjedd. Til og med i sekvenser av tilfeldige tall dukker det opp en del rekorder og innbilte mønstre.
Fra NRK er det eksempler på nyhetssaker om tidsserier fra børsen, dødsfall i trafikken, strømpriser, konsumprisindeksen, generelle dødsfall, snødybde, arbeidsledighet, gullpris, EU-oppslutning, aluminiumspris, drapstall, fødselstall, valutakurser, asylsøkertall, innvandrervekst, vekst for laksenæringen, renter, og så videre. De fleste overskriftene følger oppskriften:
“Laveste/høyeste X på Y år”
Om man vil være kreativ kan man finne mange rekorder å melde. Her er noen eksempler fra NRK:
Åpenbart trenger man ikke å begrense seg til rekorder oppover. Man kan rapportere når tidsserier setter rekorder nedover:
Man kan rapportere på endringer i verdier:
Man kan ofte dele dele opp tidsserier:
Om en observasjon ikke er den mest ekstreme, er det kanskje den nest mest ekstreme:
Om det ikke er satt noen rekord, kan man spekulere i om det vil inntreffe:
Oppsummert er det ikke overraskende at tidsserier setter rekorder. Spesielt om man tillater seg å se etter rekorder de siste \(X\) årene. Man kan lete etter rekorder oppover og nedover, se på veksten til tidsserier, dele opp tidsserier, og mye mer. Man kan med andre ord nesten alltid finne noe å rapportere på.
Betyr det at å rapportere på tidsserier er en dum idé? Nei, men en god journalist bør inkludere figurer slik at leseren (og journalisten!) kan skille reell endring fra tilfeldig variasjon.