#datascience Articles

Papers read in 2024

A list of papers read in 2024 as part of a paper reading club. The papers cover data science, recommendation engines, continuous optimization, operations research, information theory and statistics.

The average value

Presentation slides and video of a talk I gave about notions of averages (one-parameter models), loss functions and simple machine learning problems.

Visualizing software development skills with embeddings

We study a dataset consisting of software developers and their skills. The data is a large binary matrix, which we factorize to predict the probability that each developer has each skill. From the model we obtain an embedding, which we use to visualize skills in a two-dimensional space.

Betting on football - results

Throughout 2023 I’ve been using math to make bets on football matches. I created one statistical model to predict outcome probabilities and one optimization model to size bets.

Lønna til norske utviklere i 2023

(Norwegian) Hvilke faktorer bestemmer lønna til en utvikler? Vi analyserer et datasett fra kode24. Utviklerne med høyest lønn har lang erfaring, høy utdannelse, er konsulenter og jobber i Oslo.

Relative strength - Wilks, IPF GL and allometry

In powerlifting, formulas are used to assess and compare lifters with different body weights. In this article we evaluate two such formulas: Wilks and IPF GL. Then we generalize them and propose an alternative. We also create a formula that accounts for age and training experience.

Politikk og meningsrommet

(Norwegian) Vi ser på data fra NRKs valgomat. Hvor like er partiene? Hvilke partier kan grupperes sammen? Hvilke retninger beskriver politikkens meningsrom best?

Fair ticket controls

A public transportation company in Norway uses AI in their ticket control process. They claim to have put special focus on the ethical use of AI. But does an obvious ethical solution to such a problem exist? I don’t think so.

Fiktive norske navn

(Norwegian) Digfrid, Emmund, Harbjørg, Joannica, Olfine og Trestina høres kanskje ut som norske navn - men det er de ikke. I denne artikkelen laster vi ned 5703 norske navn og trener en språkmodell til å generere nye, fiktive navn.

Ranking doctors

The Norwegian website Legelisten.no contains reviews and ratings for doctors (general practitioners). How should doctors be ranked, considering that some of them have very few ratings?

Random Rotation Ensembles in Python

An implementation of the Random Rotation Ensemble in Python, using scikit-learn. The idea is to train an ensemble of trees on rotations of the data set, then average their predictions.

The best Pokémon party

There are close to 15 billion ways to create a party of 6 Pokémon from 151. But which party is the best one? In this article we model and solve the problem using mathematical optimization.

Er maskinlæring noe for deg?

(Norwegian) Maskinlæring er et uttrykk som blir mye brukt og kan høres imponerende ut, men hva er det egentlig? Og hva er verdien av maskinlæring? I denne artikkelen ønsker jeg å sette maskinlæring i sammenheng sammen med noen andre lignende teknikker, fortelle noen historier fra virkeligheten, og advare mot noen fallgruver.

Webinar: Maskinlæring for ledere

(Norwegian) Video og slides for et webinar jeg avholdt. Hva betyr uttrykk som maskinlæring, optimering, kunstig intelligens og roboter? Hvilke problemer er det teknologiene skal løse? Hva trenger en leder å vite?