Fördjupning: så funkar Boolis värderingar

Är du nyfiken på hur Boolis värderingar fungerar mer ingående? Då har du hittat rätt. Här går vi igenom allt från hur det går till när vi tar fram en värdering till vad som händer om marknaden förändras. Vi lyfter också upp vilka styrkor och svagheter som finns. En värdefull fördjupning helt enkelt!

För att Booli ska kunna värdera en bostad behöver vi först samla in information om bostaden som exempelvis adress, bo- och biarea, antal rum och eventuell tomtstorlek. Vi använder sen den informationen för att hitta liknande försäljningar i närområdet som vi baserar värderingen på.

📍Positionering och beskrivning av bostaden

Steg ett i en värdering är att ange var bostaden ligger. Utifrån en adress får vi fram en koordinat som beskriver var i Sverige bostaden finns. Därefter samlar vi in beskrivande information som bo- och biarea, tomtarea, antal rum, bostadstyp, ägandeform, avgift till förening, driftskostnad, taxeringsvärde, standardpoäng, vatten, avlopp, byggår osv.

Exakt vilka attribut vi använder beror på vilken sorts bostad det är och vilken ägandeform den har. Ibland är inte all information tillgänglig för en bostad och då använder vi den mängd vi har tillgång till.

För vissa datapunkter, som taxeringsvärde, standardpoäng, vatten och avlopp får vi inte informationen via värderingsformuläret. Vi använder istället data från Lantmäteriet.

⚖️ Val av värderingsmodeller baserat på boendeform och ägandeform

När vi har fått data om bostaden som ska värderas väljer vi vilka av våra olika värderingsmodeller som ska användas. Idag har vi två huvudsakliga modeller som viktas ihop för att ge en slutgiltig värdering.

Det är vår basmodell som värderar baserat på liknande försäljningar i området, samt en kompletterande modell som värderar utifrån tidigare försäljning av samma bostad.

Basmodellen i sin tur är uppdelad i fyra olika delmodeller som alla fungerar på samma sätt men som är tränade för olika bostadstyper. Vi delar upp den i en villamodell, en lägenhetsmodell, en modell för radhus som bostadsrätt och en sista modell för radhus som äganderätt. Parhus och kedjehus grupperas tillsammans med radhusen.

Basmodellen används för alla värderingar. Modellen som värderar utifrån tidigare försäljningar används bara i de fall vi har information om en tidigare försäljning av samma bostad. För villor och radhus kan vi ofta hitta sådana försäljningar baserat på enbart adressen, men för lägenheter behöver vi ha tillgång till lägenhetsnumret.

🏘Värdering baserat på liknande försäljningar

Vår basmodell för värdering använder en maskininlärningsteknik som kallas kernel regression, och vi använder metoden metric learning för att träna den. Kernel regression har stora likheter med K-nearest neighbours (k-NN) men har vissa signifikanta fördelar gentemot k-NN som gör att den presterar bättre. Boolis värderingstjänst har tidigare använt k-NN men det har vi nu gått ifrån.

Båda teknikerna uppskattar ett förväntat slutpris på en osåld bostad genom att ta ett viktat medelvärde av slutpriserna för liknande sålda bostäder. Den här metodiken påminner mycket om hur man gör en manuell värdering, alltså genom att samla in information om tidigare försäljningar och göra en skattning baserat på det.

Insamling av liknande försäljningar

Första steget i basmodellens värdering är att samla in potentiella referensförsäljningar. Vi utgår från koordinaten för bostaden vi vill värdera och hämtar in information om de 1000 geografiskt närmsta försäljningarna vi kan hitta. Genom att ta de 1000 närmsta får vi ett underlag som anpassar sig efter försäljningstäthet och omsättning i området.

*Exempel på en värderingsbostad (svart prick) och 1000 närliggande försäljningar (rosa prickar). De rosa prickarna kan representera en eller flera försäljningar.*

I storstäder kommer vi få en cirkel av referensförsäljningar som är ganska liten, medan den i glesbygd kan bli väldigt stor. Vi har gjort flera försök med att dela upp landet i olika delområden baserat på bland annat län, kommun, stadsdel, DeSO och församling. Men vi har sett att den här “automatiska” anpassningen av upptagningsområdet presterar bättre än områdesindelningar och gränsdragningar.

Likhetsbedömning

Efter att vi hämtat upp 1000 försäljningar i närområdet gör vi en bedömning av hur lika de är bostaden vi vill värdera. Utifrån attributen som beskriver bostäderna (bo- och biarea, antal rum, taxeringsvärde, m.m.) samt med hänsyn till hur länge sedan en försäljning skedde och hur långt bort den ligger, görs en bedömning av hur lika de är värderingsbostaden.

Om vi hittar en referensförsäljning på samma adress som värderingsbostaden från förra veckan med identisk boarea kommer den försäljningen troligtvis ges ett högt värde på likhet. En referensförsäljning från flera år sedan, som ligger långt bort och/eller på andra sätt har stora olikheter med värderingsbostaden kommer ges ett lågt likhetsvärde. De olika attribut vi tar hänsyn till har alltså olika vikt i bedömningen, och dessa vikter tränas fram med maskininlärningsmetoder för att ge så bra värderingsresultat som möjligt.

Indexjustering av slutpriser

Nästa steg i basmodellen är att indexjustera försäljningspriserna för de funna referensförsäljningarna. Att indexjustera innebär kortfattat att justera äldre slutpriser till dagens prisnivåer för att kunna göra en mer rättvis jämförelse.

Vi använder SBAB Booli Housing Price Index för det indexområde som värderingsbostaden ligger i och räknar upp eller ned priserna på alla referensförsäljningar enligt index. På så sätt får vi en indikation på vad referensobjekten hade sålts för på dagens marknad.

*SBAB Booli Housing Index för lägenheter och småhus i Storstockholm*

Denna indexjustering är anledningen till att en värdering kan förändras över tid trots att det inte säljs något i närheten. Vi tar på det sättet in indexområdets generella prisförändring i alla värderingar, även i de delar av landet som har väldigt låg omsättning. Våra utvärderingar visar att detta ger en markant förbättring av precisionen i värderingarna.

Sammanviktning av slutpriser baserat på likhet

När vi har ett likhetsvärde och ett aktuellt slutpris för samtliga 1000 referensförsäljningar kan vi beräkna ett viktat medelvärde, där vikten ges av hur lik referensförsäljningen är värderingsobjektet. Att ta ett viktat medelvärde innebär att man tar ett snitt av priserna, där den påverkan varje pris får är styrt av hur betydelsefull den är för värderingen. Det kan låta mycket att ta hänsyn till 1000 referensobjekt, men oftast kommer endast ett fåtal ha en signifikant inverkan på värderingen.

Likhetsmåttet beräknas på ett sådant sätt att vi har en snabbt avklingande fördelning av likhetsvärden på referensobjekten. För bostäder där det endast finns ett fåtal lika objekt i närområdet (t.ex. en villa på landet eller en unik lägenhet i staden) kommer de fåtalet ges en stor vikt vid värderingen. För bostäder där det finns många liknande referensobjekt (t.ex. en lägenhet i närförort eller ett radhus i ett radhusområde) kommer fler objekt kunna ge påverkan på värderingen.

Värdera en bostad

Efterjustering baserat på andra attribut

Efter att vi beräknat det viktade medelvärdet som är basen för värderingen gör vi en efterhandsjustering baserat på våningsplan (för lägenheter) och skick (för alla bostadstyper).

I fallet med våningsplan har vi sett att våningen har en stor påverkan på priset för en lägenhet – högt upp i huset ger oftast ett högre pris än långt ner i huset. Men när vi tar med våningsplanet i likhetsbedömningen enligt ovan har det visat sig ge en försämring i värderingarnas precision. Därför har vi istället valt att justera upp eller ned värderingen baserat på hur värderingsbostadens våningsplan skiljer sig från referensobjektens våningsplan.

Om användaren har angett skicksparametrar i vårt värderingsformulär gör vi också en efterhandsjustering av värdet baserat på det. Denna justering är baserad på analyser vi har gjort om hur olika skicksattribut påverkar priset.

🏘 Värdering baserat på tidigare försäljning av samma bostad och sammanviktning

Om vi kan se att samma bostad har sålts tidigare beräknar vi ett aktuellt värde på den försäljningen med hjälp av prisindex. Vi ger sedan det värdet en vikt baserat på hur länge sedan försäljningen skedde och viktar på så sätt in den i slutvärderingen som presenteras för dig som användare. En försäljning som skedde nära i tid kommer ge större påverkan än en som skedde för en längre tid sedan.

👋 Här syns värderingen

Vi visar värderingen som ett ungefärligt värde på sista sidan i värderingsformuläret och på Min Bostad när du är inloggad.

På Min Bostad presenteras värderingen tillsammans med en graf som indikerar dess värdeförändring över tid. Grafen är framtagen genom att justera det aktuella värdet bakåt i tiden efter prisindex, och representerar inte faktiska historiska värderingar. Detta beror på att vi tror att den nuvarande värderingen är den mest precisa vi kan ge, som baseras på störst mängd information. Därför ger en indexjusterad version av den värderingen mest pålitlig indikation på historisk värdeutveckling.

Vi visar också en värdering på nästan alla bostadsobjekt och även på bostäder som inte är till salu, på Booli. Dessa värderingar påverkas ej av data från värderingsformuläret utan är baserade enbart på data från mäklarannonser och Lantmäteriet.

⚖️ Bedömning av precision i värderingarna

För att bedöma precisionen på värderingarna så jämför vi dem med faktiska försäljningspriser. Booli samlar in försäljningsdata löpande och gör utvärderingskörningar där vi varje vecka jämför vår värdering av en bostad med priset den såldes för.

För lägenheter i storstäder hamnar majoriteten av Boolis värderingar inom 6 % från det pris de säljs för. För småhus hamnar majoriteten av värderingarna inom 9 % från slutpriset. Medianfelet ligger kring +/- 0,5 % under stabila marknadslägen. Det gör Boolis värderingar till de mest träffsäkra statistiska värderingarna i Sverige.

📈 Hur reagerar värderingen på kraftiga förändringar i marknaden (prisfall eller prisökningar)?

Eftersom den statistiska värderingen är knuten till både prisindex och registrering av försäljningspriser har den en viss fördröjning.

I fallet med prisindex beräknas en ny indexpunkt varje månad för det genomsnittliga prisläget den föregående månaden. På Booli beräknar vi om våra index varje dag och har därför tillgång till augusti månads indexpunkt den 1 september. Om vi gör förenklingen att snittvärdet för en månad motsvarar ungefär prisläget i mitten av månaden, kan man säga att beroendet till prisindex gör att vi alltid har mellan 2 till 6 veckors fördröjning i värderingen.

Det kan förekomma lokala förändringar av prisläget i olika områden som inte speglas i prisindex för indexområdet. Till exempel om ett område förändras markant genom bygg- eller infrastrukturprojekt som orsakar att priserna förändras kommer det dröja tills tillräckligt många försäljningar skett i området innan prisändringen syns i den statistiska värderingen. För områden med hög omsättning löses således det här problemet snabbare än för områden med låg omsättning.

Beroendet till registrering av försäljningspriser finns både för prisindex och för den statistiska värderingen. Det är naturligt att statistiska metoder som baseras på tillgång till data inte kan ta hänsyn till data som inte rapporterats in.

När det som den senaste tiden är turbulent på bostadsmarknaden och vi ser snabbt fallande priser är det många bostäder som förblir osålda, pga att säljare och köpare inte kan komma överens om pris. Man kan då ha hypotesen att de försäljningar som rapporteras inte speglar hela förändringen i marknadsläget, och bostäderna som inte blir sålda inte blir det på grund av att säljarna har för höga förväntningar på pris samt att de som blir sålda blir det för att köparna inte har insett vidden av prisfallet och betalar för mycket. Om den hypotesen stämmer skulle det innebära att vi i sådana tider har ett större verkligt prisfall än det som syns i statistiken. Det kanske finns poänger i ett sådant resonemang, men jag tror att man gör bäst i att lita på att marknaden sätter rätt priser och att det vi ser i statistiken faktiskt speglar det verkliga marknadsläget den månaden. Att andelen osålda stiger ser jag som en konsekvens av att osäkerheten stiger och att både köpare och säljare behöver tid att förstå och anpassa sig till det nya läget.
– Henrik Almér, en av grundarna till Boolis värderingar

*Ett urklipp ur prisindex för lägenheter i Storstockholm med perioder av fallande, stigande och stabila priser markerade*

Vi har gjort simuleringar av hur våra värderingar presterar i olika marknader för att få en förståelse för hur snabba prisuppgångar och snabba prisfall påverkar precisionen. De simuleringarna visar att felvärderingen i snitt motsvarar prisförändringen under innevarande månad

Feldistribution för värderingar av lägenheter i Stockholms kommun på den stabila marknaden våren 2018. Vi ser att center för distributionen är kring 0 % felvärdering, med uppemot 30 % felvärdering i extremerna. Majoriteten av värderingarna ligger inom +/- 5 % från slutpriset.

På den kraftigt stigande marknaden vi hade i samband med pandemin 2020-2021 undervärderade vi i snitt ca 3 %. På den kraftigt sjunkande marknaden vi har nu, 2022, övervärderar vi med ca 2,5 % i snitt. På en stabil eller avvaktande marknad med små förändringar i prisläget, som den vi hade 2018, värderar vi i snitt +/- 0 % fel.

Här ser man samma felkurva i grönt, för den stabila marknaden 2018, kompletterat med felkurvorna för den stigande marknaden 2021 och den fallande marknaden 2022. De fallande och stigande marknaderna är lägre och bredare, vilket indikerar att fler värderingar får stora fel. De är också förskjutna lite över eller lite under 0, vilket indikerar en systematisk över- eller undervärdering i dessa marknadslägen.

Här använder vi lägenheter i Stockholms kommun som exempel eftersom detta är en marknad med hög omsättning och god matchning mot sitt prisindex, som är någorlunda “enkel” att värdera. Varje kurva ovan motsvarar 4 månader, vilket innebär mellan 5 500 och 8 000 försäljningar.

🔍Styrkor och svagheter med Boolis statistiska värderingar

✋Svagheter

En statistisk värdering är helt beroende av att datan vi har är korrekt, och så är tyvärr inte alltid fallet. Boolis data håller generellt väldigt hög kvalitet, men perfekt data är omöjlig att uppnå och det kommer alltid finnas vissa felaktigheter. Felaktigheterna kan komma från att data matats in på felaktigt sätt i mäklarsystem eller hos Lantmäteriet, eller att våra automatiserade insamlingssystem tolkar datan på fel sätt.

Det finns också fall av medvetet vilseledande data. Till exempel är det inte ovanligt att villor är feltaxerade och att informationen som står i mäklarannonsen inte stämmer överens med informationen vi får från Lantmäteriet. I det fallet låter vi informationen i annonsen ha företräde för vi tror att den speglar sanningen bättre. Men vi är beroende av taxeringsvärdet från Lantmäteriet för att göra en bra värdering och om taxeringsvärdet i dessa fall är felaktigt så introducerar detta en felkälla i likhetsbedömningen.

En annan svaghet med en databaserad värderingsmetod är att all information om en bostad inte går att beskriva med siffror. Eller att datan inte går, eller är väldigt svår, att få tag på. Attribut som ljusinsläpp, bullernivå och utsikt som teoretiskt skulle gå att kvantifiera kan vi inte hänsyn till då datan inte är tillgänglig för oss.

Databaserade modeller ställer också krav på att data ska finnas i tillräckliga volymer för att de ska vara pålitliga. Vi stöter ibland på önskemål om att kunna vara mer specifika i de prisindex vi använder, t.ex. kan vi få förfrågningar om ett prisindex specifikt för Midsommarkransen eller något annat mindre område. Många ser prisindexområdena som för stora och ställer sig frågan om inte prisutvecklingen i just deras område skiljer sig från övriga områden. Tyvärr kräver prisindex en väldigt stor mängd försäljningar för att kunna beräknas tillförlitligt och därför är det inte möjligt att beräkna ett rättvisande index i områden där omsättningen är för liten.

Alla problem som kommer från felaktig eller bristande tillgång på data kommer göra att modellen i enstaka fall ger mycket felaktiga värderingar. För användare kan det upplevas som icke-trovärdigt när man stöter på sådana felaktigheter på Booli, men det är svårt att komma ifrån när man använder en statistisk modell. Det kommer alltid finnas undantag med stora fel, oavsett vilken modell man använder.

När man som användare tolkar en värdering behöver man också ha rätt förväntningar på precisionen. Vi använder slutpriset som facit i våra utvärderingar och slutpriser speglar inte alltid det “korrekta” marknadsvärdet. Det händer att bostäder säljs både lite för dyrt och lite för billigt i förhållande till deras verkliga värde. Det finns alltså en viss brusighet i den data vi använder som underlag för att träna vår modell. Därför anser vi att en värdering som hamnar inom +/- 5 % från slutpriset är en korrekt värdering.

💪Styrkor

Styrkorna med vår statistiska modell är bland annat att det möjliggör för oss att värdera hela Sveriges bostadsbestånd, en gång i veckan, och tillgängliggöra den informationen på Booli. Det är vi ensamma om att göra.

Vi offentliggör information som tidigare varit reserverad för mäklare och bolåneinstitut och ger på så sätt möjlighet för privatpersoner att ta bättre, mer välgrundade beslut i sina bostadsaffärer.

Genom att publicera slutpriser och värderingar, samt ge tillgång till ett värderingsverktyg, demokratiserar Booli informationstillgång och bidrar till en mer balanserad bostadsmarknad på mer jämlika villkor för köpare och säljare, med ett minskat informationsövertag för mäklare.

Vi gör dessutom detta med en modell som visat sig vara Sveriges bästa statistiska värderingsmodell för lägenheter och småhus.

Värdera en bostad