O projektu
Tato stránka popisuje, co v projektu sleduji, jak pracuji s historií inzerátů a jak interpretuji vývoj cen nemovitostí, nájemní trh, aktivní nabídky a zlevnění nemovitostí. Cílem je nabídnout transparentní metodiku analytického webu, nikoli prezentaci jednotlivých nabídek. Jde o můj hobby projekt, který vzniká hlavně z vlastní zvědavosti nad tím, jak se český realitní trh v čase skutečně mění.
Projekt je zaměřený na realitní trh v Česku a na agregované statistiky, které pomáhají sledovat ceny bytů, ceny domů, cenové změny a aktivitu trhu v čase. Nejde o realitní inzertní portál a není postavený kolem prezentace jednotlivých inzerátů.
Web vzniká jako osobní hobby projekt a datový experiment, který dělám z vlastní zvědavosti. Výstupy proto beru jako analytickou pomůcku pro orientaci v trhu, ne jako oficiální statistiku nebo investiční doporučení.
Hlavním cílem je nabídnout důvěryhodný přehled o tom, jak se vyvíjí nabídka a jak se mění nabídkové ceny v různých částech trhu. Vedle samotných cen sleduji také nájmy, cenu za m², aktivní nabídky, zlevnění nemovitostí a orientační návratnost pronájmu.
Data pocházejí z veřejně dostupných realitních nabídek, které pravidelně automatizovaně zpracovávám. Zaznamenávám zejména textové a strukturované informace, které jsou potřeba pro analytické vyhodnocení nabídky, cen a lokality.
Při zpracování sjednocuji názvy lokalit, typy transakcí, kategorie nemovitostí a další atributy tak, aby šlo data porovnávat mezi regiony a v čase. Výsledkem nejsou redakčně upravené profily inzerátů, ale datová vrstva určená pro statistické a metodické vyhodnocení.
U každé nabídky sleduji její stav v čase. Pokud se u stejného inzerátu změní nabídková cena, uloží se nová hodnota do historie a je možné porovnat předchozí a aktuální stav. Díky tomu lze sledovat nejen aktuální ceny bytů a ceny domů, ale také jejich vývoj v průběhu jednotlivých týdnů a měsíců.
Historie nabídek je důležitá i pro detekci změn, jako je opakované zlevnění nemovitostí nebo dlouhodobě stagnující cena. Pokud se nabídka znovu objeví v upravené podobě, systém se ji snaží přiřadit k existující historii podle dostupných identifikátorů a dalších shodných znaků.
Za aktivní nabídky považuji inzeráty, které jsou v aktuálním sběru stále dostupné a nevykazují známky ukončení. Pokud nabídka přestane být ve zdrojích dostupná, může být po určitém ověření označena jako neaktivní, stažená nebo ukončená.
Počet aktivních nabídek proto nevyjadřuje celý objem trhu, ale pouze viditelnou část nabídky, kterou lze v daný okamžik zachytit z veřejných zdrojů. U krátkodobě publikovaných inzerátů může být životní cyklus nabídky kratší, než dovolí frekvence sběru bezpečně zaznamenat.
Metrika cena za m² vychází z jednoduchého vzorce:
cena za m² = nabídková cena / užitná plocha
Do výpočtu vstupují pouze nabídky, u kterých je dostupná nabídková cena i užitná plocha. Pokud plocha chybí, je zjevně nesprávná nebo neodpovídá povaze nabídky, položka se do této metriky nezařazuje. Agregované hodnoty pak pomáhají porovnávat vývoj cen nemovitostí napříč lokalitami a segmenty trhu.
Data se přiřazují k územním celkům podle dostupných údajů v nabídce a následné normalizace lokalit. Výstupy proto mohou být agregované na úrovni regionů, okresů a měst, pokud je možné nabídku k danému území spolehlivě přiřadit.
U některých inzerátů bývá lokalita uvedena nepřesně, pouze marketingově nebo v jiné územní logice než v oficiálním členění. V takových případech může dojít k nezařazení nabídky do jemnější geografické úrovně, aby zůstala zachována kvalita agregovaných statistik pro realitní trh v Česku.
Pracuji s nabídkovými daty, nikoli s realizovanými prodejními cenami. Nabídková cena se může od skutečné uzavřené transakce lišit, a to někdy významně. Statistiky proto slouží hlavně pro sledování směru trhu, relativních rozdílů mezi lokalitami a změn v nabídce.
Omezením je také různá kvalita zdrojových inzerátů. Některé nabídky mohou mít neúplné parametry, nekonzistentní plochy, chybějící dispozici nebo nepřesně uvedenou lokalitu. U menších segmentů trhu navíc může nízký počet záznamů vést k vyšší volatilitě výsledných ukazatelů.
Část nabídek může být v datech duplicitní, protože stejná nemovitost mohla být inzerována vícekrát, například pokaždé v jiné kategorii nebo s upravenými parametry. I když se systém snaží historii nabídek spojovat podle dostupných znaků, není možné duplicity odstranit dokonale. Celková čísla je proto potřeba brát s rezervou a vnímat je hlavně jako orientační obraz veřejně dostupné nabídky.
Sběr a zpracování dat probíhá pravidelně v automatizovaných dávkách. Cílem je průběžně aktualizovat informace o cenách, nájmech, aktivitě nabídky i historii změn tak, aby stránka zachycovala aktuální situaci na trhu bez ručního přepisování jednotlivých inzerátů.
Přesná rychlost promítnutí změn se může lišit podle dostupnosti zdroje, kvality vstupních dat a navazujícího validačního procesu. Uživatel by proto měl některé čerstvé změny chápat jako průběžně potvrzované, zejména pokud jde o krátkodobé výkyvy nebo nově zveřejněné nabídky.