Rozjazdy w danych marki rzadko zaczynają się od dużego błędu. Częściej od drobiazgu: raz spółka występuje jako „ABC Polska”, raz jako „ABC Sp. z o.o.”, autor ma dwa warianty nazwiska, sklep podaje stary adres w porównywarce, a profil społecznościowy linkuje do nieaktualnej domeny. Osobno wygląda to niewinnie. Razem tworzy bałagan, który utrudnia wyszukiwarkom, porównywarkom, katalogom i systemom AI rozpoznanie, że wszystkie te ślady dotyczą tej samej firmy. Entity reconciliation w SEO to nie jest kolejne modne określenie na „dodaj schema”. To proces porządkowania cyfrowej tożsamości: sprawdzania, porównywania i uzgadniania danych o marce w różnych źródłach. W praktyce chodzi o to, żeby nazwa firmy, adres, autorzy, produkty, profile social, dane LocalBusiness, katalogi, marketplace’y, porównywarki, Wikidata czy Crunchbase nie opowiadały o tej samej organizacji w kilku sprzecznych wersjach. Największy błąd? Zaczynanie od wdrożenia nowych danych strukturalnych, gdy stare źródła nadal pokazują co innego. Schema może pomóc, ale nie przykryje chaosu w podstawowych informacjach. Najpierw trzeba ustalić, która wersja danych jest prawdziwa. Dopiero potem warto ją publikować, oznaczać i wzmacniać linkami.
Audyt encji: gdzie szukać rozjazdów i które błędy mają najwyższy priorytet
Dobry audyt entity reconciliation zaczyna się od prostej tabeli. Nie od narzędzia za kilka tysięcy złotych. Nie od mapowania grafu wiedzy. Od arkusza, w którym każda informacja o marce ma źródło, status i decyzję.
Minimum, które warto zebrać:
- oficjalna nazwa firmy,
- skrócona nazwa handlowa,
- numer NIP, KRS, REGON lub odpowiednik dla danego rynku,
- aktualny adres i stare adresy,
- numer telefonu,
- domena główna i domeny historyczne,
- profile social,
- profile w Google Business Profile, Apple Business Connect, Bing Places,
- dane w katalogach branżowych,
- profile w marketplace’ach i porównywarkach,
- dane autorów i ekspertów,
- nazwy produktów, warianty produktów i stare nazwy serii,
- wpisy w Wikidata, Crunchbase, bazach firm i mediach.
Najwyższy priorytet mają dane, które identyfikują firmę wprost: nazwa, adres, telefon, domena, identyfikatory rejestrowe i profile oficjalne. Jeżeli tu jest bałagan, poprawianie opisów produktów albo biogramów autorów można odłożyć. Nie dlatego, że są nieważne, tylko dlatego, że wyszukiwarka najpierw musi rozpoznać główną encję.
W praktyce warto stosować cztery poziomy ważności:
- Krytyczne — błędna nazwa firmy, stary adres, nieaktualny telefon, zła domena, profil przypisany do innej firmy.
- Wysokie — niespójne dane LocalBusiness, błędne profile social, różne nazwy tej samej marki w katalogach i porównywarkach.
- Średnie — rozbieżności w nazwach produktów, autorach, stanowiskach, opisach usług.
- Niskie — kosmetyka opisów, małe różnice stylistyczne, stare wzmianki bez wpływu na widoczne wyniki i profile.
Nie każda różnica jest błędem. „Jan Kowalski” i „Jan A. Kowalski” mogą oznaczać tę samą osobę, ale nie należy tego automatycznie scalać, jeśli w branży działają dwie osoby o podobnym nazwisku. „Brand24” i „Brand 24” mogą być wariantami zapisu, ale dopiero oficjalna strona, regulamin, stopka prawna i profile zewnętrzne pokażą, który zapis jest podstawowy.
Najbardziej zdradliwe są stare źródła o wysokim autorytecie. Dawny artykuł w dużym serwisie, archiwalny profil w katalogu inwestorskim albo stary marketplace potrafią utrzymywać błędny adres przez lata. Google nie musi uznać ich za ważniejsze od strony firmowej, ale jeśli takich śladów jest dużo, robi się szum. I ten szum później widać w panelach wiedzy, sugestiach, wynikach lokalnych albo odpowiedziach generowanych przez systemy AI.
W audycie warto stosować zasadę: nie poprawiamy wszystkiego naraz. Najpierw źródła, które są widoczne w Google po zapytaniach brandowych. Potem profile oficjalne. Następnie katalogi, porównywarki i marketplace’y, które realnie indeksują się w wynikach. Na końcu źródła mało widoczne, chyba że zawierają poważny błąd prawny lub reputacyjny.
Uzgadnianie danych: jak zbudować jedną wersję prawdy dla marki, autorów, produktów i lokalizacji
Uzgadnianie encji nie polega na tym, że wybieramy najładniejszy wariant nazwy. Potrzebna jest kanoniczna wersja danych — jedna tabela lub dokument, do którego można wrócić przy każdej aktualizacji strony, profilu, kampanii PR, marketplace’u czy danych strukturalnych.
Taki dokument powinien zawierać nie tylko poprawną wartość, ale też decyzję: gdzie wolno stosować skrót, kiedy wymagany jest pełny zapis prawny, które profile są oficjalne i które stare warianty należy traktować jako aliasy.
Przykład dla firmy:
- nazwa prawna: ABC Spółka z ograniczoną odpowiedzialnością,
- nazwa handlowa: ABC,
- warianty dopuszczalne: ABC Polska, ABC Store — tylko w kampaniach i materiałach marketingowych,
- warianty niedopuszczalne: ABC24, ABC.com.pl — stare nazwy, nieużywane od 2022 roku,
- domena kanoniczna: abc.pl,
- profile oficjalne: LinkedIn, Facebook, Instagram, YouTube,
- profil do zamknięcia lub oznaczenia jako historyczny: stary Twitter/X, dawny katalog franczyzowy,
- adres główny: aktualny adres z dokumentów rejestrowych i strony kontaktowej,
- adresy historyczne: tylko do kontroli starych cytowań, bez publikowania jako bieżące.
Dla autorów zasada jest podobna. Trzeba ustalić, czy autor występuje jako osoba prywatna, ekspert firmowy, lekarz, prawnik, doradca, redaktor czy przedstawiciel marki. To ważne, bo inny poziom weryfikacji będzie potrzebny przy blogu e-commerce, a inny przy tematach medycznych, finansowych lub prawnych.
Przy autorach warto sprawdzić:
- identyczny zapis imienia i nazwiska,
- stanowisko,
- stronę autora,
- linki do profili zawodowych,
- publikacje zewnętrzne,
- zdjęcie,
- informację o kompetencjach,
- relację autora z firmą.
Nie należy automatycznie podpinać każdego tekstu pod „najmocniejszego” eksperta, jeśli faktycznie go nie napisał ani nie zweryfikował. To krótkoterminowo wygląda wygodnie, ale długoterminowo tworzy problem wiarygodności. Jeżeli autor tylko zatwierdził tekst merytorycznie, lepiej napisać „konsultacja merytoryczna” niż udawać autorstwo.
Produkty wymagają osobnego podejścia. Tu najczęściej pojawia się konflikt między SEO, sprzedażą i danymi magazynowymi. System PIM ma jedną nazwę, marketplace drugą, porównywarka trzecią, a Google Merchant Center dostaje jeszcze inny wariant. Efekt: produkt zaczyna wyglądać jak kilka różnych produktów.
Dla produktów trzeba ustalić:
- nazwę kanoniczną,
- SKU lub inny identyfikator,
- EAN/GTIN, jeśli istnieje,
- warianty rozmiaru, koloru, pojemności,
- relację między produktem głównym a wariantami,
- stare nazwy,
- nazwy stosowane przez producenta,
- nazwy stosowane przez dystrybutorów.
Granica jest prosta: nie wolno scalać produktów tylko dlatego, że są podobne. Jeżeli różnią się składem, pojemnością, generacją, rokiem produkcji albo kompatybilnością, powinny pozostać osobnymi encjami. W przeciwnym razie można poprawić „porządek” w arkuszu, a jednocześnie zepsuć feed, dane produktowe i dopasowanie do zapytań użytkowników.
W przypadku lokalizacji trzeba uważać na firmy wielooddziałowe. Każdy oddział powinien mieć własny zestaw danych: adres, telefon, godziny otwarcia, stronę lokalizacji, profil lokalny i odpowiedni typ LocalBusiness. Jedna centrala nie rozwiązuje problemu, jeśli użytkownik szuka konkretnego punktu w konkretnym mieście.
Tu często pojawia się błąd: firma ma jedną stronę kontaktową, na niej pięć lokalizacji, a dane strukturalne opisują tylko centralę. Albo odwrotnie — każda lokalizacja publikuje te same dane telefonu i adresu, bo ktoś skopiował JSON-LD z jednej podstrony. To nie jest drobna literówka. To sygnał, że system nie rozróżnia oddziałów.
Dobra wersja prawdy powinna być nudna, precyzyjna i łatwa do skopiowania. Jeśli wymaga interpretacji, będzie psuta przy każdej kolejnej aktualizacji.
Wdrożenie i kontrola: co poprawiać ręcznie, co automatyzować, a czego nie ruszać bez dowodów
Po audycie przychodzi etap, na którym najłatwiej stracić czas. Lista błędów rośnie, zespół chce poprawić wszystko, a po dwóch tygodniach nikt nie wie, które zmiany faktycznie weszły. Dlatego wdrożenie trzeba prowadzić partiami.
Najpierw poprawia się źródła kontrolowane:
- własną stronę,
- stopkę,
- stronę kontaktową,
- podstrony lokalizacji,
- strony autorów,
- dane produktowe,
- feed produktowy,
- dane strukturalne JSON-LD,
- profile social,
- Google Business Profile i inne profile lokalne.
Dopiero potem źródła półkontrolowane: katalogi, marketplace’y, porównywarki, Crunchbase, Wikidata, profile partnerskie, stare wpisy sponsorowane, wizytówki branżowe. Tu trzeba liczyć się z ograniczeniami. Nie każde pole da się edytować. Nie każda zmiana przechodzi od razu. Niektóre serwisy mają moderację, inne wymagają dowodu, a część po prostu ignoruje zgłoszenia.
W danych strukturalnych nie chodzi o to, żeby wrzucić jak najwięcej właściwości. Chodzi o zgodność z widoczną treścią i stanem faktycznym. Jeżeli strona pokazuje jeden adres, a JSON-LD drugi, problemem nie jest brak schema, tylko brak spójności. Jeżeli organizacja ma kilka lokalizacji, trzeba zdecydować, czy opisujemy organizację nadrzędną, oddział, czy konkretny punkt usługowy. Mieszanie tych poziomów kończy się nieczytelnym sygnałem.
W praktyce dobrze działa taki porządek:
- Strona firmowa jako źródło bazowe — nazwa, adres, telefon, logo, profile, dane prawne.
- Dane strukturalne zgodne z widoczną treścią — Organization, LocalBusiness, Product, Person tam, gdzie faktycznie pasują.
- Profile oficjalne — te, do których firma ma dostęp i które są linkowane ze strony.
- Źródła zewnętrzne o wysokiej widoczności — katalogi, marketplace’y, porównywarki, Crunchbase, Wikidata, media.
- Monitoring wyników brandowych — sprawdzanie, czy błędne warianty nadal pojawiają się w Google.
Automatyzować można wykrywanie różnic. Nie decyzje. Narzędzia typu crawler, eksport z GSC, Screaming Frog, Sitebulb, OpenRefine, arkusze z formułami, własne skrypty czy API marketplace’ów pomagają znaleźć powtarzalne rozjazdy. Ale decyzję, czy „ABC Medical” i „ABC Med” to ta sama encja, powinien podjąć człowiek z dostępem do dokumentów, historii marki i kontekstu biznesowego.
OpenRefine dobrze nadaje się do pracy na większych zbiorach: można normalizować nazwy, grupować podobne wartości, porównywać kolumny, wykrywać warianty zapisu i uzgadniać dane z zewnętrznymi bazami. Przy Wikidata trzeba być ostrożnym. To nie jest miejsce na spam SEO ani katalog firm. Jeżeli firma, osoba lub produkt nie spełnia zasad istotności danego projektu, próba dodania wpisu może skończyć się usunięciem. Lepsza decyzja: najpierw sprawdzić kryteria i istniejące źródła, dopiero potem edytować.
Crunchbase ma podobny praktyczny problem: część danych można poprawić, część może wymagać przeglądu lub nie być dostępna do edycji wprost. Dlatego przy profilach zewnętrznych zawsze trzeba zapisywać:
- datę zgłoszenia,
- kto zgłaszał zmianę,
- co dokładnie zgłoszono,
- jaki dowód dołączono,
- status,
- datę ponownej kontroli.
Bez tego po miesiącu zostaje tylko wrażenie, że „coś było poprawiane”. To za mało.
Kontrola po wdrożeniu powinna trwać co najmniej kilka tygodni, bo część źródeł aktualizuje się wolno, a Google może utrzymywać stare dane w wynikach dłużej niż oczekuje klient. Nie ma gwarancji, że poprawienie katalogu natychmiast zmieni panel wiedzy, wynik lokalny albo odpowiedź AI. Można natomiast zwiększyć prawdopodobieństwo, że systemy zaczną widzieć jedną, spójną wersję marki.
Najbardziej praktyczny wskaźnik sukcesu nie brzmi: „czy wdrożyliśmy schema?”. Brzmi: czy po wpisaniu nazwy marki, autora, produktu i adresu widać mniej sprzecznych informacji niż przed audytem. Jeżeli tak, proces działa.
Autor artykułu: https://cmspace.pl.
FAQ: najczęstsze pytania o entity reconciliation w SEO
Czy entity reconciliation to to samo co entity SEO?
Nie. Entity SEO to szersze podejście do wzmacniania rozpoznawalności encji w wyszukiwarkach. Entity reconciliation jest bardziej techniczne i operacyjne: polega na wykrywaniu, porównywaniu i uzgadnianiu danych o tej samej firmie, osobie, produkcie lub lokalizacji w różnych źródłach.
Od czego zacząć, jeśli marka ma dużo starych danych w sieci?
Od zapytań brandowych w Google i od źródeł kontrolowanych przez firmę. Najpierw popraw strona, stopka, kontakt, profile social, Google Business Profile, dane strukturalne i feedy. Dopiero później katalogi, marketplace’y i porównywarki.
Czy schema.org rozwiązuje problem niespójnych danych?
Nie. Schema pomaga opisać dane, ale nie naprawia sprzeczności. Jeśli na stronie jest inny adres niż w katalogach i profilach lokalnych, samo dodanie LocalBusiness nie wystarczy. Najpierw trzeba ustalić poprawną wersję danych.
Czy warto dodawać firmę do Wikidata?
Tylko wtedy, gdy istnieją solidne, niezależne źródła i encja spełnia zasady projektu. Wikidata nie jest katalogiem SEO. Dodawanie wpisu bez podstaw może skończyć się usunięciem i stratą czasu.
Jak często robić audyt reconciliation?
Po każdej zmianie nazwy, adresu, domeny, właściciela, struktury marki, portfolio produktów lub sieci lokalizacji. Dla stabilnych firm wystarczy kontrola raz na 6–12 miesięcy. Dla e-commerce, marketplace’ów i firm wielooddziałowych lepiej robić krótsze kontrole kwartalne.
Czy trzeba poprawiać każdą starą wzmiankę o firmie?
Nie. Priorytet mają źródła widoczne w Google, profile oficjalne, dane lokalne, marketplace’y, porównywarki i katalogi, które realnie wpływają na użytkownika. Stare, niewidoczne wzmianki można zostawić, jeśli nie zawierają poważnego błędu.
Jaki błąd usuwać jako pierwszy?
Ten, który myli tożsamość firmy: zły adres, zła domena, błędny telefon, nieaktualna nazwa albo profil prowadzący do innej organizacji. Dopiero po tym warto poprawiać opisy, aliasy, biogramy i mniej widoczne katalogi.