Meta-znaczniki

Automatyczne wyszukiwarki intensywnie wykorzystują tzw. meta-znaczniki (meta-keywords). Są to niewidoczne dla czytelnika strony (o ile nie podejrzy jej źródła) dodatkowe wskazówki dla wyszukiwarek.

Informacje o stronie zgłaszanej do wyszukiwarki

Dwa najważniejsze meta-słówka to:

description
Krótki opis zawartości strony, wyświetlany przez wyszukiwarki jako jej objaśnienie na liście znalezionych odpowiedzi (jeśli go nie ma, wyszukiwarka prezentuje pierwszych kilkanaście słów strony).
keywords
Lista słów kluczowych, podających słówka przy których poszukiwaniu wyszukiwarka ma wskazywać na naszą stronę nawet jeśli ona ich nie zawiera.

Nagłówek jednej z moich porad wygląda więc mniej więcej tak:

    <html lang="pl">
    <head>
    <meta http-equiv="Content-Type" content="text/html; charset=iso-8859-2">
    <title>Kącik porad dla programisty - przekierowywaie adresów WWW</title>
    <meta name="author" content="Marcin Kasperski">
    <meta name="keywords" content="adres, redirect, przekierowanie">
    <meta name="description" content="Kilka słów na temat polskich usług
    przekierowywania adresów WWW czyli
    jak używać www.mk.w.pl zamiast
    www.softax.com.pl/prywatne/marcink">
    </head>

Opis znajdujący się w tagu description musi być krótki (do około 20 słów) - jeśli będzie długi, zostanie obcięty w przypadkowym miejscu. Będzie prezentowany wraz z tytułem, dlatego warto potraktować go jako uzupełnienie tytułu (w szczególności nie ma sensu powtarzać tytułu w opisie).

Niektórzy 'sprytni' webmasterzy wykorzystują keywords do ogłupienia wyszukiwarki, wpisując tam często pojawiające się słowa - nawet gdy nie mają one żadnego związku z treścią strony. Kłamstwo ma krótkie nogi, wpisując seks, dziewczynki, nudes, rozebrane, zdjęcia i co tam jeszcze do głowy wpadnie na stronie poświęconej sprzedaży samochodów mamy szansę na kilka dodatkowych trafień - ale co nam po nich, skoro szukający swoistych wrażeń użytkownik z miejsca naciśnie Back. Innym spotykanym oszustwem jest wpisywanie w keywords jednego słowa wielokrotnie. Starsze indeksery nadawały wówczas stronie większą rangę przy szukaniu po tym słowie i np. strona z słowem kredyt wpisanym do keywords 50 razy była prezentowana na czele wyników wyszukiwania stron o kredytach. To także ma krótkie nogi, autorzy wyszukiwarek zorientowali się w tym oszustwie i coraz częstsze jest obniżanie rangi stron zawierających w ramach keywords jedno słowo kilkakrotnie albo zawierających w ramach tego tagu więcej niż kilkanaście słów. Podsumowując: rekomenduję używanie keywords uczciwie - umieszczanie tam co najwyżej 10 słów naprawdę odpowiadających zawartości strony.

Jeszcze jedna ważna uwaga: ważniejszy niż opisane meta-znaczniki jest tag title - który koniecznie trzeba umieszczać w bloku head. Jest używany do dwóch celów: przeglądarki często prezentują jego zawartość w pasku tytułowym a wyszukiwarki tytułują na jego podstawie znalezione strony. Niby banał ale przeglądając internet bardzo często widuję strony, na których tytułu nie ma albo nie zgadza się z ich treścią (bo np. cały nagłówek skopiowano z innej strony i zapomniano o poprawieniu tytułu).

Gdy nie chcemy indeksowania

Istnieją też znaczniki które powstrzymują wyszukiwarki przed zaindeksowaniem danej strony. Przydatne np. dla stron udostępnianych tymczasowo - o których wiemy że niedługo zmienią adres lub znikną. Często używane także przez webmasterów korzystających z ramek - by wykluczyć indeksowanie wewnętrznych stron serwisu (patrz też porada, w której odradzam używanie ramek).

Odpowiedni zapis wygląda następująco:

    <meta name="robots" content="noindex, nofollow">

gdzie noindex oznacza, że wyszukiwarce nie wolno indeksować bieżącej strony a nofollow, że nie powinna ona poszukiwać na niej odsyłaczy do innych stron (przy normalnym działaniu program indeksujący dołącza wszystkie odsyłacze do listy stron do przeanalizowania). Oczywiście można użyć tylko jednego z tych znaczników.

W zastosowaniach, w których zakazujemy indeksowania znaczących części serwisu, można posłużyć się plikiem robots.txt. Musi się on znajdować w głównym katalogu danego serwisu (np. dla moich stron sprawdzany jest adres http://www.softax.com.pl/robots.txt). Obszerny zbiór informacji można znaleźć pod adresem info.webcrawler.com/mak/projects/robots/robots.html. Przykład prościutkiego pliku robots.txt:

    User-agent: *
    Disallow: /public/beta_texts

Z oczywistych przyczyn (brak uprawnień) z tej metody nie mogą korzystać osoby przechowujące swoje strony w ramach cudzych większych serwisów.

Dodatkowe meta-znaczniki

Są jeszcze dwa meta-znaczniki o których warto wiedzieć:

author
Nazwa (gdy mamy do czynienia z firmą) bądź nazwisko autora. Może być używana przez wyszukiwarki do wyszukiwania stron na podstawie autora.
generator
Nazwa narzędzia użytego do generowania strony. Automatycznie ustawiane przez wiele programów do pisania lub generowania HTML. Niekiedy można się na ich podstawie dowiedzieć jakich programów używano do tworzenia podobających się nam serwisów.

Przykład wykorzystania znacznika author - tak podpisuję moje strony:

    <meta name="author" content="Marcin Kasperski">

Tagu generator nie używam (piszę HTML ręcznie), znam osoby, które w podobnej sytuacji wpisują tam zaklęcia typu:

    <meta name="generator" content="XEmacs, keyboard and HTML knowledge">
komentarze obsługiwane przez Disqus