Nasze logo
YahooAltaVistaLycos
Google Netsprint  Hotbot


Szukaj terminu:
Zaczyna się od Zawiera Dokładny wyraz
 
Po wpisaniu nazwy lub pierwszej litery należy wybrać
rodzaj kategorii w której powinien znajdować się szukany plik.
Wpisz wyszukiwane słowo:
Zapraszamy na blogi Chat Forum Słownik Download Filmy Mobil Radio Gry Ekologia Lotnictwo
Na
PromujNewsLetterPartnerzyCzaty/GościePorównania-TestyTłumaczeniaTopXmlHtml4cmsBlogMapaSymantec
skróty
AntySpywareE-mail programySzukaj w SieciProgramowanieBadania InternetoweCSSJava DownloadKatalog DniaekoEnergia
Reklama i pozycjonowanieCMSy i dla webmasterówPodręcznik PHPAccessibility standardCentrum RSSFirewall'eMetaSearchCzasSport
MotoryzacjaWirusy Top RankingStandaryzacjaTweak-Windows-VistaSprzętAntywirusyHacking i BezpieczeństwoBanki/FinanseMedia

Partnerzy:
allegro symantec netsprint
stat mks_vir2k7  
  |   Blogi   |   Konkursy   |   Sondy   |   Blogsfera   |   Avatary Emotikony Ikony   |   Filmy   |  
 

Roboty wyszukiwarek Email
18.11.2006.

 Czym są roboty?


By wyszukiwarka mogła odszukać waszą witrynę musi skorzystać z programów które pomagaja jej ją odszukać, przczytają zawarte na niej treści, i zapisanie tych informacji w swoich bazach indeksujących.

Powszechnie systemy indeksujące nazywamy robotami, robotami wyszukującymi.

Czy można kontrolować roboty wyszukujące?


Pamiętając o kilku prawach i zasadach działania robotów - twórcy stron witryn mogą pomóc robotom, mogą im też przeszkodzić. Roboty nie indeksują nie polinkowanych zasobów, co wprost oznacza, że przeważająca większość plików zapisanych po prostu na serwerze, nie jest odczytywana. Daje to, jak możemy się spodziewać kontrolę - które katalogi powinny być odwiedzane i które pliki zauważane. Bezpośrednim centrum zarządzania, plikiem odpowiedzialnym za czytanie strony jest:

robots.txt


- znajdujący się zwykle w głównym katalogu serwisu. Oczywiście by nie tworzyć iluzji sielanki, od razu warto napisać, że choć przedstawione dalej treści są proste, całość pracy związana z pozycjonowaniem i zwiększeniem szansy na jednoznaczne "przeszukanie" nie jest tak prosta. I nie zamyka się tylko na wspierających wpisach Meta Tagów, do czego wrócę.

Linki łatwe czy trudne?


Roboty indeksujące wyszukują pliki podążając za linkami, wgłębiając się coraz dalej w strukturę witryny.

Jednak warto pamiętać, że automaty ominą strony odłączone z punktu startowego; mają też kłopoty z linkami napisanymi np. w JavaScript. Robot widzi stronę www podobnie jak przeglądarka, i podobnie jak ona z dynamiczną zawartością, podobnie jak ona - napotyka na dynamiczne elementy waszej witryny - których nie potrafi przeczytać, (a przeglądarka wyświetlić).


Większość lokalnych skryptów indeksujących poradzi sobie z długimi linkami, jednak światowe wyszukiwarki często pomijają trudne, długie frazy. W końcu i tak maja masę pracy przemierzając niepoliczalne zasoby...
---

Mało kto zdaje sobie sprawę z faktu, że podobnie jak "zwykłe" wyszukiwanie... Roboty obciążają nasz serwis www i serwer. Przecież używają protokołu HTTP zdaża się, że robot wpada w pętlę. Na czym to polega? Próbuje odczytać konkretną informację z serwera powtarzając wkoło te same zapytania!

Skąd roboty wiedzą co i gdzie się zmieniło?


Komendy Get / If-Modified-Since

Najzwyczajniej wysyłają zapytanie do waszej strony na serwer używając dwu zapytań HEAD (GET z przeglądarki), serwer odpowiada odsyłając nagłówek strony
- z wewnętrznego cache`u, bez otwierania i czytania całego pliku - wówczas indexer porównuje daty zapisaną z czytaną.


a/ Jeśli strona nie została zmieniona, robot nie zmienia indeksu.

b/ Jeżeli nie zna strony lub daty się różnią "maszyna" wysyła GET pobierając nową lub odświerzoną treść.

- innym zapytaniem jest "If-Modified-Since". To pobranie nagłówka HTTP/1.1 ułatwiające pracę

- bo jeżeli strona zmieniona wysyła informację do "maszyny", jezeli nie - analogicznie informację, że "nic istotnego się nie stało".

Próżne duplikaty

A o tym zagadnieniu, w następnej części materiału ;-)
---

Redakcja (m) cdn...

 
« poprzedni artykuł   następny artykuł »

Konkursy

Chłopczyk z ogonem chłopczyk z ogonem

... czy może Bóg ?
Tańczący niedźwiedź miś

bansuj misiu, bansuj
Crowntown http://sjc-static12.sjc.youtube.com/vi/wvQZSCeCCr8/2.jpg
Piłeś - nie jedź piłeś nie jedź

... Zobacz jakie mogą być skutki prowadzenia pod wpływem alkoholu.
Rekordowe domino rekordowe domino

... ile trzeba coś takiego układać :P ?
Domino z monet domino z monet

Domino o wartości - 10 000 £
Mały kotek Mały kotek

... mm słodziutki
Sex tutorial sex tutorial

film instruktażowy jak używać prezerwatywy


Triki footbalowe street footbal

a Ty tak potrafisz ?
breakdance by małolat dzicko tanczy braekdance

Dzieciak będzie kiedyś niezły
Niezłe lanie bójka

Zastanowi się zanim następnym razem będzie wymachiwał rękoma
Chomik sprinter chomik sprinter

To dopiero szybkość
Szczyt elastyczności człowiek guma
Bardzo elastyczne ciało

Reklama z Paris Paris Hilton

Inne właściwości mleka.


Co robi twój mąż ? Wpadka ?

... czy na pewno wiesz ?

 


POLECAMY:

Pobierz przeglądarkę: Aktualną wersję Java Inne przydatne programy:

opera
 
GetJava Download Button

PRZYJACIELE:

Bo nie jesteśmy sami w internecie...


Wspieramy i korzystamy
  |   redakcja   |   partnerzy   |   polityka prywatności   |   zasady korzystania   |   reklama   |   pomoc   |  
© Dzień e-mail - Internauty 2005-08.