Šta je indeksiranje web stranice? Kako se to dešava? Odgovore na ova i druga pitanja možete pronaći u članku. Web indeksiranje (indeksiranje u pretraživačima) je proces dodavanja informacija o web stranici u bazu podataka od strane robota tražilice, koji se naknadno koristi za traženje informacija o web projektima koji su prošli takvu proceduru.
Podaci o web resursima najčešće se sastoje od ključnih riječi, članaka, linkova, dokumenata. Audio, slike i tako dalje se također mogu indeksirati. Poznato je da algoritam detekcije ključnih riječi zavisi od pretraživača.
Postoje određena ograničenja za tipove indeksiranih informacija (flash fajlovi, javascript).
Upravljanje inicijacijom
Indeksiranje stranice je složen proces. Da biste njime upravljali (na primjer, da biste zabranili prilaganje određene stranice), morate koristiti datoteku robots.txt i uputstva kao što su Dozvoli, Disallow, Crawl-dey, User-agent i druge.
Takođe, oznake i rekviziti se koriste za indeksiranje, skrivajući sadržaj resursa od Google i Yandex robota (Yahoo koristi oznaku).
U Goglle pretraživaču, nove stranice se indeksiraju od nekoliko dana do jedne sedmice, a u Yandexu - od jedne do četiri sedmice.
Želite li da se vaša stranica pojavljuje u upitima za rezultate pretraživača? Zatim ga moraju obraditi Rambler, Yandex, Google, Yahoo i tako dalje. Morate obavijestiti pretraživače (paukove, sisteme) o postojanju vaše web stranice, a zatim će je indeksirati u cijelosti ili djelomično.
Mnoge web stranice nisu indeksirane godinama. Podatke koji se nalaze na njima niko ne vidi osim njihovih vlasnika.
Metodi obrade
Indeksiranje stranice se može obaviti na nekoliko načina:
- Prva opcija je ručno dodavanje. Potrebno je da unesete podatke svoje web stranice putem posebnih formulara koje nude pretraživači.
- U drugom slučaju, robot pretraživač sam pronalazi vašu web stranicu putem linkova i indeksira je. On može pronaći vašu web stranicu putem veza sa drugih izvora koji vode do vašeg projekta. Ova metoda je najefikasnija. Ako pretraživač pronađe stranicu na ovaj način, smatra je značajnim.
Tajming
Indeksiranje stranice nije prebrzo. Termini se razlikuju, od 1-2 sedmice. Linkovi sa autoritativnih resursa (sa odličnim PR-om i Titzom) značajno ubrzavaju plasman stranice u bazu podataka pretraživača. Danas se Gugl smatra najsporijim, iako je do 2012. godine ovaj posao mogao da obavi za nedelju dana. ToNažalost, stvari se vrlo brzo mijenjaju. Poznato je da Mail.ru radi sa web stranicama u ovoj oblasti oko šest mjeseci.
Indeksiranje stranice u pretraživačima nije moguće za svakog stručnjaka. Na vrijeme dodavanja novih stranica u bazu podataka web stranice koju su već obradile tražilice utječe učestalost ažuriranja njenog sadržaja. Ako se na nekom resursu stalno pojavljuju svježe informacije, sistem ih smatra često ažuriranim i korisnim ljudima. U ovom slučaju, njen rad je ubrzan.
Možete pratiti napredak indeksiranja web stranice u posebnim odjeljcima za webmastere ili na pretraživačima.
Promjene
Dakle, već smo shvatili kako se sajt indeksira. Treba napomenuti da se baze podataka pretraživača često ažuriraju. Stoga se broj stranica vašeg projekta koji im se dodaje može promijeniti (i smanjiti i povećati) iz sljedećih razloga:
- sankcije pretraživača prema web stranici;
- prisustvo grešaka na sajtu;
- promjena algoritama tražilice;
- odvratan hosting (nedostupnost servera na kojem se nalazi projekat) i tako dalje.
Yandex odgovori na uobičajena pitanja
"Yandex" je pretraživač koji koriste mnogi korisnici. Nalazi se na petom mjestu među svjetskim sistemima za pretraživanje po broju obrađenih zahtjeva za istraživanjem. Ako ste mu dodali web lokaciju, može potrajati predugo za dodavanje u bazu podataka.
Dodavanje URL-a ne garantuje njegovo indeksiranje. Ovo je samo jedan od načina na koji se sistemskom robotu govorio novom resursu. Ako postoji malo ili nimalo linkova na web stranicu s drugih web stranica, dodavanjem će vam pomoći da je brže pronađete.
Ako nije došlo do indeksiranja, potrebno je provjeriti da li je bilo grešaka na serveru u vrijeme kreiranja aplikacije za njega od Yandex robota. Ako server prijavi grešku, robot će prekinuti svoj rad i pokušati ga dovršiti kružnim putem. Zaposlenici Yandexa ne mogu povećati brzinu dodavanja stranica u bazu podataka tražilice.
Indeksiranje stranice u Yandexu je prilično težak zadatak. Ne znate kako dodati resurs u tražilicu? Ako postoje veze do njega s drugih web stranica, onda ne morate dodavati posebnu stranicu - robot će je automatski pronaći i indeksirati. Ako nemate takve veze, možete koristiti obrazac "Dodaj URL" da kažete tražilici da stranica postoji.
Imajte na umu da dodavanje URL-a ne garantuje da će vaša kreacija biti indeksirana (ili indeksirana).
Mnogi ljudi se pitaju koliko dugo je potrebno da se indeksira web lokacija u Yandexu. Zaposleni u ovoj kompaniji ne daju garancije i ne predviđaju uslove. U pravilu, otkako je robot saznao za stranicu, njegove stranice u pretrazi se pojavljuju za dva dana, ponekad i za nekoliko sedmica.
Proces
"Yandex" je pretraživač koji zahtijeva tačnost i pažnju. Indeksiranje stranice sastoji se od tri dijela:
- Robot za pretraživanje pretražuje stranice resursa.
- Sadržaj(sadržaj) sajta je evidentiran u bazi podataka (indeks) sistema za pretragu.
- Za 2-4 sedmice, nakon ažuriranja baze podataka, možete vidjeti rezultate. Vaša stranica će se (ili neće) pojaviti u rezultatima pretraživanja.
Provjera indeksiranja
Kako provjeriti indeksiranje web stranice? Postoje tri načina da to uradite:
- Unesite naziv vašeg preduzeća u traku za pretragu (na primjer, "Yandex") i provjerite svaki link na prvoj i drugoj stranici. Ako tamo pronađete URL svoje zamisli, robot je završio svoj zadatak.
- Možete unijeti URL vaše web stranice u traku za pretraživanje. Moći ćete vidjeti koliko je internet listova prikazano, tj. indeksiranih.
- Registrirajte se na stranicama webmastera u Mail.ru, Google, Yandex. Nakon što prođete verifikaciju stranice, moći ćete vidjeti rezultate indeksiranja i druge usluge pretraživača kreirane da poboljšaju performanse vašeg resursa.
Zašto Yandex ne uspijeva?
Indeksiranje stranice u Google-u se vrši na sljedeći način: robot unosi u bazu podataka sve stranice stranice, nekvalitetne i kvalitetne, bez odabira. Ali samo korisni dokumenti su uključeni u rangiranje. I "Yandex" odmah isključuje svo web smeće. Može indeksirati bilo koju stranicu, ali pretraživač će na kraju eliminisati svo smeće.
Oba sistema imaju inkrementalni indeks. Obje stranice lošeg kvaliteta utiču na rangiranje web stranice u cjelini. Ovdje je na djelu jednostavna filozofija. Omiljeni resursi određene osobekorisnik će zauzimati više pozicije u svom izdanju. Ali ovaj isti pojedinac će imati teškoća da pronađe stranicu koja mu se prošli put nije svidjela.
Zato je prvo potrebno pokriti kopije web dokumenata od indeksiranja, provjeriti ima li praznih stranica i spriječiti indeksiranje sadržaja lošeg kvaliteta.
Ubrzajte Yandex
Kako mogu ubrzati indeksiranje stranice u Yandexu? Slijedite ove korake:
- Instalirajte Yandex pretraživač na svoj računar i koristite ga za pregledavanje stranica stranice.
- Potvrdite prava za upravljanje resursom u Yandex. Webmasteru.
- Objavite link do članka na Twitteru. Poznato je da Yandex sarađuje sa ovom kompanijom od 2012.
- Dodajte pretragu sa Yandex-a za web lokaciju. U odjeljku "Indeksiranje" možete unijeti svoje URL-ove.
- Unesite "Yandex. Metrica" kod bez označavanja "Slanje stranica za indeksiranje je zabranjeno".
- Napravite Sitemap koji postoji samo za robota i nije vidljiv publici. Provjera će početi s njim. Adresa Sitemapa se unosi u robots.txt ili u odgovarajući obrazac u "Webmaster" - "Indexing Settings" - "Sitemap Files".
Međuradnje
Šta treba učiniti dok Yandex ne indeksira web stranicu? Domaća tražilica bi trebala smatrati stranicu primarnim izvorom. Zato je i prije objavljivanja članka imperativ dodati njegov sadržaj u formu "Konkretnih tekstova". Inačeplagijatori će kopirati zapis na svoj resurs i bit će prvi u bazi podataka. Kao rezultat toga, oni će biti priznati kao autori.
Google Database
Za Google su prikladne iste preporuke koje smo opisali, samo će usluge biti drugačije:
- Google+ (zamjenjuje Twitter);
- Google Chrome;
- Google Alati za programere - "Skeniraj" - "Izgleda kao Googlebot" - opcija "Skeniraj" - opcija "Indeks";
- pretraži unutar resursa od Googlea;
- Google Analytics (umjesto Yandex. Metrics).
Zabrana
Šta je zabrana indeksiranja stranice? Možete ga prekriti i na cijelu stranicu i na njen poseban dio (link ili dio teksta). U stvari, postoji i globalna i lokalna zabrana indeksiranja. Kako se implementira?
Razmotrimo zabranu dodavanja web stranice u bazu podataka tražilice u Robots.txt. Koristeći robots.txt datoteku, možete isključiti indeksiranje jedne stranice ili cijelog naslova resursa na sljedeći način:
- Korisnički agent:
- Disallow: /kolobok.html
- Disallow: /foto/
Prva tačka kaže da su instrukcije definisane za sve PS-ove, druga ukazuje da je zabranjeno indeksiranje kolobok.html fajla, a treća ne dozvoljava dodavanje kompletnog punjenja foto foldera u baza podataka. Ako trebate isključiti više stranica ili foldera, navedite ih sve u Robots.
Kako biste spriječili indeksiranje određenog internetskog lista, možete koristiti robots meta tag. Razlikuje se od robots.txtčinjenica da daje instrukcije svim PS odjednom. Ova meta oznaka prati opšte principe html formata. Treba ga postaviti u naslov stranice između oznaka. Unos za zabranu, na primjer, može biti napisan ovako:.
Ajax
Kako Yandex indeksira Ajax stranice? Danas, Ajax tehnologiju koriste mnogi programeri web stranica. Naravno, ona ima veliki potencijal. Pomoću njega možete kreirati brze i produktivne interaktivne web stranice.
Međutim, robot pretraživača "vidi" web listu drugačije od korisnika i pretraživača. Na primjer, osoba gleda u udoban interfejs sa pokretnim internetskim listovima. Za indeksiranje, sadržaj iste stranice može biti prazan ili predstavljen kao ostatak statičkog HTML sadržaja, za koji skripte ne rade.
Možete koristiti URL saza kreiranje Ajax sajtova, ali ga pretraživač ne koristi. Obično je dio URL-a nakonje odvojen. Ovo se mora uzeti u obzir. Stoga, umjesto URL-a kao što je https://site.ru/example, on šalje aplikaciju na glavnu stranicu resursa koji se nalazi na https://site.ru. To znači da sadržaj Internet lista možda neće ući u bazu podataka. Kao rezultat toga, neće se pojaviti u rezultatima pretraživanja.
Da bi poboljšao indeksiranje Ajax stranica, Yandex je podržao promjene u robotu za pretraživanje i pravilima za obradu URL-ova takvih web stranica. Danas webmasteri mogu ukazati Yandex pretraživaču na potrebu za indeksiranjem kreiranjem odgovarajuće šeme u strukturi resursa. Za ovo vam je potrebno:
- Zamijenite simbolu URL-u stranicana !. Sada će robot shvatiti da se može prijaviti za HTML verziju sadržaja ovog internetskog lista.
- HTML verziju sadržaja takve stranice treba postaviti na URL gdje ! zamijenjeno sa ?_escaped_fragment_=.