Opas tekniseen hakukoneoptimointiin
Tämä opas käsittelee teknistä hakukoneoptimointia. Oppaasta löydät lyhyen esittelyn siitä, mitä tekninen SEO on ja miksi se on tärkeää. Käymme läpi teknisen SEO:n osa-alueet sekä teknisen SEO-auditoinnin prosessin, josta näet mitä elementtejä siihen on hyvä sisällyttää.
Miksi tekninen SEO on tärkeää?
Tekninen SEO eli tekninen hakukoneoptimointi (Search Engine Optimization) on perusta verkkosivustosi orgaaniselle näkyvyydelle. Sivustollasi voi olla maailman paras sisältö, vahvimmat linkit ja loistava käyttökokemus, mutta jos Google ei pysty indeksoimaan verkkosivustoasi, millään näistä ei ole väliä. Tekninen SEO ei siis sinänsä paranna sijoitustasi, mutta se on edellytys sille, että sivustosi voi ylipäätään sijoittua.
Suosittelemme aina varmistamaan, että sinulla on tekninen perusta kunnossa, ennen kuin käytät paljon resursseja muihin SEO-toimenpiteisiin. Kun verkkosivustosi tekninen SEO on auditoitu ja tarvittavia osa-alueita parannettu, on perusta näkyvyydelle kunnossa ja voit aloittaa muiden osa-alueiden optimoinnin.
Mitä tekninen SEO sisältää?
Pohjimmiltaan tekninen SEO tarkoittaa toimenpiteitä, joiden avulla varmistetaan, että Google pääsee käsiksi verkkosivustosi sisältöön ja voi indeksoida sen. Lisäksi on olemassa muunlaista luonteeltaan teknistä optimointia, kuten nopeuden optimointi, Core Web Vitalsin suorituskyvyn parantaminen, schema-merkintöjen käyttöönotto ja hyvän navigointirakenteen varmistaminen. Vaikka nämä ovat myös toteutukseltaan teknisiä, niillä on enemmän tarkoitus parantaa käyttäjien kokemusta kuin varmistaa, että he löytävät sen. Siksi tämä artikkeli keskittyy teknisen SEO:n peruselementteihin: indeksoitavuuteen, renderöintiin ja itse indeksointiin.
1. Indeksoitavuus
Indeksoitavuus tarkoittaa sen varmistamista, että Googlen indeksointirobotilla on oikeus indeksoida eli tallentaa muistiin kaikki sisältö, jonka haluat käyttäjien löytävän verkkosivustoltasi. Indeksointi on edellytys sille, että Google voi löytää ja esittää sivustosi sisällön kohdeyleisölle.
Indeksoinnin suorittaa Googlen indeksointirobotti nimeltä GoogleBot, joka vierailee verkkosivustollasi. Kun GoogleBot saapuu verkkosivustollesi, se alkaa seurata kaikkia löytämiään alasivujen linkkejä. Löydetyiltä alasivuilta se löytää taas uusia linkkejä, joita se voi indeksoida. Tämä prosessi toistuu, kunnes GoogleBot uskoo löytäneensä kaikki verkkosivustosi alasivut.
GoogleBot vierailee verkkosivustollasi ajoittain nähdäkseen, onko uusia sivuja ilmestynyt. Se, kuinka usein GoogleBot käy, riippuu useista tekijöistä, kuten kuinka tiheään verkkosivustoasi päivitetään uudella sisällöllä, kuinka suosittu sivustosi on, kuinka usein siihen linkitetään muista paikoista verkossa ja kuinka tehokkaasti Google pääsee indeksoimaan sivustosi.
Hyvän indeksoitavuuden saavuttaminen
Kuinka varmistat verkkosivustosi optimaalisen indeksoitavuuden? Monet elementit vaikuttavat verkkosivuston indeksointiin, mutta tärkeimpiä ovat seuraavat:
- Vältä orposivuja, kuolleita sisäisiä linkkejä ja uudelleenohjausvirheitä
- Varmista, että robots.txt- ja metarobots-tunnisteet on määritetty oikein
- Hyödynnä XML-sivustokarttoja
Orposivut
Orposivut ovat verkkosivustosi sivuja, joihin ei ole linkitetty muilta sivuilta. Jos Google indeksoi verkkosivustosi seuraamalla linkkejä sivulta toiselle, voit luultavasti arvata, miksi sivut, joille ei johda linkkejä ovat ongelma.
Jos sivulle ei ole yhtään sisäistä linkkiä muilta sivuston sivuilta, on olemassa vaara, että GoogleBot ei koskaan löydä sitä. Jotta orposivuja ei muodostuisi, tulee sivuston sisäinen linkkirakenne tarkistaa ja varmistaa että valikko sisältää kaikki verkkosivustosi tärkeimmät osiot ja että alasivut linkittävät toisiinsa. Voit myös käyttää SEO-työkaluja, kuten Screaming Frog, orposivujen tunnistamiseen. Screaming Frog crawlaa verkkosivustosi samalla tavalla kuin GoogleBot ja näyttää sitten luettelon kaikista orposivuistasi.
Kuolleet sisäiset linkit
Kuten orposivut, kuolleet sisäiset linkit tekevät indeksoinnin vaikeammaksi GoogleBotille. Kuollut sisäinen linkki syntyy, jos linkität alasivun A alasivulle B ja alasivu B poistetaan käytöstä tai vaihtaa URL-osoitetta. Jos Googlen indeksointirobotti tai käyttäjä seuraa kuollutta sisäistä linkkiä, hän kohtaa 404-virhesivun, mikä johtaa huonoon käyttökokemukseen.
Yksittäisiä kuolleita linkkejä esiintyy usein, jos poistat alasivuja manuaalisesti ja unohdat tehdä niistä uudelleenohjaukset lähimpään vastaavaan sisältöön. Suuremmat muutokset URL-rakenteessa tai siirtyminen https:ään voivat taas luoda suurenkin määrän kuolleita sisäisiä linkkejä. Siksi on tärkeää, että päivität sisäiset linkit ja teet aina uudelleenohjaukset, jos siirrät linkitettävän sivun tai poistat sen kokonaan.
Uudelleenohjausvirheet
Uudelleenohjausvirheet voivat myös aiheuttaa ongelmia GoogleBotille. Uudelleenohjauksen tulisi ihanteellisesti päättyä sivulle, jonka tilakoodi on 200, eli aktiiviselle ja toimivalle sivulle.
Tyypillisiä uudelleenohjausvirheitä voivat olla ns. uudelleenohjausketjut, joissa sivu A uudelleenohjaa sivulle B, joka puolestaan uudelleenohjaa sivulle C. Paras käytäntö näissä tapauksissa on varmistaa, että A ja B molemmat uudelleenohjaavat suoraan C:lle. Uudelleenohjaus 404-virhesivulle lähettää GoogleBotin umpikujaan, josta se ei löydä uutta indeksoitavaa sisältöä. Siksi tulee varmistaa, että uudelleenohjaukset osoittavat aina suoraan määränpäähänsä ja että kohde on toimiva sivu, jonka tilakoodi on 200.
Robots.txt-tiedoston oikea asennus
Robots.txt tarkoitus on auttaa sinua hallitsemaan, kuinka GoogleBot indeksoi verkkosivustosi. Robots.txt on yksinkertainen tekstitiedosto, jossa voit määrittää, mitkä verkkosivustosi osat haluat GoogleBotin indeksoivan. Voit myös estää GoogleBotia indeksoimasta sivuja, joiden et halua löytyvän Googlesta.
"Miksi olisin kiinnostunut estämään GoogleBotia indeksoimasta tiettyjä sivustoni osia?", saatat ajatella. Tämä liittyy indeksointibudjetin käsitteeseen. Google indeksoi miljoonia verkkosivustoja päivittäin ja resurssien riittävyyden takaamiseksi Google asettaakin rajoituksia sille, kuinka tarkkaan ja kuinka usein kukin yksittäinen verkkosivusto crawlataan. Google kutsuu tätä indeksointibudjetiksi.
Jotta indeksointibudjettia voitaisiin käyttää mahdollisimman tehokkaasti, voi olla järkevää kertoa GoogleBotille, mitkä sivut se voi jättää välistä. Tämä tehdään käyttämällä robots.txt-tiedostossa määritettyä Disallow-komentoa. Sivut, joita et halua crawlattavan ja indeksoitavan, voivat olla esimerkiksi kirjautumissivuja, CMS-sivuja, jäsensivuja tai vastaavia. Estämällä epäolennaisten sivujen crawlaamisen varmistat, että tärkeimpien sivujen indeksointibudjetti on riittävä.
Knowit.fi:ssa olemme esimerkiksi estäneet CMS-sivumme lisäämällä "Disallow: /episerver" robots.txt-tiedostoomme.
On kuitenkin oltava erittäin varovainen robots.txt-tiedostoa muokatessa ellei ole täysin varma siitä mitä on tekemässä. Jos kiellät vahingossa väärän osion verkkosivustostasi, Google lopettaa sen indeksoimisen ja sisältö tippuu pikku hiljaa indeksistä kokonaan.
On siis hyvä idea tarkistaa robots.txt-tiedosto ja varmistaa, että Googlella on pääsy tärkeiden sivujesi indeksointiin ja että sen pääsy merkityksettömille sivuille on estetty.
XML-sivustokartat
Sivustokartta on periaatteessa pitkä luettelo kaikista verkkosivustoltasi löytyvistä URL-osoitteista. GoogleBot voi käyttää tätä luetteloa löytääkseen kaikki asiaankuuluvat alasivut verkkosivustoltasi. Siksi sivustokartta on erittäin tärkeä työkalu optimaalisen indeksoinnin varmistamisessa.
Robots.txt-tiedostosta on hyvä linkittää sivustokarttaan. Tämä tehdään kirjoittamalla Sitemap: [linkki sivustokarttaan]. Jos teet tämän, GoogleBot löytää aina sivustokarttasi ja käyttää sitä indeksoinnin pohjana.
On myös tärkeää lisätä sivustokarttasi Google Search Consoleen (Googlen maksuton työkalu orgaanisen eli maksuttoman hakuliikenteen seurantaan), sillä tämä auttaa jälleen varmistamaan, että GoogleBot löytää sen. Search Consolen avulla voit myös seurata indeksoinnin tilaa ja saada ilmoituksia sivustokartan virheistä.
Avattuasi Google Search Console -tilin sivustollesi, sivustokartan voi lisätä Google Search Consoleen valitsemalla vasemmalla olevasta valikosta kohdan Sivustokartta. Lisää sitten sivustokarttasi URL-osoite kenttään ja paina lähetä.
Lopuksi on tärkeää varmistaa, että sivustokarttasi on ajan tasalla. Voit tehdä tämän sulkemalla pois sivut, joita et halua indeksoitavan. Nämä voivat olla sivuja, jotka olet estänyt robots.txt-tiedostossa, jotka on ohjattu uudelleen, 404-sivuja tai sivuja, jotka on asetettu noindex-tilaan. Tämä on hyväksi indeksointibudjettillesi, koska näin varmistat, että GoogleBot ei tuhlaa resursseja turhien sivujen indeksointiin.
2. Renderöinti
Kun on varmistettu, että GoogleBot pystyy indeksoimaan verkkosivustosi, tulee seuraavaksi varmistaa, että GoogleBot ymmärtää löytämiensä sivujen sisällön. Tässä tulee kuvaan renderöinnin käsite (hahmontaminen) eli prosessi, jossa hakukone muuntaa digitaalisen tiedon näytölle sopivaan esitysmuotoon.
Renderöintiprosessissa verkkosivustosi sisältämä koodi käännetään sisällöksi, kuviksi ja rakenteeksi, jonka me ihmiset voimme lukea ja ymmärtää. Toisin sanoen se, mitä näet vieraillessasi verkkosivustolla selaimessasi, on taustalla olevan koodin renderöity versio.
Jotta Google voi arvioida eri verkkosivustojen sisällön laatua ja asettaa sivut paremmuusjärjestykseen, on sen pystyttävä lukemaan sivuston sisältöä. Googlella on kuitenkin rajoituksia sen suhteen, millaista sisältöä hakukone pystyy lukemaan. Jos Google ei pysty renderöimään esimerkiksi sivustosi kategoriatunnisteita, et saa hyödynnettyä sisältöä parhaalla mahdollisella tavalla. Varmista, että verkkosivustosi on optimoitu parhaiden käytäntöjen mukaan.
Verkkosivusto koostuu pääasiassa kolmentyyppisistä elementeistä: html, css ja JavaScript. Html- ja css-tiedostot ovat Googlen kannalta ongelmattomia. JavaScriptin suhteen tilanne ei valitettavasti ole aivan niin yksinkertainen. Google voi hahmontaa JavaScriptin useimmissa tapauksissa, mutta joskus se aiheuttaa ongelmia.
Siksi meidän tulee ryhtyä joihinkin varotoimiin, jotta Google voi hahmontaa kaikki sivun hakukoneoptimoinnin kannalta tärkeät elementit. Tämä tehdään varmistamalla, että nämä elementit eivät ole riippuvaisia JavaScriptistä.
Googlen mobiiliystävällisyystestin tai Google Search Consolen tarkastustyökalun avulla saat hyvän käsityksen siitä, onko Google hahmontanut verkkosivustosi oikein. Näissä työkaluissa voit kirjoittaa URL-osoitteen ja nähdä renderöidyn koodin sellaisena kuin Google sen näkee. Tässä on esimerkki Google Mobile Friendly -testistä hahmonnetusta koodista sivusta knowit.fi:
Tarkastelemalla renderöityä koodia voit tarkistaa, voiko Google nähdä kaikki tärkeät elementit eli onko kaikki sivun teksti, linkit ja kuvat koodissa.
Jos huomaat, että verkkosivustosi sisällön keskeisiä osia ei hahmonneta, sinun tulee korjata se. Ratkaisutapoja on monia ja oikea tapa riippuu siitä, kuinka verkkosivustosi on tehty. Siksi sinun tulee keskustella kehittäjäsi kanssa siitä, kuinka voit varmistaa, että Google ymmärtää verkkosivustosi sisällön.
3. Itse indeksointi
Kun on tarkistettu, että Google pystyy indeksoimaan ja hahmontamaan verkkosivuston sisällön, on aika päättää indeksoinnista. Jotta Google voi löytää sivustosi sivut, niiden on oltava Googlen hakemistossa.
Mitkä sivut pitäisi indeksoida? Ja mitkä voi jättää pois?
Lähtökohtaisesti kaikkien sivujen, joilla haluamme sijoittua hakutuloksissa, olisi hyvä olla Googlen hakemistossa. Eli sivujen, jotka joko tarjoavat arvoa käyttäjälle tai palvelevat käytännön tarkoitusta, kuten tietosivut, blogikirjoitukset, tuotesivut, kategoriasivut, artikkelit ja vastaavat.
Mitä sivuja meidän tulisi estää joutumasta hakemistoon? Tällaisia sivuja ovat esim. kaikki ne sivut, joille emme halua käyttäjän päätyvän, kuten arkistosivut, salasanalla suojatut sivut tai resurssitiedostot.
Emme myöskään halua lisätä hakemistoon URL-osoitteita, jotka sisältävät lajitteluun, suodattimiin tai sisäisiin hakutuloksiin käytettäviä lisäparametreja. Syynä tähän on se, että Google haluaa hakemistoonsa vain yhden version samasta sivusta. Jos sinulla on sivu, jossa on esimerkiksi lamppuja, muistuttaa se paljon sivua, jossa lamput on lajiteltu lampun koon mukaan. Tätä kutsutaan duplikaattisisällöksi, ja se voi johtaa siihen, että sivun väärä parametrillinen versio näkyy Googlen hakutuloksissa.
Siksi suosittelemme, että vain sivun "puhdas" versio indeksoidaan, mutta parametreja sisältävät sivut jätetään pois.
Kuinka voit hallita indeksointia?
Kuinka voit hallita, mitkä sivut indeksoidaan ja mitkä eivät? Tähän on pääasiassa kolme tapaa:
- Noindex-direktiivi robots-sisällönkuvauskentässä
- Kanoniset tunnisteet (Canonical tags)
- 301-uudelleenohjaukset
Noindex-direktiiviä käytetään lisäämällä seuraava tagi sivulle, jota et halua indeksoitavan:
Kun GoogleBot kohtaa tämän tunnisteen koodissa, se ohittaa sivun. Kehittäjäsi voi todennäköisesti auttaa sinua määrittämään yleissäännön, joka varmistaa, että kaikkiin URL-osoitteisiin, joissa on tietty parametri, on lisätty noindex-tagi. Tämä tarkoittaa, että sitä ei tarvitse lisätä manuaalisesti kaikille sivuille, joilla on lajitteluparametreja, sisäisiä hakutuloksia tai vastaavia.
Kanoniset eli ensisijaiset tagit ovat toinen tapa kertoa Googlelle, että et halua tiettyä sivua hakemistoon. Kanoninen tunniste näyttää tältä – tässä on kanonisoitu toimistotason yhteystietosivu yhteystietojen pääsivuun eli haluamme Googlen indeksoivan vain pääyhteydenottosivun.
Ero noindex-tunnisteeseen, joka yksinkertaisesti kehottaa Googlea olemaan indeksoimatta sivua, on se, että Canonical-tunnisteen avulla ohjaat GoogleBotin toiselle sivulle, jonka haluat sen sijaan indeksoida. Joten jos sivulla B on ensisijainen tunniste, joka osoittaa sivulle A, Google ei vain tiedä, että B:tä ei pitäisi indeksoida, vaan myös sen, että sivu A on suositeltava sivu.
Lopuksi on 301-uudelleenohjaukset. Uudelleenohjaus ohjaa käyttäjän tai GoogleBotin sivulta toiselle. Uudelleenohjaus kertoo Googlelle myös, että sivua, jolta uudelleenohjataan, ei tule indeksoida ja että Googlen pitäisi sen sijaan keskittyä sivuun, jolle uudelleenohjataan. Uudelleenohjauksissa on myös se etu, että linkkien arvo ja sijoitukset siirtyvät, mikä on hyödyllistä, jos esimerkiksi poistat vanhoja sivuja verkkosivustoltasi.
Milloin sinun tulee käyttää noindexiä, canonicalia ja uudelleenohjausta? Canonicalia tulee käyttää, kun sinulla on kaksi tai useampi sivu, jotka ovat samankaltaisia ja haluat vain yhden niistä sijoittuvan. Se voi olla esimerkiksi sivu, jolla on mahdollista lajitella useiden elementtien mukaan. Tässä tapauksessa haluat yleensä "puhtaan" sivun indeksoituvan ja lajitteluparametrien takia muodostuvien lisäsivujen kanoniset tunnisteet tulee määrittää osoittamaan sivun puhtaaseen versioon. Näin kerrot Googlelle, että tämä puhdas URL on se sivu, jonka pitäisi sijoittua.
Noindexin käyttö on selvä valinta silloin kun kyseessä on sivu, jonka täytyy olla olemassa, mutta et halua kenenkään päätyvän sinne hakukoneista esim. joku kirjautumisen takana oleva sisäiseen käyttöön tarkoitettu sivu. Jos olet kuitenkin luopumassa jostain sivusta kokonaan, niin älä silloin käytä Noindexiä, vaan uudelleenohjaa sivu, jolloin sivu katoaa indeksistä, mutta arvo siirtyy uudelle sivulle.
Näin luot hyvän prosessin teknisen SEO:n kanssa työskentelemiseen
Nyt kun ymmärrämme teknisen hakukoneoptimoinnin perusteet, voimme alkaa suunnittelemaan prosessia tiedon hyödyntämiseen.
Tee nykytilanteen arvio teknisellä SEO-analyysillä
Mikä tahansa teknisen hakukoneoptimoinnin prosessi alkaa verkkosivuston nykytila-analyysillä. Tämä tehdään tyypillisesti teknisellä SEO-analyysillä, jossa käydään sivusto kokonaisuudessaan läpi ja tarkistetaan, täyttääkö se kaikki verkkosivustolle asetetut tekniset vaatimukset.
Tällaisen analyysin lopputuotoksena on priorisoitu luettelo korjattavista ongelmakohdista. Luettelon priorisointi vaihtelee usein hieman riippuen siitä, keneltä SEO-asiantuntijalta kysyt ja kuinka paljon resursseja sinulla on käytettävissä, mutta tässä tarkastelemiemme peruselementtien tulee aina olla priorisoituna korkealle, koska ne luovat pohjan sille, että sivustosi voi yleensä sijoittua hakutuloksissa.
Toteuta muutokset tarkasti
Auditoinnin avulla luotu lista ongelmista annetaan usein kehittäjälle, jotta tämä tekisi vaadittavat tekniset muutokseen sivustoon. Toteutusprosessissa tulee kuitenkin aina olla SEO-asiantuntija mukana, sillä toteutuksen yhteydessä herää usein kysymyksiä ja lisäongelmia. Saattaa esimerkiksi olla, että ehdotettua parannusta ei voida toteuttaa verkkosivustollasi syystä tai toisesta. Tällöin on hyvä, että SEO-asiantuntijan kanssa voi keskustella mahdollisesta muusta ratkaisusta. Kun muutokset on toteutettu, on ne hyvä vielä yhdessä tarkistaa, jotta varmistutaan että kaikki osapuolet ovat ymmärtäneet asiat samalla tavalla.
SEO on jatkuva prosessi
SEO on jatkuva prosessi eikä kertaluonteinen projekti. Verkkosivustojen tekniset vaatimukset sekä Googlen algoritmit muuttuvat ja kehittyvät koko ajan, joten on tärkeää pysyä ajan tasalla uusista ominaisuuksista ja Googlen päivityksistä. Muuten jäät jälkeen kilpailijoista. Jatkuvassa tekemisessä on myös hyvä olla SEO-asiantuntija mukana, jotta tämä osaa opastaa sinua uusien ominaisuuksien arvon suhteen ja arvioida, ovatko ne merkityksellisiä erityisesti sinun verkkosivustollesi.
Toivottavasti näistä vinkeistä on sinulle hyötyä! Jos tarvitset apua esimerkiksi hakukoneoptimoinnissa, niin ota yhteyttä janne.miettinen@knowit.fi ja sovitaan tapaaminen.
Voit myös käydä tutustumassa hakukonemarkkinoinnin palveluihimme. Nostetaan yhdessä palvelusi hakukonenäkyvyys uudelle tasolle!