Google: Seite nicht in Index aufnehmen

Anna Gienger

Anna Gienger

SEO Strategin | netzstrategen

Was bedeutet „indexieren“?

Google versucht, alle Inhalte, die es im Netz gibt, zu finden, zu analysieren und somit über die Google-Suche auffindbar zu machen. Diesen Vorgang nennt man Indexierung. Wer also möchte, dass seine Inhalte über Google auffindbar sind, muss dafür sorgen, dass diese von Google in einem ersten Schritt indexiert werden. Standardmäßig werden alle mit einem CMS (zum Beispiel WordPress oder Drupal) erstellten Seiten so veröffentlicht, dass Google erlaubt wird, diese Seiten zu indexieren. Im HTML head-Bereich des Quellcodes ist dann häufig dieser Meta-Tag zu finden: <meta name="robots" content="index,follow"/> Diese Auszeichnung für Suchmaschinen bedeutet übersetzt: „Nimm diese Seite in den Index auf und folge allen Links, die du findest.“ Jede Unterseite kann individuell für den Index freigegeben werden oder eben nicht. Auch wenn diese Angabe fehlt indexiert Google die Seite – „index,follow“ ist der Standard.

Welche Seiten sollen nicht indexiert werden?

Generell sollte euer Ziel aber sein, nur die Inhalte bei Google auffindbar zu machen, die euren potentiellen Lesern und Kunden auch wirklich einen Mehrwert bieten. Das heißt auch, dass nur Seiten im Index landen sollten, die über eine ausreichende Qualität verfügen. Unterseiten, die das nicht erfüllen, sollten zum einen nicht im Google-Index landen, zum anderen aber auch gar nicht Bestandteil eurer Seite sein – das ist aber ein anderes Thema 😉 Lesetipp: Geniale Inhalte erstellen Klassische Beispiele für Seiten, die von der Indizierung ausgeschlossen werden sollen:
  • Danke-Seiten (beispielsweise nachdem ein Formular abgesendet wurde)
  • Filter-Seiten in Shops mit unterschiedlicher Sortierung für gleiche Inhalte
  • Datenschutzerklärung
Achtung, das mit den Shops ist ein sehr komplexes Thema und sollte entsprechend sensibel angegangen werden!

Wie kann ich eine Indexierung verhindern?

Wie eingangs erwähnt, gibt es viele Mythen und falsche Infos im Netz, wie ihr bestimmte Inhalte aus dem Index fern haltet. Im Folgenden erfahrt ihr, was mit welchen Meta Tags, Attributen und Dateien möglich ist, beziehungsweise wofür sie eingesetzt werden. [bctt tweet=“noindex, nofollow, robots.txt, sitemap.xml, canonical – hä?“] Damit eine Unterseite nicht im Index von Suchmaschinen auftaucht, habt ihr nur zwei Möglichkeiten:
  • robots noindex Mit dieser Anweisung, die im head-Bereich der Website stehen muss, wird den Suchmaschinen-Bots gesagt, dass diese Unterseite nicht im Index landen soll. Dabei ist es egal, ob diese Seite von intern oder extern verlinkt wird – die Seite landet nicht im Index. Das entsprechende Code-Snippet sieht so aus: <meta name="robots" content="noindex"/>
  • canonical Der Canonical muss ebenfalls im head der Seite untergebracht werden. Allerdings ist diese Angabe nicht zum klassischen Deindexieren konzipiert. Gibt es denselben oder einen sehr ähnlichen Inhalt auf einer anderen Seite, kann mit dieser Angabe definiert werden, welches das Original ist, sodass nur dieses im Index auftaucht. Inkorrekt eingesetzt kann hier aber auch der falsche Inhalt deindexiert werden, seid also vorsichtig beim Einsatz. So sieht das Code-Snippet aus:
    <link rel="canonical" href="http://www.deine-domain.de/limk-zum/originalinhalt" />
Indexieren verboten Hinweis
Indexierung verboten: Klappt nur mit noindex oder canonical
Die folgenden Möglichkeiten verhindern nicht, dass ein Inhalt bei Google im Index landet:
  • Die Seite nur mit rel=“nofollow“ verlinken Egal ob via robots-nofollow-Anweisung im HTML-Head oder via rel=“nofollow“ bei allen intern eingehenden Links, die Seite wird trotzdem im Index landen. Der Grund dafür ist einfach: nofollow sagt lediglich „folge diesem Link nicht“ beziehungsweise im Falle von robots nofollow „folge keinem der von dieser URL ausgehenden Links“. Sobald eine URL von extern verlinkt wird (also einen Backlink hat) oder über die Sitemap bei Google eingereicht wird, wird die URL entsprechend auch im Index landen.
  • Die Seite mithilfe der robots.txt auf disallow setzen Mit dieser Anweisung in der robots.txt sagst du „crawle diese URL nicht“. Das geht solange gut, bis Google auf anderem Wege (siehe vorherigen Punkt) über diese so vermeintlich gesperrte Seite stolpert. Hast du eine via robots.txt gesperrte Seite mit noindex ausgezeichnet, wird Google diese noindex-Anweisung auch gar nicht finden. Siehe dazu auch diese Case Study: Wie ich das DM Warenkorb Snippet übernommen habe.
  • Die Seite aus der sitemap.xml ausschließen Einfach gesagt hilft dir die XML-Sitemap dabei, alle zu indexierenden Seiten an Google zu übermittel: „Hey Google, das sind alle meine Seiten, nimm die bitte in den Index auf.“ Wenn eine Seite nicht in der Sitemap gelistet wird, heißt das aber nicht, dass die Seite nicht in den Index aufgenommen werden soll oder darf.
Update 08.05.2018:

Folien zum „Indexierung bei Google steuern“-Vortrag

Beim A Lamm für Cobra 11 #nmfka habe ich die wesentlichen Fakten aus diesem Artikel vorgestellt. Hier findest du die Folien: Jetzt weißt du, wie du die Google Indizierung steuern kannst. Hast du noch Fragen zu dem Thema? Lass mir doch einfach einen Kommentar da! Dieser Artikel wurde ursprünglich von SEO-Stratege Dominik Horn verfasst.
Anna Gienger

Anna Gienger

SEO Strategin | netzstrategen

Was bedeutet „indexieren“?

Google versucht, alle Inhalte, die es im Netz gibt, zu finden, zu analysieren und somit über die Google-Suche auffindbar zu machen. Diesen Vorgang nennt man Indexierung. Wer also möchte, dass seine Inhalte über Google auffindbar sind, muss dafür sorgen, dass diese von Google in einem ersten Schritt indexiert werden. Standardmäßig werden alle mit einem CMS (zum Beispiel WordPress oder Drupal) erstellten Seiten so veröffentlicht, dass Google erlaubt wird, diese Seiten zu indexieren. Im HTML head-Bereich des Quellcodes ist dann häufig dieser Meta-Tag zu finden: <meta name="robots" content="index,follow"/> Diese Auszeichnung für Suchmaschinen bedeutet übersetzt: „Nimm diese Seite in den Index auf und folge allen Links, die du findest.“ Jede Unterseite kann individuell für den Index freigegeben werden oder eben nicht. Auch wenn diese Angabe fehlt indexiert Google die Seite – „index,follow“ ist der Standard.

Welche Seiten sollen nicht indexiert werden?

Generell sollte euer Ziel aber sein, nur die Inhalte bei Google auffindbar zu machen, die euren potentiellen Lesern und Kunden auch wirklich einen Mehrwert bieten. Das heißt auch, dass nur Seiten im Index landen sollten, die über eine ausreichende Qualität verfügen. Unterseiten, die das nicht erfüllen, sollten zum einen nicht im Google-Index landen, zum anderen aber auch gar nicht Bestandteil eurer Seite sein – das ist aber ein anderes Thema 😉 Lesetipp: Geniale Inhalte erstellen Klassische Beispiele für Seiten, die von der Indizierung ausgeschlossen werden sollen:
  • Danke-Seiten (beispielsweise nachdem ein Formular abgesendet wurde)
  • Filter-Seiten in Shops mit unterschiedlicher Sortierung für gleiche Inhalte
  • Datenschutzerklärung
Achtung, das mit den Shops ist ein sehr komplexes Thema und sollte entsprechend sensibel angegangen werden!

Wie kann ich eine Indexierung verhindern?

Wie eingangs erwähnt, gibt es viele Mythen und falsche Infos im Netz, wie ihr bestimmte Inhalte aus dem Index fern haltet. Im Folgenden erfahrt ihr, was mit welchen Meta Tags, Attributen und Dateien möglich ist, beziehungsweise wofür sie eingesetzt werden. [bctt tweet=“noindex, nofollow, robots.txt, sitemap.xml, canonical – hä?“] Damit eine Unterseite nicht im Index von Suchmaschinen auftaucht, habt ihr nur zwei Möglichkeiten:
  • robots noindex Mit dieser Anweisung, die im head-Bereich der Website stehen muss, wird den Suchmaschinen-Bots gesagt, dass diese Unterseite nicht im Index landen soll. Dabei ist es egal, ob diese Seite von intern oder extern verlinkt wird – die Seite landet nicht im Index. Das entsprechende Code-Snippet sieht so aus: <meta name="robots" content="noindex"/>
  • canonical Der Canonical muss ebenfalls im head der Seite untergebracht werden. Allerdings ist diese Angabe nicht zum klassischen Deindexieren konzipiert. Gibt es denselben oder einen sehr ähnlichen Inhalt auf einer anderen Seite, kann mit dieser Angabe definiert werden, welches das Original ist, sodass nur dieses im Index auftaucht. Inkorrekt eingesetzt kann hier aber auch der falsche Inhalt deindexiert werden, seid also vorsichtig beim Einsatz. So sieht das Code-Snippet aus:
    <link rel="canonical" href="http://www.deine-domain.de/limk-zum/originalinhalt" />
Indexieren verboten Hinweis
Indexierung verboten: Klappt nur mit noindex oder canonical
Die folgenden Möglichkeiten verhindern nicht, dass ein Inhalt bei Google im Index landet:
  • Die Seite nur mit rel=“nofollow“ verlinken Egal ob via robots-nofollow-Anweisung im HTML-Head oder via rel=“nofollow“ bei allen intern eingehenden Links, die Seite wird trotzdem im Index landen. Der Grund dafür ist einfach: nofollow sagt lediglich „folge diesem Link nicht“ beziehungsweise im Falle von robots nofollow „folge keinem der von dieser URL ausgehenden Links“. Sobald eine URL von extern verlinkt wird (also einen Backlink hat) oder über die Sitemap bei Google eingereicht wird, wird die URL entsprechend auch im Index landen.
  • Die Seite mithilfe der robots.txt auf disallow setzen Mit dieser Anweisung in der robots.txt sagst du „crawle diese URL nicht“. Das geht solange gut, bis Google auf anderem Wege (siehe vorherigen Punkt) über diese so vermeintlich gesperrte Seite stolpert. Hast du eine via robots.txt gesperrte Seite mit noindex ausgezeichnet, wird Google diese noindex-Anweisung auch gar nicht finden. Siehe dazu auch diese Case Study: Wie ich das DM Warenkorb Snippet übernommen habe.
  • Die Seite aus der sitemap.xml ausschließen Einfach gesagt hilft dir die XML-Sitemap dabei, alle zu indexierenden Seiten an Google zu übermittel: „Hey Google, das sind alle meine Seiten, nimm die bitte in den Index auf.“ Wenn eine Seite nicht in der Sitemap gelistet wird, heißt das aber nicht, dass die Seite nicht in den Index aufgenommen werden soll oder darf.
Update 08.05.2018:

Folien zum „Indexierung bei Google steuern“-Vortrag

Beim A Lamm für Cobra 11 #nmfka habe ich die wesentlichen Fakten aus diesem Artikel vorgestellt. Hier findest du die Folien: Jetzt weißt du, wie du die Google Indizierung steuern kannst. Hast du noch Fragen zu dem Thema? Lass mir doch einfach einen Kommentar da! Dieser Artikel wurde ursprünglich von SEO-Stratege Dominik Horn verfasst.

35 Responses

  1. Guten Morgen,

    ich habe unter http://www.regentonne.de eine Infoseite über WordPress erstellt und seit mehreren Wochen im Netz, es werden aber immer nur Inhalte der vorausgegangenen Version (ein Shop) bei google angezeigt… Search Console ist angelegt…
    Habe auch eure Beiträge gelesen aber keine Fehler gefunden…
    Was habe ich falsch gemacht ?

    Beste Grüße

    Markus

    1. Hi Markus,

      so wie ich das sehe, besteht die Domain aktuell aus nur zwei Seiten, der Startseite und dem Impressum. (Du solltest auch noch eine Datenschutzerklärung ergänzen)

      Die alten Inhalte im Google-Index werden nach und nach automatisch verschwinden, wenn Google diese erneut crawlt. Beschleunigen kannst du das, wenn du die noch im Index vorhandenen URLs in der Search Console durch das Formular „Abruf wie durch Google“ jagst und dann an den Index sendest.

    2. Ich habe gerade die deprimierende Erfahrung gemacht, dass trotz meines Codes, mein Impressum bei Google aufgeführt wurde.
      Es war dieser Code: (ich hoffe, der setzt sich jetzt nach Senden nicht um, wenn doch, müßtest zumindest Du ihn sehen, wenn Du auf Editieren gehst.)

      <meta charset="“ />
      <?php if( is_page('impressum') ) { echo '‘; } ?>

      Den Code habe ich fertig irgendwo aus dem Netz genommen. Vielleicht liegt es daran, dass da doch ehr nofollow stehen sollte? Aber andererseits…es steht ja noindex da, das müßte reichen.

      Bei Deinem Codeschnippsel oben, der auch in den Header muß, weiß ich nicht, wie der vom header aus auf die entsprechende Unterseite leiten soll, da ist doch gar kein Hinweis:

      Da wird doch dann alles gesperrt?

      Meine zwei Fragen: was war an meinem Code falsch und wie funktioniert Deiner?

      1. Hi Kara,

        entweder wurde da wirklich etwas verschluckt oder der Code macht einfach gar nichts. Was kommt denn nach dem „echo“? Poste das gerne nochmal mit Leerzeichen. Heißt deine Impressumsseite denn auch Impressum bzw hat die URL deinedomain.de/impressum?

        Generell ist eine Steuerung der Indexierung mit if-Abfrage im Code von WordPress bestimmt nicht die sauberste Lösung. Wieso nutzt du dafür nicht einfach ein Plugin? Vielleicht hast du ja sogar schon eines im Einsatz, mit dem du das steuern kannst? Ich würde dir zu Yoast SEO raten – nimm dir mal ein paar Stunden Zeit und lies dich da etwas ein, dann ist vieles davon gut verständlich.

        Zu meinem Code-Snippet: Ja, mit noindex wird die Seite von der Indexierung ausgeschlossen. Genau das soll ja geschehen. Ein Plugin wie beispielsweise das oben erwähnte Yoast ermöglicht das Setzen von noindex ganz einfach über den Beitragseditor im Backend, individuell für jede Seite.

        Hast du deine Seite selbst programmiert und nutzt deinen Code, kannst du mit einem Blick in den Quellcode beim Aufruf im Browser ganz einfach überprüfen, ob da wirklich ein noindex gesetzt wird oder ob der Code gar nicht funktioniert.

        PS: Nein, nofollow ist definitiv nicht die Lösung 😉

  2. Moin Dominik, ich habe auf meinem WordPress-Blog https://www.careelite.de einen kleinen Affiliate-Shop. Die Artikeldetailsseiten von WooCommerce sind gar nicht zu sehen, da der Shop direkt auf die Produkte verlinkt. Trotzdem werden die Artikeldetailseiten indexiert. Hast du eine Idee, wie ich das verhindern kann? Besten Dank im Voraus und danke für deinen Artikel!

    Beste Grüße aus Berlin,
    Christoph

    1. Hi Christoph,

      das kann mehrere Gründe haben. Ohne mir die Seite im Detail anzuschauen, werfe ich dir die folgenden Dinge an den Kopf:
      – Bist du dir sicher, dass die Detailseiten nirgends verlinkt sind? Auch nicht im Quelcode, beispielsweise durch rel=prev/next Auzeichnungen etc?
      – Hast du die Detailseiten via noindex ausgezeichnet? AIO (was du ja nutzt) sollte das können.
      – Werden die Detailseiten via sitemap.xml an Google übergeben und entsprechend gecrawlt/indexiert?
      – Waren diese Detailseiten in der Vergangenheit gewollt im Index? Gibt es externe Links?

  3. Hallo dominik
    ich bin einseitger in sachen seo.seit mehr als 2 monate habe ich einige seiten und beitraege.die automatisch von google indexiert .enfernt. aber die tauchen immer in suchergebnisse vin google.ich habe die inhalt geloscht indem ich die seite geloecht und die urls in search console entfernt.
    koennen sie mir weiterhelfen ich bin ganz neu und dieses thema ist mir so kompliziert
    vielen dank erstmal fuer Ihre beitrag

    1. Hi Deyane,

      du hast also die Artikel komplett aus dem CMS gelöscht? Das heißt,beim Aufruf der URL wird ein 404 Status Code zurückgegeben? Gleichzeitig taucht die URL auch nicht mehr in der Sitemap auf? Hast du die URL über „URLs entfernen“ in der Search Console von der Indexierung ausgeschlossen? Es zeigen keine anderen URLs in deinem CMS via canonical auf die gelöschten Seiten?

      Wichtig: Du darfst die URLs nicht via robots.txt auf disallow setzen, sonst findet Google ein evtl vorhandenes „noindex“ nicht.

      Wenn das alles zutrifft hilft nur warten, mehr kannst du dann leider nicht tun.

  4. Hi,

    ich habe bereits eine fertige Homepage, sie läuft schon seit ca. 2 Jahren mit domain xyz.de und nun möchte ich ein Rebranding machen. Sprich die domain xyz.de soll weiterhin bestehen bleiben und auf die domain abc.de weiterleiten.

    Nun zu meiner eigentlichen Frage:
    Die Domain xyz.de wird bei Google angezeigt und auch auf der ersten Seite. gibt es eine Möglichkeit sie gegen abc.de aus zu tauschen? sodass xyz.de nicht mehr angezeigt wird und nur abc.de?

    Vielen Dank vorab!

    1. Hi!
      Du musst vor allem darauf achten, dass die die alten URLs (also auch alle Unterseiten) ordentlich auf die neue URL weiterleitest.
      Dann wird die alte Seite irgendwann die alte Seite aus den Suchergebnissen verschwinden und nur noch die neue Seite angezeigt.
      Gleichzeitig vererbst Du so aber den Trust der alten Seite an die neue.

      Viele Grüße,

      Stephan

  5. Hallo Dominik,

    ich habe gemerkt das eine Seite von mir unerwünscht im Index gelandet ist. Nun habe ich mit dem SEO Plugin von Yoast die Seite auf „Noindex“ gestellt und einfach mal die Seite mit Hilfe der Search Console crawlen lassen. Dadurch müsste sich das Problem doch lösen, oder?

    Übrigens, ein sehr guter Artikel. Hat mir echt weitergeholfen 🙂

    LG

    Philipp

    1. Hi Philipp,

      danke für dein Feedback, freut mich wenn der Artikel geholfen hat!

      Mit Yoast auf noindex setzen und neu crawlen lassen ist genau richtig. Die Seite wird mittlerweile vermutlich schon aus dem Index draußen sein 🙂

  6. Hallo Dominik,

    ich habe in WordPress eine Seite auf Privat gestellt. Diese Seite wird jedoch trotzdem in der Google-Suche angezeigt. Beim Klick über Google auf die Seite kommt 404-Fehler. Die Seite sollte im Privat-Modus ja gar nicht angezeigt werden oder indexiert Google wirklich einfach alles?

    1. Hi Richard,

      du hattest die Seite veröffentlicht und Google hatte sie im Index. Stellst du die Seite jetzt auf Entwurf oder privat ist sie zwar nicht mehr öffentlich einsehbar, aber eben noch bei Google im Index. Dort wird sie auch solange bleiben, bis Google sie erneut gecrawlt hat.

      Hättest du die Seite noch gar nicht veröffentlicht gehabt, wäre sie auch nicht im Index gelandet. Google hätte sie dann ja auch noch gar nicht gesehen.

      Hilft dir das?

  7. Hi Dominik,
    vielen Dank für den informativen Beitrag. Kurze Frage: Kennst du eine Lösung um nur einen Textblock auf einer Seite für die Google-Indexierung zu sperren. Also keine komplette Unterseite einer Website, sonder innerhalb der Unterseite nur ein paar Zielen Text.

    Viele Grüße
    Johannes

    1. Hi Johannes,

      ich hab vor einigen Jahren mal mit googleon/off rumgespielt: http://www.media-affin.de/googleoff-googleon
      Das greift aber nicht für die normale Google-Suche, erfüllt den Zweck also nicht.

      Mir sind nur zwei Optionen bekannt:
      1) Text als Bild anzeigen. Ist natürlich doof, das können Screenreader und somit Blinde dann auch nicht lesen. Packst du den Text in das alt-Attribut des Bildes ist er auch für Suchmaschinen wieder sichtbar.

      2) Den Inhalt via iFrame einbinden – diesen Inhalten folgt Google nicht. Ich vermute aber, dass es mit Screenreadern dasselbe Problem gibt wie mit Bildern. Und das Styling von iFrames (Desktop vs Mobile) kann mitunter echt kniffelig sein damit da keine „doppelten Scrollbalken“ erscheinen.

      Was genau hast du denn vor?

  8. Hallo,

    vielen lieben Dank für diese hilfreiche Veröffentlichung.

    Ich habe folgende Thematik aktuell: Ich möchte mit einer neuen Marke auf den Markt gehen, aktuell bin ich mit der Grafikagentur an der genaueren Umsetzung.
    Ich möchte allerdings, dass Google die bereits registrierte URL möglichst schnell indexiert. Meine Überlegung ist nun, dass ich z.B. eine einfache WordPress-Landingpage o.ä. erstelle und diese als erste Seite auf die entsprechende URL stelle und die Indexierung von Google entsprechend vorantreibe. Mir ist nur wichtig, dass ich bereits jetzt die Indexierung voranbekomme, auch wenn der eigentliche Inhalt noch nicht sichtbar ist.

    Bringt mir dies überhaupt etwas, wenn im Nachgang – wenn sämtliche Templates, Texte usw. für die eigentliche Website erstellt sind – die richtige Website unter der URL veröffentlicht wird?

    Vorab lieben Dank für Eure Hilfe.

    Viele Grüße,
    Manuel

    1. Hi Manuel,

      danke für dein Feedback!

      Du meinst, dass du eine neue Domain registriert hast auf der aktuell noch keine Inhalte sind und die dazugehörige Website erst noch in der Mache ist? Klar, da kannst du gerne schon eine Landingpage erstellen und online stellen. Das schadet dir überhaupt nicht.

      Du solltest in diesem Schritt schon direkt die Search Console einrichten. Sobald die finale Website dann online ist, kannst du diese via „Abruf wie durch Google“ in der Search Console nahezu in Echtzeit in den Index bekommen.

      Hilft dir das weiter?

  9. Erstmal ein dickes Lob an euch. Ein echt einfacher sehr gut geschriebener Artikel den Sogar ich verstehen konnte;-)
    Ich hätte mal zum relaunch einer Webseite eine Frage:
    Ich habe eine Domain A auf der ich eine Webseite betreibe und die zu meinen gewünschten Keywords auf TOP Positionen erscheint! Nun ist die Webseite schon fast 8 Jahre alt und die Technik natürlich nicht das wahre…Jetzt habe ich mit WP eine neue Webseite erstellt die auf einer Subdomain.de auf einem anderen Server läuft und die nun auf mich wartet online zu gehen…Ich will das die neue Webseite die auf einem subdomain gerade läuft das es, wenn domain A erscheint, man direkt auf die neue Webseite gelangt…Wie solle könnte müsste ich hier vorangehen, dass ich nicht an zu starkem Rankingverlust leide?
    Für Tips und Ratschlag, besten Dank!

    Lg
    Yasin

    1. Hi Yasin,

      Danke für dein Feedback und die Frage!

      Du solltest die alte Website durch die neue ersetzen, auf derselben Domain. Damit das möglichst ohne Rankingverluste geschieht, solltest du zwingend Redirects einrichten. Nutzt du Apache, fügst du die Redirect Rules in die .htaccess ein, in diesem Format:
      Redirect 301 /alter/pfad.html /neuer/pfad.html
      Redirect 301 /alt/beispiel/taxi.html /neu/beispiel/taxi.html

      Teste unbedingt, ob die Redirect-Regeln funktionieren.

      Wenn dir das zu technisch ist, solltest du dir eine Agentur suchen, die dir beim Umzug der neuen Website auf die alte Domain und die Einrichtung der Redirects hilft.

      Hilft dir das weiter?

  10. Hallo Dominik,

    danke für deine vielen Tipps. Ich habe eine konkretere Frage. Wie kann ich eine Seite nicht nur aus dem Index nehmen, sondern auch verhindern, dass sie über das „Suchfeld“ auf meiner Webseite aufgefunden wird?

    Das möchte ich wissen, da ich ein Ebook verkaufen möchte. Wenn ich die Dank-Seite erstellt habe, dann möchte ich nicht, dass einige über diese das Ebook umsonst herunterladen könnten.

    Viele Grüße, Paul

    1. Hi Paul,

      da ich nicht weiß, welches CMS du nutzt, gehe ich mal von WordPress aus – das ist das einzige, wozu ich dir eine Antwort geben kann 😉

      Out of the box unterstützt WordPress den Ausschluss bestimmter Seiten aus der internen Suche nicht. Wir nutzen dazu das Plugin Search Exclude.

  11. Hallo
    Ich hab mal eine Frage. Die Search Console meckert auf meiner Homepage wegen einem fehlenden Titel und zwar auf der /page-sitemap. xml. Die Sitemap wurde SEO yoast erstellt. Macht es Sinn die Seite auf noindex zu setzen oder gibt es eine Möglichkeit der Sitemap einen Titel zu zu fügen?

    1. Hi Anton,

      deine Sitemap ist tatsächlich bei Google indexiert. Gib in die Google-Suche mal site:deinedomain.de/page-sitemap.xml ein. Das sollte eigentlich nicht geschehen. Wie das passiert kann ich dir leider nicht verraten. Du solltest sie auf noindex setzen, damit sie von da wieder verschwindet.

      Davon abgesehen: Die Sitemap braucht keinen Title, weil sie ja gar nicht gefunden werden soll und entsprechend auch keine Optimierung braucht.

  12. guter Beitrag der meiner Meinung nach jedoch relativ offen lässt welche Seiten genauer man aus dem Index nehmen sollte.

    Woran erkennt man Seiten ohne Qualität bei einer 17.000 Seiten Seite. Derzeit suche ich unseren Shop nach genau solchen Seiten ab.

    1. Hi Christian,

      da gibt es keine für alle Seiten allgemeingültige Liste. In Shops sollten zum Beispiel paginierte Seiten auf noindex gesetzt sein (nach einer kurzen Stichprobe ist das bei euch der Fall).

      Generell solltest du ja Google Analytics eingerichtet und dort auch Ziele konfiguriert haben. So kannst du dann messen, welche URLs dir wirklich Kunden (oder Newsletter-Abonnenten oder …) bringen und somit wertigen Traffic liefern und ihre Daseinsberechtigung haben. Entsprechend kannst du dann auch herausfinden, welche URLs das nicht schaffen und entscheiden, ob es die dann im Index braucht (und ggf optimiert wird) oder ob sie vielleicht sogar komplett gelöscht wird (weil auch über anderen Kanäle wie z. B. Social kein konvertierender Traffic geliefert wird).

      Das wäre mal die grundlegende Vorgehensweise in drei Sätze runtergebrochen – ist natürlich „etwas“ komplexer. Aber hilft dir das schonmal weiter?

      1. da gibt es keine für alle Seiten allgemeingültige Liste. In Shops sollten zum Beispiel paginierte Seiten auf noindex gesetzt sein (nach einer kurzen Stichprobe ist das bei euch der Fall). <- aber erst heute morgen gemacht 😉

        Darf ich dich mal per Email anschreiben? Ich hätte da 2-3 Fragen bzgl der Seiten vor allem was Varianten angeht.

  13. Hallo,

    ich habe bei 1 & 1 eine Webseite erstellt. Ging alles sehr gut. Wie kann ich verhindern, dass die Seite bei Google etc. angezeigt wird.
    Bitte verständlich erklären. Bin kein PC/Webseiten-Profi ;-))

    LG

    Heike

    1. Hi Heike,

      ich kenne leider das System von 1und1 nicht (eigener Baukasten? WordPress?) noch die Optionen zum Bearbeiten. Kann da leider nur bedingt helfen. Wenn die Seite einfach gar nie im Index von Google auftauchen soll, die Seite aber aufrufbar sein soll, dann muss bei jeder URL zwischen < head> und < /head> dieser Code stehen:
      <meta name="robots" content="index,follow"/>
      Aber: Das verhindert nicht, dass Bilder indexiert werden.

      Wenn die Website gar nicht aufrufbar sein soll, dann kannst du das mit einem Verzeichnisschutz realisieren – beim Aufruf erscheint dann ein Login-Fenster. Erst nach erfolgreicher Eingabe von Nutzername und Passwort erscheint dass die Website.

      Hilft dir das?

  14. Hallo,
    wenn ich unter den einzelnen Seiten auf den Reiter WordPress gehe, ist alles leer. Entsprechend kann ich das no follow, no Index auch nicht auswählen Woran kann das liegen und wie bekomme ich dieses Problem gelöst? Kannst Du mir da einen Tipp geben?

    1. Hi Yasemin,

      ich kann leider überhaupt nicht folgen. Wo gibt es einen Reiter „WordPress“? Was ist alles leer?

      Und: Bitte lies den Artikel nochmal, „nofollow“ brauchst du sehr wahrscheinlich nicht.

  15. Das soll hier eigentlich kein Kommentar werden, sondern eine Frage, die die Probleme Indexierung bzw. das Auffinden von Unterseiten betrifft.
    Ich habe bei 1und1 eine web-Seite über den dort vorhandenen Homepage-Baukasten erstellt.
    D.h. ich habe also von all den Dingen Web-Seiten betreffend keine Ahnung.
    Nach und nach hat sich ergeben, daß bei einer web-Suche immer mehr auch die Unterseiten gefunden werden. Um Lösungen zu finden dieses zu verhindern, bin auf diese web-Seite gestoßen, habe das alles interessiert gelesen. Da ich im Rahmen dieses „Homepage-Baukastens“ ja nicht programmiere, sondern nur irgendwelche Texte eingebe + Bilder hochlade habe ich auch nicht die Möglichkeit irgendwo „noindex“ einzugeben.
    Ist meine Befürchtung richtig, daß ich keine Chance habe die Indexierung der Unterseiten zu verhindern oder?
    Eine Anfrage bei 1und1 läuft derzeit auch.

    Über eine Antwort würde ich mich freuen, evtl. auch besser direkt per mail und nicht über diese „Kommentar-Seite“.

    Danke
    mit freundlichen Grüßen
    Frank

    1. Hi Frank,

      laut diesem Artikel (https://www.redirect301.de/seo-1und1-homepage-baukasten/) ist das Setzen von „noindex“ im Homepagebaukasten von 1und1 nicht möglich. Da ich selbst keinen Zugriff auf den Baukasten von 1und1 habe und der erwähnte Artikel etwas über ein Jahr alt ist, warte bitte noch die Antwort direkt von 1und1 ab. Mit den infos die ich habe lautet die Antwort aber „nein, das ist nicht möglich“.

      Bei weiteren Fragen gerne nachhaken oder mailen 🙂

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.

Lesenswerte Blogbeiträge