|
Webdesign Suchmaschinen |
Webdesign und Suchmaschinen
Webseiten sind Mittel zum ZweckSie wollen mit Ihrer Webseite potenzielle Kunden ansprechen. Sie wollen Produkte verkaufen oder die Besucher für Ihre Dienstleistung interessieren. Sie wollen genug Umsatz durch Ihre Webseiten erzielen, um nicht nur das investierte Geld wieder herein zu holen. Erste Bedingung dazu: Ihre Seiten müssen zugänglich sein (und zwar für Suchmaschinen, die Webseiten vermutlich anders "sehen" als Ihr Browser). Zweite Bedingung: Ihre Seiten müssen gelistet werden, und zwar an prominenter Stelle, auf einem hohen Rang. Erst wenn beide Bedingungen erfüllt sind, sieht der Kunde Ihr Angebot und kann es mit anderen vergleichen. Im Ozean der InformationDas Netz: Ein Meer von Daten, in dem sich zudem unschiffbare Gebirge von Infomüll auftürmen. Google erfasste seit Ende 2004 nach eigenen Angaben über acht Milliarden Webseiten, Alltheweb werden drei bis vier Milliarden nachgesagt, für die MSN Search (deutsch) werden über fünf Milliarden Seiten genannt. Nachdem Yahoo nach eigenen Angaben seit August 2005 mit knapp 20 Mrd. erfassten Seiten an allen vorbei zog, entfernte Google zum siebenten Firmenjubiläum Ende September 2005 die bis dahin auf der Startseite angezeigte Zahl von ca. 8,2 Milliarden durchsuchten Dokumenten, laut heise.de mit der Angabe, der eigene Index sei mindestens dreimal größer als der jeder anderen Suchmaschine. Schätzungen der Gesamtzahl an Internetseiten reichen bis zu 500 Milliarden inklusive dynamischer Seiten, die aus Datenbanken generiert werden. Ohne Suchmaschinen wäre es unmöglich, überhaupt gezielt etwas im Netz zu finden. Wird eine "sauber" kodierte Seite bei Google angemeldet, wird sie meist innerhalb Tagen oder Wochen besucht und (so zu sagen "provisorisch") aufgenommen. Einmal etabliert (was nach Angaben im Netz drei bis sieben Monate dauern kann) und gelegentlich aktualisiert, wird eine solche Seite evtl. mehrmals wöchentlich zum Ziel des Besuches von "Googlebot", dem Suchprogramm. Alltheweb (ein mit Yahoo kooperierender Dienst) braucht oft lange, um geänderte Seiten neu zu erfassen; MSN Search nimmt neue Seiten inzwischen wesentlich rascher dauerhaft in den Index auf als z.B. Google. Die Suchmaschine Gigablast zeigt, dass es auch anders geht: Eine frisch angemeldete Seite erscheint dort binnen Minuten im Index. Dieser Index umfasst bislang "nur" ca. 2 Milliarden Seiten bei zeitweise sprunghaft schnellem Wachstum, leider ist aber die Anmeldungs-Funktion seit längerem deaktiviert. Marktführer Google, Anfang 2005 laut Quellen im Netz noch mit einem Marktanteil über 50 Prozent "gesegnet", ereilt das Schicksal des "Platzhirschen", der von allen Seiten angegriffen wird: Spammer kämpfen mit immer neuen Methoden um hohe Plätze in den Ergebnissen; Yahoo zieht in Sachen erfasste Seiten vorbei und bietet immer neue Dienste an. In vielen Bereichen ist Yahoo bereits deutlich besser und verlässlicher. Suchen Sie z.B. einen Hinweis auf die Zahl der auf Ihre Website weisenden externen Links, wird die entsprechende Suche mit einer Syntax entsprechend "link:http://www.example.com" bei Yahoo weit höhere Ergebnisse zeigen als bei Google. Auch akzeptiert und listet Yahoo neue oder komplett überarbeitete und extern verlinkte Domains wesentlich schneller als Google. Vielleicht auch deshalb lagen im August 2005 laut (wie immer zweifelhaften) Pressemeldungen im Netz die Marktanteile von Google nur noch bei ca. 37 Prozent, die von Yahoo bereits bei 30 Prozent. Wie schafft man es, in den Suchmaschinen zu erscheinen? Gefunden werdenSeiten, die gefunden werden sollen, müssen für die Suchmaschinen auch auffindbar sein. Werden sie in Frames "versteckt", sinkt diese Chance: Einem "normalen Link" nach dem Muster Statt dessen wird schon im noframe-Bereich gar nichts notiert oder nur der "nette" Hinweis, sich doch einen anderen Browser zu installieren, den kaum ein Besucher befolgen wird: Es gibt i.d.R. andere, zugängliche Angebote. Auch per JavaScript kodierte Links, die nur mit aktiviertem JavaScript funktionieren, sperren manche Suchmaschinen aus. Wer solche Techniken verwendet, zieht einen "Stacheldraht" um die eigenen Seiten. Relevante Inhalte vorausgesetzt, muss man sich mittels solcher Methoden Mühe geben, damit die eigenen Seiten nicht gefunden werden. Wer als "Profi" mit einer im Auftrag erstellten Website dauerhaft einen Page Rank von 0 oder 1/10 bei Google erreicht, leistet etwa das Gleiche wie ein Prospektverteiler, der seine Prospekte ins Altpapier wirft. In "normalen" Branchen mit vier- bis fünfstelligen Trefferzahlen je Schlagwort reicht es meist bereits, auf ein sorgfältiges inhaltliches Angebot und eine gute Gestaltung zu achten. In anderen Branchen ist damit kein Blumentopf mehr zu gewinnen: Die Eingabe des Begriffes "webdesign" bei Google lieferte Anfang 2005 z.B. 22,7 Mio. Treffer, bei Einschränkung auf deutsche Ergebnisse 7,78 Mio. ... Aber vielleicht wollen Sie es erzwingen: Dann werfen Sie Ihr Geld einem jener "Optimierer" in den Rachen, die Sie mit ein paar Tricks für die Dauer eines bezahlten Vertrages im Ranking der Suchmaschinen nach oben "pushen". Das funktioniert. Die mir bekannten Preise liegen zwischen einigen hundert bis zu mehreren tausend Euro je Monat für eine Seite. Um nicht der Verallgemeinerung verdächtigt zu werden: Es gibt durchaus auch andere Dienste, die mit sauberen Methoden arbeiten. Inhalt geht vor?Es gibt viele Möglichkeiten zum so genannten "spamdexing", d.h., eine Seite zu bestimmten Schlagworten in die Suchmaschinen-Listen zu bringen, sogar ohne etwas zum Thema anzubieten. In der Frühzeit des Netzes waren die meta-Tags im Kopfbereich der Dateien ein Mittel dazu: Sie enthalten u.a. Informationen für Server und Suchmaschinen, werden bei der Darstellung im Browser jedoch nicht selbst angezeigt. Viele Suchmaschinen beachten diesen Bereich heute kaum mehr, sie orientieren sich am tatsächlich anzuzeigenden Inhalt, dem Text einer Seite. So hängen manche Autoren endlose Listen von relevanten Schlagwörtern ohne jeden Zusammenhang irgendwo in ihre Angebote ein: "Kraftfutter für die Suchmaschinen" nannte das einer, und es funktioniert. Betrogen wird damit wieder der Besucher, dem ein nicht real existierender Inhalt einer Seite vorgegaukelt wird. Aber selbst Google, die (derzeit) wohl renommierteste Suchmaschine im Netz, fällt darauf herein: Suchmaschinen können Wörter zählen, sie können Position und Häufigkeit auswerten, aber von Syntax verstehen sie nicht viel, eine Schlagwortliste reicht oft, sie zu übertölpeln.
Weitere FaktorenGoogle Page RankGoogle verwendet eine weitere Suchtechnik, hier im Original nachzulesen, die nur unter Aufwand erheblicher Mittel zu knacken ist und vermutlich wesentlich zum Erfolg dieser Suchmaschine beitrug: Die Häufigkeit von Links, die von anderen Seiten auf die jeweils zu erfassende Seite verweisen, wird gezählt und danach ausgewertet, wie wichtig die verweisende Seite selbst ist: Existieren auf einer Reihe als wichtig gewerteter Seiten Links zu einer anderen, so steigt auch letztere in der Bedeutung, die Google ihr u.a. im Page Rank (PR) beimisst. Das Mittel der Spamdexer dagegen sind "Linkfarmen": Spamdexer, äh, "Suchmaschinen-Optimierer" verlangen u.a. deshalb so horrende Preise, weil sie ihre Linkfarmen unterhalten müssen ... Aber es wirkt: Eine Seite mit hohem PR von z.B. 7 (das Maximum ist 10) braucht einen Suchbegriff oder eine Kombination nur einmal zu enthalten, um in den Ergebnissen vor einer Seite mit PR 2 zu landen, die den gesuchten Begriff ein halbes Dutzend mal enthält. Das hat einen Beigeschmack: Wer es sich leisten kann, ein Netz aufeinander verweisender Domänen aufzuziehen, kauft sich eben den Erfolg: Auch hier regiert Geld die Welt. Ranking-ListenDerzeit hoch im Kurs sind Websites, die bei Einbindung einer Grafik, die mit einem Link zur Ranking-Site unterlegt ist, auf angeschlossenen Sites den aktuellen Google PageRank anzeigen. Die eingebundene Grafik funktioniert als Zähler; aus PageRank, Backlinks zur bzw. täglichen Hits auf der eigenen Site wird deren Rang unter allen teilnehmenden Sites errechnet. Wer es je nach Programm in die Top 500 oder 600 schafft, wird von der Ranking Site in den Charts verinkt und erhält somit einen Backlink von einer "starken" Site: Mit dem letzten Google PR Update vom 22.04. 2005 erreichten mehrere dieser Sites immerhin einen PageRank von 7 auf der Startseite. Kein Wunder: Je nach Programm verlinken fünf- bis zehntausend Websites zu ihnen, 80 bis 90 % davon "one way", also ohne einen Backlink zu erhalten. Nur die stärksten Seiten mit dem besten PR, den meisten Backlinks oder den meisten Besuchern schaffen es in die Charts. Um dahin zu kommen, muss eine Website allerdings entweder selbst bereits einen PR von 4 oder 5 haben, oder von mehreren hundert oder tausend Besuchern täglich frequentiert werden. Alle anderen tragen nur zur Linkpopularität der Ranking-Sites bei. Die einzigen Vorteile dieser "Verlierer" bleiben, zumindest bei technisch ausgereiften Ranking-Sites, die Anzeige des eigenen PR auf den teilnehmenden Seiten (den lassen sich die Besucher z.B. durch die Google Toolbar oder eine Firefox Erweiterung eh anzeigen, wenn er sie interessiert) und die Anzeige täglich aktualisierter Besucherzahlen (die ein Webmaster aus den eigenen Logfiles oder Statistiken ablesen kann). Schwachpunkte der Ranking-ListenWeniger gute Ranking-Sites bieten einen Code zur Einbindung, der nicht XHTML-kompatibel ist: Das entsprechende Image-Tag arbeitet nur mit HTML 4.x, die "eigenmächtige" Anpassung an valides XHTML wird vom Spider der Ranking-Site als Manipulation gewertet und führt zum Ausschluss. Oder die zugrunde liegenden Skripte fügen eigenmächtig das meist übliche Prefix "www" zur Domain hinzu, ob dies der Domain entspricht oder nicht. Manche Domains sind aber konsequent webweit ohne dies Prefix verlinkt, so dass der evtl. per Backlink von der Ranking-Site kommende PR auf die "falsche" Domain zeigt. Oder sie wird wiederum gar nicht erst geführt, weil der nötige Referrer nicht den Vorstellungen eines unflexiblen Programmierers entspricht. Die Backlink-Zählung ist oft mangelhaft und intransparent umgesetzt; jede intensive Recherche nach Backlinks zeigt ein vielfaches als die auf der Ranking-Site angezeigten Backlinks. Auch die Zählung der Seitenbesuche, eh schon ein komplexes Thema, ist zweifelhaft umgesetzt: Vielfach kann man beobachten, dass die eingebundene Grafik gar nicht vom Server des Programmes abgerufen wird, sondern vom Browser aus dem Cache gelesen. Dies wird sichtbar, wenn man im Browser durch Erweiterung oder Google-Toolbar eine eigene PR-Anzeige nutzt, die einer Seite einen PR von z.B. 3 bescheinigt, während die Grafik erneut einen PR von 6 behauptet, wie er einer vorher besuchten Website gebührte, die am gleichen Programm teilnahm. Wurde die Grafik aber nicht vom Server geladen, wurde auch kein Besuch gezählt: Wieder nichts mit der "wundersamen PR-Verbesserung". DMOZOb dagegen langfristig ein Kraut gewachsen ist, bleibt fraglich. So lange hilft nur, selbst Seiten zu bieten, die ernst genommen und anderswo verlinkt werden, und natürlich als Grundbedingung und nur in beschränktem Maße die Anmeldung bei Suchmaschinen und Verzeichnisdiensten. Wichtige Quelle: Das chronisch überlastete, weil ehrenamtlich gepflegte Open Directory Project, auch DMOZ genannt, das von vielen Suchdiensten als Grundlage verwendet wird. Leider ist DMOZ intransparent und träge, der Katalog an vielen Stellen mangelhaft entwickelt oder bereits lang überholt. Wie sollte es anders sein bei einem derart umfassenden Projekt, das (fast) allein auf freiwilliger Mitarbeit fußt? DMOZ bedeutet "Directory Mozilla", da dieser Katalog von Netscape alias Mozilla übernommen wurde, kurz bevor AOL Netscape übernahm, um bald darauf selbst mit Time Warner zu fusionieren. Spätestens seit AOL auf den Plan trat, kommt die vielfältige Kritik an Struktur und Inhalt des Katalogs und an der Leitung der über 60.000 freiwilligen Editoren durch (wenige) bezahlte Mitarbeiter nicht mehr zum Schweigen. Viele sehen den Stern dieses Projektes mit über 4 Mio. verzeichneten Websites bereits am Sinken; auch Nutzerstatistiken deuten darauf hin, dass DMOZ seinen Zenit überschritten haben könnte. Die englische Wikipedia-Version bietet einen lesenwerten Artikel zum Thema. Wichtig für die Anmeldung bei DMOZ:
Wer das Warten nicht mehr aushielt oder nicht verstand, warum die eigenen Seiten nicht verzeichnet wurden, konnte sich noch bis Mai 2005 erkundigen nach dem Stand einer Anmeldung, diese Möglichkeit ist inzwischen abgeschafft. Auf www.resource-zone.com können Nutzer sich registrieren lassen und danach in diversen Foren über DMOZ diskutieren, Fragen nach dem Stand einer Anmeldung werden allerdings nicht mehr beantwortet. StrukturVon weiteren Suchmaschinen wird berichtet, dass sie auch Datei- und Verzeichnisnamen als Anhaltspunkte auswerten. Google unterscheidet dabei auch, ob zwei Wörter im Dateinamen per Bindestrich ( - ) oder Underscore ( _ ) getrennt werden: Nur mit ersterem gelten sie als zwei Wörter. Für manche deutschsprachigen Such- und Verzeichnisdienste wie Fireball oder Web.de ist wichtig, dass die Seiten in Deutsch abgefasst sind. Web.de verlangt, wie viele andere Dienste, seit längerem Geld für den Eintrag ins Verzeichnis. Die "Spider", "Bots" oder "Robots", die automatischen Suchprogramme der Suchmaschinen-Betreiber, gehen außerdem nicht gern in die Tiefe: Wenige sollen tiefer als ein bis zwei Verzeichnisebenen in einem Webangebot suchen.
|
|
Dies Dokument: http://joensson.net/webdesign/webdesign-suchmaschinen.shtml Letzte Änderung: 29. September 2005, 00:23:04 |