Irgendwann im Jahre 2012 erwachte ein neuer Hype im deutschen SEO-Land, WDF*IDF war geboren (oder auch Within-Document-Frequency * Inverse-Document-Frequency), erste Wehen gab es bereits 2010, doch da hiess das Kind noch TF-IDF. Wobei man von „Kind“ nicht wirklich mehr sprechen kann, als Mutter von IDF gilt Karen Spärck Jones, die es bereits 1972 „geboren“ hatte und die Basis zu dem Ganzen lieferte Hans Peter Luhn schon im Jahre 1957 mit seiner These über die Termgewichtung.
Soweit die Geschichte … Worum geht es hierbei überhaupt (theoretisch)? Ganz simpel ausgedrückt, geht es um die Gewichtung von Dokumenten in einem Themenbereich. Mit Hilfe dieser Formel kann ich theoretisch unter einer Anzahl von Dokumenten (über ein Thema) das Beste herausfinden. Wobei „Beste“ sich nur auf den inhaltlichen Umfang bezieht (das Dokument, das ein Thema am vollständigsten behandelt) ob dieses Dokument nun so mies geschrieben ist, dass es eine Qual ist, es zu lesen, lassen wir mal aussen vor 😉
Man könnte das Ganze nun genauer erläutern, wie es theoretisch funktioniert, macht aber keinen Sinn, denn die Formel ist (in Bezug auf das Internet) höchstens für Google selbst nutz- & anwendbar.
Kurzerklärung (für den, den es interssiert):
Der Knackpunkt bei der Sache ist einfach der Umfang der Daten des IDF-Parts. IDF erwartet Angaben über die gesamte Anzahl aller Dokumente im Web sowie derer, die sich mit dem gesuchten Thema beschäftigen.
Die Jenigen, die nun meinen, dass Google doch immer schön brav die Anzahl aller Ergebnisse aufführt (btw. Google hat auch bereits 2015 „don’t be evil“ aus seinem Verhaltenscodex gestrichen 😉 ) , sollten sich mal diese willkürlichen Daten genauer anschauen … Mal bleiben die Zahlen eine Woche konstant (d.h. das Web wächst täglich, nur ausgerechnet unser Thema grad mal nicht, schon klar), mal verschwinden plötzlich 10.000.000, etc … da kann man letztendlich auch einfach ne Runde würfeln …
Es gibt für uns Sterbliche also keine Möglichkeit der korrekten Anwendung der Formel in Bezug auf das Internet, daher gibt es auch nicht das ultimative WDF*IDF-Tool, denn Google bietet sowas ja nicht an. Doch das brauchen wir auch nicht, denn einen Vorteil hat dieser Hype gebracht, es gibt nun einige Tools die vorgeben ein „WDF…-Tool“ zu sein, doch es sich im Prinzip etwas leichter machen (was für uns genauso nutzbar ist), sie gehen davon aus, in den Top10 der Suchergebnisse stehen eh nur Seiten, die Google durch seine richtigen WDF*IDF-Berechnungen dorthin platziert hat (was ja auch nicht ganz abwegig ist), nun braucht man im Endeffekt nur die Inhalte/Texte/Content der Seiten miteinander vergleichen und erhält eine Liste aller wichtigen Begriffe zum Suchthema, inkl. einer Art Gewichtung (Anzahl/Häufigkeit der einzelnen Begriffe im Text).
Wozu braucht man das nun? Damit kommen wir zur Praxis. Jedes Thema besitzt Unterthemen, die fest miteinander verknüpft sind, jeder Mensch (oder auch Suchmaschine) „erwartet“ förmlich bestimmte (Neben-)Informationen im Rahmen eines Hauptthemas. Beispielsweise suchen wir nach „Sportwagen„, da stossen wir automatisch auf Unterthemen wie z.B.
Sportfahrwerk, Beschleunigung, Aerodynamische Karosserie, Motorleistung, „von 0 auf 100 in … Sekunden“
wenn diese fehlen sollten, kann es sich nicht um einen umfangreichen, informativen Text zum Thema „Sportwagen“ handeln.
Daher bieten uns solche Tools eine Liste an Begriffen, die auf unserer Seite (in unserem Text) verwendet werden sollten, um das Thema möglichst komplett abzuhandeln. Wenn wir ergänzend dazu noch weitere hilfreiche Infos bieten können, immer gerne, diese Listen bilden immer nur das ab, was die Top10-Seiten aktuell an Daten zur Verfügung stellen, wenn man da noch eine „Schüppe drauflegen kann“, umso besser.
Vielen Textern fällt es häufig auch viel leichter eine Liste mit Begriffen zu einem Thema zu haben, die verwendet werden sollten, anstatt nur die Info wie das Hauptthema heisst, denn meist entwickelt sich schon eine „Story“ beim lesen der Wortliste.
Letztendlich ist WDF*IDF nur eine kleine Hilfe für uns, um nicht eventuell wichtige Neben-/Unter-Themen zu unterschlagen, denn wir wollen schliesslich die Nr.1 sein und da muss unser Inhalt logischerweise erstklassig sein und nicht
„erstklässlermässig“ 😉