Bessere Datenqualität in Google-Analytics

Es gibt viele Probleme die zu schlechter Datenqualität in Google Analytics führen können. In diesem Beitrag geht es um das „Sprache-C-Problem“, welches unter Umständen auch bei deinen Datenansichten für Probleme sorgt. Was Sprache C ist, wie du sie aus deinen Datenansichten fernhalten kannst und welche Folgen Sprache C mit sich bringen kann, erfährst du jetzt.
Was ist Sprache „C“ und wer verwendet sie?
Als Sprache „C“ werden Nutzer gekennzeichnet, die keinem physischen Gebietsschema angehören. In der Regel sind diese Nutzer keine echten Besucher deiner Website, sondern Bots, Crawler und Scripte die z.B. von einer Unix-Befehlszeile ausgeführt werden. Der Buchstabe C bezieht sich auf das Standard-Unix-Locale, wie es in der ISO-C-Norm und POSIX festgelegt ist. Das POSIX-Locale ist dabei ein Synonym für C – soviel zur trockenen Theorie.
Darum solltest du Sprache „C“ aus Google Analytics fernhalten
Wie du gerade gelernt hast, handelt es sich bei den Sprache-C-Datensätzen innerhalb deiner Datenansicht nicht um echte Menschen. Sondern um Computerprogramme, die deine Website aufrufen oder crawlen.
Will man diese in seinen Daten haben? Natürlich nicht, da sie alle Daten die du zur Bildung von Optimierungs-Hypothesen und zur Entwicklung von Online-Marketing-Strategien nutzen möchtest unnötig verfälschen.
Bild: Eindeutige Verzerrung der Datenqualität durch Sprache C
So verhinderst und entfernst du Sprache-C-Daten in Google Analytics
Ich stelle dir nun zwei Möglichkeiten vor. Die Erste würde ich allerdings immer bevorzugen, da sie sehr zuverlässig arbeitet und oft keine weiteren Schritte mehr nötig sind, um Sprache-C in deinen Daten zu verhindern.
So gehst du vor:
- Gehe in die Google-Analytics-Verwaltung, klicke auf die von dir gewünschte Datenansicht und klicke auf „Einstellungen der Datenansicht“.
- Dort scrollst du bis zum Bereich „Bots herausfiltern“ und aktivierst die Checkbox „Alle Treffer von bekannten Bots und Spider ausschließen“.
In der Regel sollte bereits jetzt einen Großteil deiner Sprache-C-Daten herausgefiltert werden, da die meisten Bots, Crawler und Scripte eben genau diesen Wert an Google Analytics übergeben.
Sollte die oben genannte Lösung nicht wie gewünscht arbeiten, kannst du noch über einen Filter die Erfassung von Sprache-C-Daten verhindern.
Wie bei allen Filtern, sollten diese immer erst über eine Test-Datenansicht überprüft werden und nie die Master-Datenansicht beeinträchtigen.
So legst du einen Filter zur Datenbereinigung von Sprache C an:
- Gehe in die Google-Analytics-Verwaltung, klicke auf die von dir gewünschte Datenansicht und klicke wiederum auf „Filter“.
- Füge einen neuen Filter hinzu und wähle „Neuen Filter erstellen“ aus.
- Verwende einen Filternamen wie z.B „Remove language c“, um den Filter später gut erkennen zu können.
- Wähle als Filtertyp „Benutzerdefiniert“ → Ausschließen → Filterfeld „Spracheinstellungen“ und im Filtermuster trägst du „^c$“ ohne die Anführungszeichen ein.
Vor dem Speichern empfehle ich dir noch eine Überprüfung deines Filters vorzunehmen. Dazu findest du direkt über dem Speichern-Button einen entsprechenden Link.
Einfach anklicken und du siehst, wie dein Filter arbeitet.
Bild: Sprache-C-Filter in Google Analytics
So entfernst du bestehende Sprache-C-Daten aus deinen Datenansichten
Aus bereits erfassten Daten kannst du alle Nutzer mit Sprache C, am besten mit einem Segment herausfiltern, da Löschen der Datensätze über das Web-Interface von Google Analytics nicht funktioniert.
Das Segment stellst du dir entweder so ein wie ich dir gleich beschreibe oder du verwendest meins aus der Segment-Galerie.
- Neues Segment hinzufügen.
- Wähle dann „Demografische Merkmale“.
- Wähle unter „Sprache“ im Auswahlfeld „stimmt nicht überein“ und trage als Wert „c“ ein.
Du solltest dann bereits in der Zusammenfassung (rechter Bereich) sehen, wie viele Nutzer und Sitzungen segmentiert werden.
Bild: Sprache-C-Segment in Google Analytics
Conclusio
Wenn Sprache-C-Sitzungen in hoher Anzahl in deinen Daten auftauchen, können diese die Web-Analyse deutlich erschweren. Mit den Lösungsansätzen aus diesem Beitrag hast du alles was du benötigst, um dich vor Sprach-C-Sitzungen zu befreien – sofern diese deine Datenansichten beeinträchtigen.

Wer schreibt hier?
André Goldmann ist Digital Specialist mit 20 Jahren Branchenerfahrung, Sprecher auf Deutschlands führenden Online-Marketing-Konferenzen und dein Experte für UX/UI, SEO, Website-Analytics, Website-Entwicklung und -Optimierung.