Internet Suchmaschinen sind in einem modernen Web eigentlich nicht mehr wegzudenken. Heute existiert eine Vielzahl von sehr unterschiedlichen Diensten mit abweichenden Zielen und Techniken, die Nutzenden dabei helfen sollen, genau die Informationen zu finden, nach denen sie suchen. Angefangen mit einfachen Listen von Webdiensten und wichtigen Dateien, über einfache Indexmaschinen bis hin zu den kürzlich aufgekommenen KI-basierten Suchdiensten.
Dieser Blogartikel ist Teil einer Serie von Blogposts in den kommenden Monaten und soll eine kurze Einführung in das spannende Thema der Suchmaschinen geben sowie einige Probleme des Suchmaschinenmarkts und der Art und Weise, wie wir diese Nutzen, erläutern.
Grundsätzlich gibt es eine Vielzahl unterschiedlichster Suchmaschinenkonzepte und spezialisierter Nischen-Software für unterschiedlichste Anwendungsfälle. Dieser Artikel beschränkt sich auf Plattformen öffentlicher Web-Suche.
Eine kurze Historie der Suchmaschinen
Ihren Feldzug traten die Suchmaschinen schon kurz nach der Geburt des öffentlichen Internets an. Denn bereits früh wurde klar, dass ein Informationsnetzwerk nur dann sinnvoll ist, wenn es Nutzenden möglich ist, genau die Informationen zu finden, die sie brauchen. Bei der ersten „Suchmaschinen“ handelte es sich eher um Nachschlagewerke darüber, welche Webserver von wem betrieben wurden, welche Dateien wo heruntergeladen werden konnten oder bestanden sogar lediglich aus manuell erzeugten Listen von Webdiensten, die Nutzende durchstöbern konnten.
Erst Mitte der 1990er entstanden solche Dienste, unter denen wir heute „Suchmaschinen“ verstehen würden. Zu den ersten kommerziell betriebenen, heute noch aktiven Suchmaschinen zählen die Suchmaschine Lycos und auch Yahoo!, welche 1994 entstanden und sich schnell großer Beliebtheit erfreuten.
Anders als die zuvor manuell erstellten Listen von Webdiensten oder Dateien nutzten Suchmaschinen ab Mitte der 1990er bereits spezielle Programme (sog. „Web-Crawler“), welche Inhalte und Webseiten im gesamten Internet durchforsten und in den Suchindex der betreibenden Suchmaschine einpflegen.
Mit dem ständigen Wachstum von Internetdiensten wurden schnell Methoden nötig, welche Webseiten und Inhalte in den Indices der Suchmaschinen nach unterschiedlichen Gütemaßen sortieren konnten. Das sogenannte „page ranking“ setzte sich schnell bei vielen Webseiten durch und ist ein bis heute heiß diskutiertes Thema. Denn Suchmaschinenbetreibende erlangen hierdurch die Macht darüber, welche Ergebnisse Nutzende als erstes angezeigt bekommen, wenn sie nach einem Begriff suchen – und welche Ergebnisse aus bestimmten Quellen nicht (oder sehr weit unten) angezeigt werden. [1]
Genau diesen Umstand machte sich u.a. Google zunutze um gezielt Werbeanzeigen unter Suchergebnisse zu mischen, welche von anderen Unternehmen gekauft werden konnten, und läuteten damit die Kommerzialisierung von Suchmaschinen ein. [1]
War der Suchmaschinenmarkt anfangs noch stark umkämpft, setzte sich die Suchmaschine Google um die Jahrtausendwende herum schlussendlich durch und hält einen Großteil Marktanteils bis heute: nämlich etwa 90% weltweit. [2, 3]
Doch genau diese Marktvorherrschaft droht aktuell zu kippen. War es den Anbietern unterschiedlichster Suchmaschinenkonzepte über Jahrzehnte hinweg nicht möglich, Google bedeutende Marktanteile wegzunehmen, könnten die in den vergangenen Jahren aufkommende KI-basierte Suchmaschinen und Chatbots genau das womöglich schaffen. [4]
Gleichzeitig kritisieren sowohl Ökonom:innen, als auch Datenschützer:innen bereits seit Jahren die zunehmende Zentralisierung von Marktmacht und die Bestimmungsgewalt darüber, was Menschen weltweit suchen, sehen, kaufen oder verstehen können. Wird eine einzelne Plattform in der Hand eines marktorientierten Akteurs von einem Großteil der Menschheit dafür genutzt Nachrichten zu lesen, sich über Produkte zu informieren, sich mit anderen Menschen zu vernetzen und den eigenen Hobbys und Interessen nachzugehen, gibt das eben jener Plattform eine gewaltige Macht, die sich nicht nur wirtschaftlich auswirken, sondern auch einen starken Effekt auf unsere Gesellschaft haben kann. [5, 6]
Das Optimierungsparadox
Die Qualität von Suchergebnissen ist der Maßstab, an dem sich eine Suchmaschine messen lassen muss. Welche Ergebnisse den Nutzenden „ganz oben“, also direkt als Erstes, in einer endlosen Liste an Suchergebnissen angezeigt wird, bestimmt darüber, ob die Suchmaschine als „gut“ oder „schlecht“ empfunden wird.
Das Qualitätsempfinden von Suchergebnissen ist hierbei natürlich stark subjektiv und unterliegt starken Gewöhnungseffekten. Auch der Lock-In Effekt kann hier auftreten, wenn Nutzende sich (in der Regel unterbewusst) daran gewöhnen, wie sie Suchanfragen an eine bestimmte Suchmaschine formulieren müssen, um zufriedenstellende Ergebnisse zu erhalten. Nutzt man mit derselben Erwartungshaltung dann eine andere Suchmaschine, welche Ergebnisse in anderer Weise aufbereitet oder sortiert, führt dies oftmals zu Frust bei den Nutzenden.
Obwohl die meisten großen Suchmaschinen bei einfachen Suchanfragen in der Regel mehrere Millionen Ergebnisse anzeigen kann, schauen sich Nutzende oftmals nur die ersten paar Einträge an. Diese Plätze sind dementsprechend stark begehrt. Suchmaschinenoptimierung (engl.: „Search Engine Optimization“, SEO) beschreibt den Prozess und Methoden um die Web-Crawler von Suchmaschinen genau jene Informationen zu liefern, die dafür sorgen, dass die jeweilige Webseite möglichst weit oben in den Suchmaschinen auftaucht.
Diese Optimierung umfasst in der Regel die Minimierung von Ladezeiten, das Bereitstellen von maschinenlesbaren Zusammenfassungen des Webseiteninhalts und Schlagwortsammlungen zur Beschreibung der Seite. Jedoch kann es auch Methoden umfassen, welche bewusst versuchen, Suchmaschinen Inhalte vorzugaukeln die gar nicht existieren, um unrechtmäßig am oberen Ende der Suchergebnisse aufzutauchen. Auch das Aufkommen von KI-generierten Inhalten hat die Art und Weise, wie Suchmaschinen nach Inhalten suchen sollten stark verändert. Generative KI kann unter anderem auch dazu genutzt werden Web-Crawler der Suchmaschinen mit einer gigantischen Masse von auf diese optimierten Inhalte zu fluten. [7, 8, 9]
Doch SEO steht heute auch anderweitig unter Kritik. So führt die ständige Weiterentwicklung und Geheimhaltung der Ranking-Algorithmen von Suchmaschinen dazu, dass SEO ein sich beständig wandelndes Wettrüsten ist. Je mehr Webseitenbetreibende bereit sind in SEO zu investieren, desto wahrscheinlicher ist es, dass sie bei generellen Suchanfragen weit oben in den Ergebnissen auftauchen. Dies verstärkt den Zentralisierungseffekt des Internets, da nicht mehr die relevantesten Ergebnisse von einer Vielzahl unterschiedlicher, kleiner Webseiten auftauchen, sondern eher Inhalte großer Plattformen deutlich prominenter in Suchergebnissen angezeigt werden. [10]
Die Ära der Chatbots
Doch über die gigantische Plattformökonomik von Suchmaschinenriesen wie Google und der Zentralisierung des Internets durch SEO und KI-generierte Inhalte hinaus scheint es seit dem Aufkommen von Chatbots die per generativer KI gesteuert werden, eine interessante Entwicklung im Suchmaschinenmarkt zu geben. Die Entwicklung und Verbesserung großer Sprachmodelle (engl.: „Large Language Models“, LLMs), welche den Unterbau der generativen KI darstellen, die hinter den neuartigen Chatbots steht, führt zu einem spürbaren Umschwung. [11, 12]
Immer mehr Menschen scheinen Chatbots dazu zu nutzen, Informationen über alle möglichen Themen zu bekommen. Statt wie zuvor bei Google und Co. aus einer Vielzahl von Quellen zu suchen, stellen Nutzende ihre Fragen nun oftmals an Chatbots, welche ihnen in einer Art extrem Energie-intensiven „Gespräch“ interaktiv Antworten liefern. Hierbei ist es offensichtlich egal, dass die Antworten der KI hin und wieder vollkommen erfunden sind und es generell für Nutzende schwer nachvollziehbar ist, woher die Informationen der Chatbots eigentlich stammt. [11, 12, 13, 14]
Das Ende klassischer Suchmaschinen?
Trotz ungebrochener Marktmacht einiger weniger Suchanbieter, der disruptiven Macht der KI-basierten Suchplattformen und der scheinbar hoffnungslos kommerzialisierten Marktlandschaft kann von einem Ende klassischer Suchmaschinen aktuell nicht die Rede sein. Trotzdem befindet sich das Gebiet der Suchmaschinen zurzeit in Umbruch, und wird über kurz oder Lang starken Veränderungen ausgesetzt sein. Insbesondere für Datenschutz-affine oder umweltbewusste Menschen kann dies einige Umgewöhnungseffekte bedeuten.
Wir möchten das Thema in seiner Komplexität in den kommenden Monaten mehrfach aus unterschiedlichen Blickwinkeln und mit wechselndem Fokus auf Unteraspekte in weiteren Blogartikeln beleuchten. Hierdurch wollen wir Denkanstöße und Informationen dazu liefern, mit denen Menschen in Zukunft besser und datenschutzfreundlicher genau die Informationen finden können, die sie gerade benötigen.
Quellen
- Brin, Sergey and Page, Lawrence (1994): The Anatomy of a Large-Scale Hypertextual Web Search Engine. URL: http://infolab.stanford.edu/~backrub/google.html
- Gandal, N. (2001). The Dynamics of Competition in the Internet Search Engine Market. UC Berkeley: Department of Economics. Retrieved from https://escholarship.org/uc/item/0h17g08v
- Statcounter (2024): Search Engine Market Share Worldwide. URL: https://gs.statcounter.com/search-engine-market-share#yearly-200901-202410
- Pierce, David (2023): The AI assistant revolution is more than 50 years in the making. URL: https://www.theverge.com/23888985/ai-assistant-you-chatgpt-bard-siri-alexa-vergecast-podcast
- Scholz, Nina (2024): Monopolexperte Ulrich Müller: „Google muss zerschlagen werden“. URL: https://www.freitag.de/autoren/nina-scholz/ulrich-mueller-von-lobbycontrol-google-muss-zerschlagen-werden
- ZDF heute (2024): Zerschlägt die US-Regierung Google?. URL: https://www.zdf.de/nachrichten/wirtschaft/unternehmen/google-us-regierung-zerschlagung-monopol-100.html
- Zeller, Tom (2006): A New Campaign Tactic: Manipulating Google Data. URL: https://www.nytimes.com/2006/10/26/us/politics/26googlebomb.html
- Elliott, Kirsten (2024): Google Scholar is not broken (yet), but there are alternatives. URL: https://blogs.lse.ac.uk/impactofsocialsciences/2024/10/22/google-scholar-is-not-broken-yet-but-there-are-alternatives/
- Kra, Alex (2021): The mermaid is taking over Google search in Norway. URL: https://alexskra.com/blog/the-mermaid-is-taking-over-google-search-in-norway/
- Brereton, Dimitri (2022): Google Search Is Dying. URL: https://dkb.io/post/DEPR_google-search-is-dying
- Edwards, Benj (2024): OpenAI launches ChatGPT with Search, taking Google head-on. URL: https://arstechnica.com/ai/2024/10/openai-launches-chatgpt-with-search-taking-google-head-on/
- Love, Julia and Alba, Davey (2024): Google’s AI Search Gives Sites Dire Choice: Share Data or Die. URL: https://www.bloomberg.com/news/articles/2024-08-15/google-s-search-dominance-leaves-sites-little-choice-on-ai-scraping
- Slater, Joe and Humphries, James and Townsen Hicks, Michael (2024): ChatGPT Isn’t ‘Hallucinating’—It’s Bullshitting! URL: https://www.scientificamerican.com/article/chatgpt-isnt-hallucinating-its-bullshitting/
- Sloan, Karen (2023): A lawyer used ChatGPT to cite bogus cases. What are the ethics? URL: https://www.reuters.com/legal/transactional/lawyer-used-chatgpt-cite-bogus-cases-what-are-ethics-2023-05-30/
Jan ist Mitgründer von ViOffice. Er kümmert sich insbesondere um die technische Umsetzung und Wartung der Software. Seine Interessen liegen insbesondere in den Themengebieten Sicherheit, Datenschutz und Verschlüsselung.
Neben seinem Studium der Volkswirtschaftslehre, später der angewandten Statistik und seiner daran anknüpfenden Promotion, hat er jahrelange Erfahrung im Bereich Softwareentwicklung, Opensource und Serveradministration.