Web Mining for Innovation Ecosystem Mapping: A Framework and a Large-scale Pilot Study
Referierte Fachzeitschrift // 2020Bestehende Ansätze zur Modellierung von Innovations- Ökosystemen waren meist auf qualitative und kleinräumige Ebenen beschränkt oder litten, wenn sie sich auf traditionelle Innovationsindikatoren wie Patente und fragebogenbasierte Erhebungen stützten, unter einem Mangel an Aktualität, Granularität und Abdeckung. Unternehmenswebsites sind eine besonders interessante Datenquelle für die Innovationsforschung, da sie für die Veröffentlichung von Informationen über potenziell innovative Produkte, Dienstleistungen und die Zusammenarbeit mit anderen Unternehmen genutzt werden. Die Analyse der textlichen und relationalen Inhalte auf diesen Websites und die Extraktion innovationsbezogener Informationen aus ihnen hat das Potenzial, Forschern und politischen Entscheidungsträgern eine kostengünstige Möglichkeit zu bieten, Millionen von Unternehmen zu untersuchen und Einblicke in ihre Innovationsaktivitäten, ihre Zusammenarbeit und angewandte Technologien zu gewinnen. Zu diesem Zweck schlagen wir einen Web-Mining- Framework zur konsistenten und reproduzierbaren Abbildung von Innovations-Ökosystemen vor. In einer groß angelegten Pilotstudie nutzen wir eine Datenbank mit 2,4 Millionen deutschen Unternehmen, um unser Framework zu testen und Firmen-Websites als Datenquelle zu erkunden. Dabei legen wir besonderen Wert auf die Untersuchung einer möglichen Verzerrung bei der Erfassung von Innovationssystemen durch Firmen-Websites, wenn mit dem von uns vorgeschlagenen Ansatz nur bestimmte Firmentypen erfasst werden können. Wir stellen fest, dass die Verfügbarkeit einer Website und die Merkmale der Website (Anzahl der Unterseiten und Hyperlinks, Textvolumen, verwendete Sprache) je nach Unternehmensgröße, Alter, Standort und Sektor unterschiedlich sind. Wir stellen auch fest, dass patentierende Unternehmen in Web-Mining-Studien überrepräsentiert sein werden. Web Mining als Erhebungsmethode muss auch mit extrem großen und extrem stark vernetzten Ausreißer-Websites und der Tatsache umgehen, dass eine geringe Breitbandverfügbarkeit einige Firmen davon abzuhalten scheint, eine eigene Website zu betreiben und sie somit von der Web Mining-Analyse ausschließt. Mit dem vorgeschlagenen Framework wird dann ein beispielhaftes Innovationsökosystem von Berliner Unternehmen, die im Bereich der künstlichen Intelligenz tätig sind, abgebildet. Abschließend skizzieren wir mehrere Ansätze, wie sich Inhalte von Firmen-Websites in wertvolle Innovationsindikatoren überführen lassen.
Kinne, Jan und Janna Axenbeck (2020), Web Mining for Innovation Ecosystem Mapping: A Framework and a Large-scale Pilot Study, Scientometrics 125 , 2011-2041