Textdaten-basierte Output-Indikatoren als Basis einer neuen Innovationsmetrik
Textdaten-basierte Output-Indikatoren als Basis einer neuen Innovationsmetrik
Im Verbundprojekt wurden neue Output-Indikatoren zu Innovationsaktivitäten entwickelt. Dabei kamen computerlinguistische Verfahren zum Einsatz, die auf große Mengen von Textdaten angewandt wurden. Die Entwicklung der Methoden und Validierung der generierten Indikatoren erfolgte dabei arbeitsteilig am ZEW in Mannheim und der Justus-Liebig-Universität Gießen. Am ZEW erfolgte die Analyse auf Basis von Textinhalten aus Unternehmenswebseiten, die automatisiert und regelmäßig über einen Webscraper gesammelt werden. Mittels Text Data Mining (z. B. Topic-Modelle) werden dann aus diesen Texten Informationen zu Innovationen identifiziert und daraus Innovationsindikatoren abgeleitet. Der Zugriff auf die Webseiten erfolgt auf Basis der am ZEW vorhandenen Datenbanken. Diese erlauben das fortlaufende Monitoring der Webseiten des aktuellen deutschen Unternehmensbestandes und die Berücksichtigung umfangreicher Metadaten (z. B. Branche und Standort des Unternehmens). Zusätzlich können die neu generierten Innovationsindikatoren über die ZEW Datenbanken mit konventionellen Innovationsindikatoren verglichen werden.