Verbundprojekt
TOBI TP - Textdaten-basierte Output-Indikatoren als Basis einer neuen Innovationsmetrik - Teilprojekt: Technologiebezogene Fachzeitschriften und Informationsdienste werden ausgewertet
Geldgeber: Bundesministerium für Forschung, Technologie und Raumfahrt, ehemals: Bundesministerium für Bildung und Forschung
Laufzeit: 2017-2020
URL: https://www.bmbf.de/SharedDocs/Downloads/de/2022/abstract_tobi.pdf?__blob=publicationFile&v=1
Ausführliche Beschreibung:
An der JLU werden die News-Artikel mittels Topic-Modeling in Hinblick auf relevante, d.h. innovationsnahe, Themen analysiert. Die so identifizierten Innovationen werden, bspw. mittels Named-EntityRecognition (NER) Methoden, auf die handelnden Entitäten (Unternehmen) untersucht, welche wiederum mit Angaben aus dem MUP und anderen, mit dem MUP verbundene Datenbanken verknüpft werden. Aus den gesammelten Daten können schließlich Innovationsmetriken extrahiert werden, die unter Benutzung Vektor-Autoregressiver (VAR) Modelle auf ihre Vor- bzw. Nachlaufeigenschaften untersucht werden können. Abgesehen von der Identifikation von Vorlaufeigenschaften, die für ein Indikatorensystem als hilfreich eingeschätzt werden, können auch Indikatoren identifiziert werden, die
zusätzliche Informationen liefern, die bislang nicht im Indikatorensystem enthalten sind und somit eine
relevante Erweiterung der Innovationsmetrik darstellen. Das permanente Monitoring der aktuellsten
News-Artikel erlaubt dabei eine hohe Aktualität der generierten Indikatoren.
Neben methodischen Überschneidungen (Innovationsindikatoren aus Text-Massendaten mittels Text
Data Mining) können die beiden Teilvorhaben auch dahingehend voneinander profitieren, dass beispielsweise die trainierten Topic-Modelle des jeweils anderen Teilvorhabens zur Klassifizierung der eigenen Textdaten herangezogen werden. So lassen sich beispielsweise Innovationsfelder, die in IT-Fachzeitschriften identifiziert wurden, auch auf den Webseiten von IT-Unternehmen erkennen.
An der JLU werden die News-Artikel mittels Topic-Modeling in Hinblick auf relevante, d.h. innovationsnahe, Themen analysiert. Die so identifizierten Innovationen werden, bspw. mittels Named-EntityRecognition (NER) Methoden, auf die handelnden Entitäten (Unternehmen) untersucht, welche wiederum mit Angaben aus dem MUP und anderen, mit dem MUP verbundene Datenbanken verknüpft werden. Aus den gesammelten Daten können schließlich Innovationsmetriken extrahiert werden, die unter Benutzung Vektor-Autoregressiver (VAR) Modelle auf ihre Vor- bzw. Nachlaufeigenschaften untersucht werden können. Abgesehen von der Identifikation von Vorlaufeigenschaften, die für ein Indikatorensystem als hilfreich eingeschätzt werden, können auch Indikatoren identifiziert werden, die
zusätzliche Informationen liefern, die bislang nicht im Indikatorensystem enthalten sind und somit eine
relevante Erweiterung der Innovationsmetrik darstellen. Das permanente Monitoring der aktuellsten
News-Artikel erlaubt dabei eine hohe Aktualität der generierten Indikatoren.
Neben methodischen Überschneidungen (Innovationsindikatoren aus Text-Massendaten mittels Text
Data Mining) können die beiden Teilvorhaben auch dahingehend voneinander profitieren, dass beispielsweise die trainierten Topic-Modelle des jeweils anderen Teilvorhabens zur Klassifizierung der eigenen Textdaten herangezogen werden. So lassen sich beispielsweise Innovationsfelder, die in IT-Fachzeitschriften identifiziert wurden, auch auf den Webseiten von IT-Unternehmen erkennen.
Koordinierende Einrichtung
- Leibniz-Zentrum für Europäische Wirtschaftsforschung GmbH Mannheim
Kooperationspartner mit Förderung
- Justus-Liebig-Universität Gießen
- Leibniz-Zentrum für Europäische Wirtschaftsforschung GmbH Mannheim