Joint project
TOBI TP - Textdaten-basierte Output-Indikatoren als Basis einer neuen Innovationsmetrik - Teilprojekt: Technologiebezogene Fachzeitschriften und Informationsdienste werden ausgewertet
Funder: Federal Ministry of Research, Technology and Space, former: Federal Ministry of Education and Research
Period: 2017-2020
URI: https://www.bmbf.de/SharedDocs/Downloads/de/2022/abstract_tobi.pdf?__blob=publicationFile&v=1
Detailed description:
An der JLU werden die News-Artikel mittels Topic-Modeling in Hinblick auf relevante, d.h. innovationsnahe, Themen analysiert. Die so identifizierten Innovationen werden, bspw. mittels Named-EntityRecognition (NER) Methoden, auf die handelnden Entitäten (Unternehmen) untersucht, welche wiederum mit Angaben aus dem MUP und anderen, mit dem MUP verbundene Datenbanken verknüpft werden. Aus den gesammelten Daten können schließlich Innovationsmetriken extrahiert werden, die unter Benutzung Vektor-Autoregressiver (VAR) Modelle auf ihre Vor- bzw. Nachlaufeigenschaften untersucht werden können. Abgesehen von der Identifikation von Vorlaufeigenschaften, die für ein Indikatorensystem als hilfreich eingeschätzt werden, können auch Indikatoren identifiziert werden, die
zusätzliche Informationen liefern, die bislang nicht im Indikatorensystem enthalten sind und somit eine
relevante Erweiterung der Innovationsmetrik darstellen. Das permanente Monitoring der aktuellsten
News-Artikel erlaubt dabei eine hohe Aktualität der generierten Indikatoren.
Neben methodischen Überschneidungen (Innovationsindikatoren aus Text-Massendaten mittels Text
Data Mining) können die beiden Teilvorhaben auch dahingehend voneinander profitieren, dass beispielsweise die trainierten Topic-Modelle des jeweils anderen Teilvorhabens zur Klassifizierung der eigenen Textdaten herangezogen werden. So lassen sich beispielsweise Innovationsfelder, die in IT-Fachzeitschriften identifiziert wurden, auch auf den Webseiten von IT-Unternehmen erkennen.
An der JLU werden die News-Artikel mittels Topic-Modeling in Hinblick auf relevante, d.h. innovationsnahe, Themen analysiert. Die so identifizierten Innovationen werden, bspw. mittels Named-EntityRecognition (NER) Methoden, auf die handelnden Entitäten (Unternehmen) untersucht, welche wiederum mit Angaben aus dem MUP und anderen, mit dem MUP verbundene Datenbanken verknüpft werden. Aus den gesammelten Daten können schließlich Innovationsmetriken extrahiert werden, die unter Benutzung Vektor-Autoregressiver (VAR) Modelle auf ihre Vor- bzw. Nachlaufeigenschaften untersucht werden können. Abgesehen von der Identifikation von Vorlaufeigenschaften, die für ein Indikatorensystem als hilfreich eingeschätzt werden, können auch Indikatoren identifiziert werden, die
zusätzliche Informationen liefern, die bislang nicht im Indikatorensystem enthalten sind und somit eine
relevante Erweiterung der Innovationsmetrik darstellen. Das permanente Monitoring der aktuellsten
News-Artikel erlaubt dabei eine hohe Aktualität der generierten Indikatoren.
Neben methodischen Überschneidungen (Innovationsindikatoren aus Text-Massendaten mittels Text
Data Mining) können die beiden Teilvorhaben auch dahingehend voneinander profitieren, dass beispielsweise die trainierten Topic-Modelle des jeweils anderen Teilvorhabens zur Klassifizierung der eigenen Textdaten herangezogen werden. So lassen sich beispielsweise Innovationsfelder, die in IT-Fachzeitschriften identifiziert wurden, auch auf den Webseiten von IT-Unternehmen erkennen.
Coordinating organisation / Consortium Leader
- Centre for European Economic Research
Cooperation partners with funding
- Centre for European Economic Research
- University of Giessen