IMPRO

IMPRO – An integrative approach, combining bibliometrics and text mining, for completely automatic content analysis of citation contexts

RWTH Aachen University

Das Forschungsprojekt IMRPO zielt darauf ab, die Zitationsanalyse sowie die Quantifizierung von Leistung in der Wissenschaft aussagekräftiger zu machen. Im Rahmen bibliometrischer Analysen von wissenschaftlichen Arbeiten wird bis dato die Anzahl der erhaltenen Verweise gleichgesetzt mit der Relevanz einer Arbeit. Die damit einhergehende Annahme, alle Zitate seien gleichwertig, zeichnet jedoch nur ein relativ oberflächliches Bild der wissenschaftlichen Landschaft. Dies ist insofern problematisch, als dass sich Zitationen hinsichtlich ihrer Beziehung zum zitierenden Text stark unterscheiden können. Mit den Fortschritten der letzten Jahre im Bereich Big Data und Data Mining lassen sich nun auch die bis dato kaum in der Bibliometrie beachteten Publikationstexte automatisiert auswerten. Der Forschungsansatz, der Ideen aus der klassischen Bibliometrie um Entwicklungen aus der Informatik erweitert, konzentriert sich auf den thematischen Kontext von Zitationen und erschließt damit gleichzeitig eine neue Datenquelle für die Messung von Impact. Dabei wird die gelebte wissenschaftliche Praxis, dass Zitationen einen direkten thematischen Bezug zur die Zitation enthaltenen Textstelle aufzuweisen haben, genutzt, um aus den unmittelbaren Textumgebungen von Zitationen auf den jeweiligen thematischen Bezug zum zitierten Werk zu schließen. Die Zitationsumgebungen werden nach der Aufbereitung mit Verfahren aus dem Natural Language Processing mittels Text-Clustering gruppiert. Die resultierenden Gruppen von Zitationsumgebungen repräsentieren dann die Themen, für die die Zielpublikation tatsächlich innerhalb anderer Werke verwendet wird. Aus den extrahierten Themen lässt sich dann ein Themenprofil erzeugen, welches den tatsächlichen Impact veranschaulicht, d.h. die tatsächliche Nutzung einer Zielpublikation innerhalb der wissenschaftlichen Gemeinschaft visualisiert.


Zuwendungsempfänger:

Rheinisch-Westfälische Technische Hochschule Aachen
Projektleitung: Prof. Thorsten-Oliver Salge, Ph.D.

FKZ: 01PU17020
Betrag: 355.818,60 EUR
Laufzeit: 01.08.2018 – 31.07.2021