Forschende haben einen Algorithmus auf alte wissenschaftliche Texte losgelassen und festgestellt: Die Informationen sind da, Menschen erkennen sie nur nicht.

Artikel auf vice.com

Das finde ich ja mega spannend!

Wie konnte das erreicht werden? Die Forscher*innen haben neuronale Netze trainiert mit Texten von 3,3 Millionen wissenschaftlichen Kurzfassungen aus dem Bereich Materialwissenschaft. Der Algorithmus „Word2Vec“ hat daraus gelernt, wie Wörter zusammenhängen.

Nur mithilfe der Wörter aus den wissenschaftlichen Kurzfassungen konnte der Algorithmus Dinge wie das Periodensystem oder die chemische Struktur von Molekülen verstehen.

Und nun wird es spannend:

Der Algorithmus verband Wörter, die nah beieinanderstanden, und erschuf so Vektoren von verwandten Wörtern, mit denen verschiedene wissenschaftliche Konzepte klar wurden. Einige Wörter hat Word2Vec dann mit Thermoelektrik assoziiert, obwohl die Wörter in keiner der Kurzfassungen im thermoelektrischen Kontext fielen. Solche Wissenssprünge sind für Menschen nur schwer zu machen. Ein Algorithmus hat damit aber keine Probleme.

Daraufhin fütterten die Wissenschaftler*innen den Algorithmus mit Arbeiten aus dem Jahr 2009:

So konnten sie eines der besten modernen thermoelektrischen Materialien vorhersagen, das 2012 wirklich entdeckt wurde – nur schaffte Word2Vec das mit dem Stand der Forschung, wie sie vier Jahre zuvor aussah.

Dabei ist es wichtig zu wissen, dass der Algorithmus nicht gesteuert wird. Er erschließt sich seine eigenen Zusammenhänge.