Chronik | neue suche

Gesucht, gefunden

Zum 8. Geburtstag von salto.bz geht ein lang gehegter Wunsch in Erfüllung: Eine neue Suche ist online. Entstanden ist sie in Zusammenarbeit mit Eurac Research.
salto office
Foto: salto.bz /N.Arrigoni

Zwei Jahre wurde hinter den Kulissen eifrig gearbeitet. Jetzt ist der finale Meilenstein erreicht: Die neue Suche auf salto.bz ist online. Und in ihr steckt mehr, als es auf den ersten Blick scheinen mag.

Am Anfang standen zwei Wünsche: Bei salto.bz jener nach einer besseren Suchfunktion, im Institut für Angewandte Sprachforschung von Eurac Research, einen neuen Partner für das Forschungsprojekt DI-ÖSS (Digitale Infrastruktur für das Ökosystem Südtiroler Sprachdaten und -dienste) zu gewinnen. Ziel des Projekts ist es, Sprachakteure in Südtirol miteinander zu vernetzen und Kooperationen zu fördern. Sprachakteure sind Institutionen, Organisationen und Betriebe, die mit Sprach- und Textdaten arbeiten, wie etwa Verlage, Bibliotheken und Mediatheken genauso wie kulturelle Einrichtungen oder Forschungsinstitute.
In diesem Sinne ist die neue salto-Suche als “Use Case” (Fallstudie) entstanden.

Doch wie genau ist die Zusammenarbeit zwischen dem Team von salto.bz und den EURAC-LinguistInnen erfolgt?

 

Die angewandte Sprachwissenschaft braucht authentische Textdaten, um Sprache daran zu untersuchen. Medien brauchen hingegen Wege, um ihre Leserschaft zu erreichen und sie die Informationen finden zu lassen, nach denen sie suchen. Andererseits erzeugen Verlage authentische Texte, während Forschungsinstitute Methoden entwickeln, um Texte zu klassifizieren und durchsuchbar zu machen.
Ziel dieser Fallstudie war es, die Interessen von salto.bz und Eurac Research zu kombinieren, um für beide Seiten einen Mehrwert zu erzeugen. Während salto.bz seine Texte zur Verfügung gestellt hat, hat das EURAC-Team ein Tool entwickelt, das Texten automatisch Schlagworte zuweist. Dabei werden die salto.bz-Artikel zunächst computerlinguistsch verarbeitet: In den Texten werden so Wortgrenzen automatisch erkannt, Wörtern grammatikalische Kategorien zugewiesen und die Wortvorkommen gezählt. Anhand dieser Informationen können anschließend die besten Schlagwortkandidaten aus den Texten extrahiert werden. In einem zweiten Schritt werden die Schlagworte automatisch übersetzt, sodass deutsch-italienische Schlagwortpaare entstehen. Jeder Text wird anschließend mit den zugehörigen Schlagwortpaaren assoziiert und erneut abgespeichert. Diese Daten stehen nun den Portalentwicklern von salto.bz zur Verfügung, die wiederum eine Suchfunktion implementiert haben, die sowohl Schlagworte als auch formale Informationen zu AutorIn, Erscheinungsdatum und Ressort eines Artikels berücksichtigt, um Suchergebnisse zu verfeinern.

 

Texte von salto.bz-AutorInnen werden nun täglich an das Institut für Angewandte Sprachwissenschaft gesendet, dort automatisch mit Schlagworten angereichert und wieder an salto.bz zurückgeschickt, wo die AutorInnen – in der Anfangsphase bleibt diese Funktion auf die Redaktion beschränkt – diese bestätigen oder verwerfen können. Wird ein neuer Artikel veröffentlicht, ist er damit auch Bestandteil des salto.bz-Artikelarchivs. Er kann gesucht und gefunden werden und als Teil aller Suchergebnisse gefiltert und anhand von Schlagworten gruppiert werden.

So viel zur Theorie. In der Praxis bedeutet der Startschuss für die neue salto-Suche, dass sämtliche Artikel und Beiträge, die seit den Anfängen von salto.bz im März 2013 hier erschienen sind – derzeit über 38.000 – einfacher gesucht, gefunden und gefiltert werden können. Ein Geburtstagsgeschenk zum achtjährigen Bestehen von salto, für das Team und die LeserInnen.

 

Bild
Profil für Benutzer gorgias
gorgias Do., 01.04.2021 - 07:06

Dass die Ergebnisse chronologisch geordnet werden wahr wohl nicht drin?
Dass es mehrere Einstellungen gibt mit denen man gezielt nur in Titel, Artikeltext, Kommentaren suchen kann oder nach Autor oder Kommentator filtern fehlt auch. Also das was anderswo schon seit der Jahrtausendwende Standard ist.

Der primäre Mehrwert dieser Kooperation für salto war wohl, dass es kostenlos war.

Do., 01.04.2021 - 07:06 Permalink