21292;M-05;1504;28.11.2008;Münster;Nordrhein-Westfalen;Modularsequentielle Layoutanalyse: Zeitungsausschnitt durch Algorithmus statt Schere;Jugend Forscht;Mathematik/Informatik;m;;;;;;;;;1.1 Fragestellung
Assoziiert mit dem 7. Forschungsrahmenprogramm der EU fordert das Programm ”i2010: Digital Libraries Initiative“ verstärkte Bemühungen um die Digitalisierung von Archivbeständen ein. Vor diesem Hintergrund stellte sich die Frage, ob eine entsprechende, praxistaugliche Software existiert.
1.2 Methode
Eine Analyse der auf dem Markt befindlichen Programme – darunter auch solche, die von Google mitentwickelt werden – zeigte, dass diese Programme bei der Analyse von Zeitungen zu langsam und fehlerbehaftet sind. Es wurde daher von mir ein Algorithmus entwickelt, der Zeitungsseiten schnell, ressourcenschonend und akkurat erfasst.
1.3 Ergebnisse
An einer Beispielimplementierung konnte die Funktionsfähigkeit des im Rahmen dieser Arbeit entwickelten Algorithmus nachgewiesen werden. Dadurch wird die Arbeit von Zeitungsausschnittdiensten, Pressestellen, Bibliotheken und Archiven erheblich vereinfacht und beschleunigt, zumal bei der Entwicklung sichergestellt wurde, dass die vorangehenden (Scannen) und nachfolgenden (Texterkennung, Indizierung) Arbeitsschritte bestmöglich eingebunden werden können. Unter den in der Dokumentation genannten Bedingungen benötigt mein Algorithmus etwa 1,4 Sekunden für eine Zeitungsseite und macht dabei einen Fehler, während die bislang führende Software für dieselbe Seite 71 Sekunden benotigt und dabei zehn Fehler macht.
1.4 Diskussion
Je enger die typografischen Regeln beim Layout eingehalten werden, desto effizienter arbeitet der von mir entwickelte Algorithmus. Eine Weiterentwicklung erstreckt sich auf die inhaltliche Analyse und konsekutive Zuordnung von Bildern.;;;;Nein;;Ja;;nein;;;;;;;;;;;;;;;;;;;;;;;;;;;Guido Falk;;;von Rudorf;;;männlich;;;08.10.1989;;;;;;;;;;;;Steinfurt;;;;;;Nordrhein-Westfalen;;;;;;;;;;;;;;;;;;letzte Wettbewerbsrunde;;;Nein;;;19;;;;;;Sonstige;;;Kreisdekanatsbüro Steinfurt;;;;;;48565;;;Steinfurt;;;;;;;;;;;;;;;;;;;;;Nordrhein-Westfalen;;;;;;1;;;;Guido Falk von Rudorf hat durch seine Arbeit dazu beigetragen, die täglichen Aufgaben in den Pressestellen zu erleichtern. Durch die Anwendung neuartiger Analysemethoden können in Zukunft Schere und Prittstift bei der Pressespiegelerstellung entfallen. Der Zeitbedarf bei seiner elektronischen Lösung ist dabei auch kommerziellen Produkten deutlich überlegen. Die vorgestellte Arbeit hat professionellen Charakter;;;;;;M;1;28.11.2008;Jugend Forscht;Nordrhein-Westfalen;Mathematik/Informatik;m;;1.1 Fragestellung
Assoziiert mit dem 7. Forschungsrahmenprogramm der EU fordert das Programm ”i2010: Digital Libraries Initiative“ verstärkte Bemühungen um die Digitalisierung von Archivbeständen ein. Vor diesem Hintergrund stellte sich die Frage, ob eine entsprechende, praxistaugliche Software existiert.
1.2 Methode
Eine Analyse der auf dem Markt befindlichen Programme – darunter auch solche, die von Google mitentwickelt werden – zeigte, dass diese Programme bei der Analyse von Zeitungen zu langsam und fehlerbehaftet sind. Es wurde daher von mir ein Algorithmus entwickelt, der Zeitungsseiten schnell, ressourcenschonend und akkurat erfasst.
1.3 Ergebnisse
An einer Beispielimplementierung konnte die Funktionsfähigkeit des im Rahmen dieser Arbeit entwickelten Algorithmus nachgewiesen werden. Dadurch wird die Arbeit von Zeitungsausschnittdiensten, Pressestellen, Bibliotheken und Archiven erheblich vereinfacht und beschleunigt, zumal bei der Entwicklung sichergestellt wurde, dass die vorangehenden (Scannen) und nachfolgenden (Texterkennung, Indizierung) Arbeitsschritte bestmöglich eingebunden werden können. Unter den in der Dokumentation genannten Bedingungen benötigt mein Algorithmus etwa 1,4 Sekunden für eine Zeitungsseite und macht dabei einen Fehler, während die bislang führende Software für dieselbe Seite 71 Sekunden benotigt und dabei zehn Fehler macht.
1.4 Diskussion
Je enger die typografischen Regeln beim Layout eingehalten werden, desto effizienter arbeitet der von mir entwickelte Algorithmus. Eine Weiterentwicklung erstreckt sich auf die inhaltliche Analyse und konsekutive Zuordnung von Bildern.;Ja;21292;Münster;M-05;Modularsequentielle Layoutanalyse: Zeitungsausschnitt durch Algorithmus statt Schere;nein;;;;;Eingaben OK;;;;ja;m;von Rudorff;Guido Falk;;Kreisdekanatsbüro Steinfurt;;2;;;;;;;;;
;2009;23