IT-Supported Long-Term Risk Analysis for the Savigny Estate at Marburg University Library
-
Ulrike Hähner
Abstract
Machine learning and data mining in information technology can assist in the assessment of documents endangered in the long term by ink corrosion. Using this kind of data collection, useful information could be extrapolated, such as the stages of the progress of ink corrosion and the inclusion of external damage factors. In this way, the change in manuscripts resulting from differing storage conditions could be simulated in order to support decisions taken about the choice of treatment. In addition, criteria for recommendations could be assembled by means of machine learning processes, which could form a decision-making tool about treatment options. In order to create such a system, it is necessary to establish damage stages, key words as a threshold value for recommendations and for the assignment of additional distinguishing features such as value of the manuscripts. The contribution show the groundwork was laid to registration of the information of handwritten documents, the data capture and documentation criteria and the possible uses of a database system.
Zusammenfassung
Die Verwendung von Analysetechniken aus der Informatik könnte helfen, die langfristig durch Tintenfraß gefährdeten Dokumente zu erkennen. Die Themengebiete des maschinellen Lernens und des Data Mining der Informatik würden diese Arbeiten unterstützen. Die Grundlage wäre jeweils ein Datenbestand mit hoher Aussagequalität, beispielsweise anhand von Alterungsstadien des Tintenfraßes und der Einbeziehung exogener Schadensfaktoren. Zu erwartende Veränderungen der Handschriften unter verschiedenen Aufbewahrungsbedingungen könnten auf diese Weise simuliert werden, um die Entscheidungen der Behandlungsauswahl zu unterstützen. Zudem könnten durch maschinelle Lernverfahren Kriterien für Empfehlungen zusammengetragen werden, die für die Entscheidung, ob Schriftstücke restauriert werden sollten oder nicht, eine Grundlage bilden. Dafür müsste geprüft werden, welche Schadensstadien und Signalwörter der Datenbank als Schwellenwerte für diese Empfehlung dienen können und ob zusätzliche Merkmale zu den Handschriften, beispielsweise ihrem Wert, integriert werden sollten. Der Beitrag zeigt die Grundlagen, die geschaffen wurden, um Informationen unikaler Dokumente systematisch zu erfassen: die Erfassungs- und Dokumentationskriterien und die Möglichkeiten der Anwendung von Datenbanken.
Résumé
L'utilisation de techniques d'analyse s'appuyant sur la technologie de l'information peut être utile pour reconnaître les documents menacés sur le long terme par la corrosion de l'encre. Le « computer learning » (apprentissage informatique) et le « data mining » (exploitation des données) en technologie de l'information peuvent servir d'outils dans ces travaux. Comme base de travail il serait possible de prendre une collection de données à partir de laquelle des informations utiles pourraient être extrapolées, comme par exemple selon les différents stades du vieillissement de l'encre corrodée et en considérant également les facteurs exogènes de dégradation. De cette façon il serait possible de simuler les altérations probables des manuscrits d'après les différentes conditions de stockage afin de soutenir le choix des décisions prises pour le traitement. Par ailleurs des critères de recommandation pourraient être rassemblés au moyen des méthodes du « computer learning » qui pourraient être un outil précieux lors de la prise de décision concernant le traitement à appliquer pour la restauration des documents. Pour créer un tel système il faudrait examiner quels sont les stades de dégradation et quels sont les mots-clés qui pourraient être utilisés dans la banque de données comme valeurs de seuil pour cette recommandation ainsi qu'éventuellement étudier si d'autres caractéristiques des manuscrits, comme leur valeur par exemple, devrait être prise en considération.
Copyright © Saur 2009
Articles in the same Issue
- IT-Supported Long-Term Risk Analysis for the Savigny Estate at Marburg University Library
- Survey of Historical Manuscripts Written with Iron Gall Inks in the Slovak Republic
- The Impact of Conservation Pressure-Flattening on the Dimensions of Machine-Made Paper
- Visible (420 – 720 nm) Hyperspectral Imaging Techniques to Assess Inks in Historical Documents
- Advantages and Disadvantages of Various Techniques for the Visualization of Watermarks
Articles in the same Issue
- IT-Supported Long-Term Risk Analysis for the Savigny Estate at Marburg University Library
- Survey of Historical Manuscripts Written with Iron Gall Inks in the Slovak Republic
- The Impact of Conservation Pressure-Flattening on the Dimensions of Machine-Made Paper
- Visible (420 – 720 nm) Hyperspectral Imaging Techniques to Assess Inks in Historical Documents
- Advantages and Disadvantages of Various Techniques for the Visualization of Watermarks