Show simple item record

2018-02-13Dissertation DOI: 10.18452/18797
Scalable and Efficient Analysis of Large High-Dimensional Data Sets in the Context of Recurrence Analysis
dc.contributor.authorRawald, Tobias
dc.date.accessioned2018-02-13T08:08:31Z
dc.date.available2018-02-13T08:08:31Z
dc.date.issued2018-02-13
dc.identifier.urihttp://edoc.hu-berlin.de/18452/19518
dc.description.abstractDie Recurrence Quantification Analysis (RQA) ist eine Methode aus der nicht-linearen Zeitreihenanalyse. Im Mittelpunkt dieser Methode steht die Auswertung des Inhalts sogenannter Rekurrenzmatrizen. Bestehende Berechnungsansätze zur Durchführung der RQA können entweder nur Zeitreihen bis zu einer bestimmten Länge verarbeiten oder benötigen viel Zeit zur Analyse von sehr langen Zeitreihen. Diese Dissertation stellt die sogenannte skalierbare Rekurrenzanalyse (SRA) vor. Sie ist ein neuartiger Berechnungsansatz, der eine gegebene Rekurrenzmatrix in mehrere Submatrizen unterteilt. Jede Submatrix wird von einem Berechnungsgerät in massiv-paralleler Art und Weise untersucht. Dieser Ansatz wird unter Verwendung der OpenCL-Schnittstelle umgesetzt. Anhand mehrerer Experimente wird demonstriert, dass SRA massive Leistungssteigerungen im Vergleich zu existierenden Berechnungsansätzen insbesondere durch den Einsatz von Grafikkarten ermöglicht. Die Dissertation enthält eine ausführliche Evaluation, die den Einfluss der Anwendung mehrerer Datenbankkonzepte, wie z.B. die Repräsentation der Eingangsdaten, auf die RQA-Verarbeitungskette analysiert. Es wird untersucht, inwiefern unterschiedliche Ausprägungen dieser Konzepte Einfluss auf die Effizienz der Analyse auf verschiedenen Berechnungsgeräten haben. Abschließend wird ein automatischer Optimierungsansatz vorgestellt, der performante RQA-Implementierungen für ein gegebenes Analyseszenario in Kombination mit einer Hardware-Plattform dynamisch bestimmt. Neben anderen Aspekten werden drastische Effizienzgewinne durch den Einsatz des Optimierungsansatzes aufgezeigt.ger
dc.description.abstractRecurrence quantification analysis (RQA) is a method from nonlinear time series analysis. It relies on the identification of line structures within so-called recurrence matrices and comprises a set of scalar measures. Existing computing approaches to RQA are either not capable of processing recurrence matrices exceeding a certain size or suffer from long runtimes considering time series that contain hundreds of thousands of data points. This thesis introduces scalable recurrence analysis (SRA), which is an alternative computing approach that subdivides a recurrence matrix into multiple sub matrices. Each sub matrix is processed individually in a massively parallel manner by a single compute device. This is implemented exemplarily using the OpenCL framework. It is shown that this approach delivers considerable performance improvements in comparison to state-of-the-art RQA software by exploiting the computing capabilities of many-core hardware architectures, in particular graphics cards. The usage of OpenCL allows to execute identical SRA implementations on a variety of hardware platforms having different architectural properties. An extensive evaluation analyses the impact of applying concepts from database technology, such memory storage layouts, to the RQA processing pipeline. It is investigated how different realisations of these concepts affect the performance of the computations on different types of compute devices. Finally, an approach based on automatic performance tuning is introduced that automatically selects well-performing RQA implementations for a given analytical scenario on specific computing hardware. Among others, it is demonstrated that the customised auto-tuning approach allows to considerably increase the efficiency of the processing by adapting the implementation selection.eng
dc.language.isoeng
dc.publisherHumboldt-Universität zu Berlin
dc.rights(CC BY-NC-ND 3.0 DE) Namensnennung - Nicht-kommerziell - Keine Bearbeitung 3.0 Deutschlandger
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/de/
dc.subjectParalleles Rechnenger
dc.subjectParalleler Algorithmusger
dc.subjectMaschinelles Lernenger
dc.subjectRekurrenzanalyseger
dc.subjectNichtlineare Zeitreihenanalyseger
dc.subjectparallel computingeng
dc.subjectparallel algorithmeng
dc.subjectmachine learningeng
dc.subjectrecurrence analysiseng
dc.subjectnonlinear time series analysiseng
dc.subject.ddc004 Datenverarbeitung; Informatik
dc.subject.ddc000 Informatik, Informationswissenschaft, allgemeine Werke
dc.subject.ddc005 Computerprogrammierung, Programme, Daten
dc.titleScalable and Efficient Analysis of Large High-Dimensional Data Sets in the Context of Recurrence Analysis
dc.typedoctoralThesis
dc.identifier.urnurn:nbn:de:kobv:11-110-18452/19518-1
dc.identifier.doihttp://dx.doi.org/10.18452/18797
dc.date.accepted2017-12-01
dc.contributor.refereeLeser, Ulf
dc.contributor.refereeDransch, Doris
dc.contributor.refereeTeubner, Jens
dc.subject.rvkSK 845
dc.subject.rvkST 530
local.edoc.pages309
local.edoc.type-nameDissertation
local.edoc.institutionMathematisch-Naturwissenschaftliche Fakultät

Show simple item record