Korthals, Timo: Deep generative models for multi-modal perception under the influence of ambiguity. 2021

Inhalt

Deep Neural Network

Generative Models

Linking Deep Neural Networks and Generative Models

Multi-Modal Perception

Heterogeneity of Multi-Modal Data

Deep Multi-Modal Machine Learning

Conclusion and Challenges for this Work

Multi-Modal Variational Autoencoder

Preliminary Approaches

Joint Variational Autoencoder (JVAE)

Joint Multi-Modal Variational Autoencoder (JMMVAE)

M²VAE

Derivation of the Bi-Modal M²VAE

Extension to three Modalities

Conscious vs. Unconscious M²VAE

Comparison of Uni-Modal and Mixture Distribution

Evaluation of Convexity for Optimization

Auto Re-Encoding

Multi-Modal Data Sets and their Properties

Review of Available Data Sets

Proposed Data Sets

Discussion and Choice of Suitable Data Sets

Metrics, Evaluations, and Results

Scores and Metrics

Results

Hyperparameter Analysis

Ablation Study

Competitive Evaluation and Other Data Sets

Discussion

Applications

Evaluation

Rubiks

Active Sensing with Distributed and Heterogeneous Robots

Discussion

Mathematical Foundations