Sievers, Gregor: Entwurfsraumexploration eng gekoppelter paralleler Rechnerarchitekturen. 2016
Inhalt
- Einleitung
- Systemarchitektur eines eng gekoppelten Prozessorclusters
- Stand der Technik eingebetteter Multiprozessoren
- Der VLIW-Prozessor CoreVA
- Speicher in eingebetteten Systemen
- Lokaler Level-1-Speicher
- Eng gekoppelter gemeinsamer Level-1-Datenspeicher
- Gemeinsamer Level-2-Speicher
- Vergleich verschiedener Speicherarchitekturen
- Eng gekoppelte On-Chip-Verbindungsstrukturen
- Verbreitete Bus-Standards
- Implementierungen von Verbindungsstrukturen
- Stand der Technik
- Bus-Standards im Vergleich
- Arbiter
- Der CPU-Cluster des CoreVA-MPSoCs
- Synchronisierung und Kommunikationsmodelle
- Mutex
- Nachrichtenbasierte Kommunikation
- Stand der Technik
- Synchronisierung im CPU-Cluster des CoreVA-MPSoCs
- Zusammenfassung
- Hardware- und Software-Entwurfsumgebung
- Hardware-Entwurfsablauf
- Software-Entwurfsumgebung
- Software-Basisfunktionen
- LLVM-basierter Compiler für die CoreVA-CPU
- CoreVA-MPSoC-Compiler für Streaming-Anwendungen
- Das CoreVA-MPSoC als OpenCL-Plattform
- Funktionale Verifikation durch Simulation und Emulation
- Zusammenfassung
- Bewertungsmaße und Modellierung
- Ressourcen und Bewertungsmaße eingebetteter Multiprozessorsysteme
- Modellierung der Ausführungszeit von parallelen Anwendungen
- Stand der Technik
- Ein analytisches Modell für die Performanz von parallelen Anwendungen
- Integration des analytischen Modells in den CoreVA-MPSoC-Compiler
- Ein Modell zur simulationsbasierten Abschätzung der Ausführungszeit
- Ein Modell für den Hardware-Ressourcenbedarf des CoreVA-MPSoCs
- Eine abstrakte Systembeschreibung des CoreVA-MPSoCs
- Zusammenfassung
- Entwurfsraumexploration des CPU-Clusters im CoreVA-MPSoC
- Beispielanwendungen
- Analyse der CoreVA-CPU für die Verwendung in einem Multiprozessorsystem
- Untersuchung der betrachteten VLIW-Konfigurationen
- CPU-Cluster-Schnittstelle
- CPU-Makros für die Verwendung im CoreVA-MPSoC
- Vergleich verschiedener VLIW-Konfigurationen im CPU-Cluster
- Synchronisierungsverfahren und Speicherarchitekturen im Vergleich
- C-basierte Implementierung einer Matrixmultiplikation
- Entwurfsraumexploration der Cluster-Verbindungsstruktur
- Abbildung von Streaming-Anwendungen auf den CPU-Cluster
- Registerstufen
- Bus-Standards und Topologien
- Gemeinsamer Level-2-Speicher
- Eng gekoppelter gemeinsamer L1-Datenspeicher
- Ein L1-Instruktionscache für die Verwendung im CoreVA-MPSoC
- Analyse des Energiebedarfs von Kommunikation im CPU-Cluster
- OpenCL-Anwendungen mit gemeinsamem L1- oder L2-Datenspeicher
- Zusammenfassung
- Prototypische Implementierung
- Zusammenfassung und Ausblick
- Abbildungsverzeichnis
- Tabellenverzeichnis
- Abkürzungsverzeichnis
- Referenzen
- Eigene Veröffentlichungen
- Betreute Arbeiten
- Anhang
