Der L1 Cache ist bei den Prozessoren der kleinste und schnellste, nehmen wir als Beispiel mal direkt AMDs neue Architektur:
L1
Quelle: Computerbase
Der L1 Cache wird also in Zukunft weiter schrumpfen, bisher hatten wir 128kB, dafür erhält ein L3 Cache Einzug in die Prozessorkerne von AMD.
Kleiner Auszug aus Wikipedia zum Proessor Cache:
Bei CPUs kann der Cache direkt im Prozessor integriert oder extern auf der Hauptplatine plaziert sein. Je nach Ort des Caches arbeitet dieser mit unterschiedlichen Taktfrequenzen: Der L1 ist fast immer direkt im Prozessor integriert und arbeitet daher mit dem vollen Prozessortakt - also u. a. mehrere Gigahertz. Ein externer Cache hingegen wird oftmals nur mit mehreren hundert Megahertz getaktet.
Gängige Größen für L1-Caches sind 4 bis 256 KiB und für den L2 256 bis 2048 KiB.
Moderne Prozessoren haben getrennte L1-Caches für Programm und Daten, teilweise ist das auch noch beim L2 der Fall (Montecito). Man spricht hier von einer Harvard-Cachearchitektur. Das hat den Vorteil, dass man für die unterschiedlichen Zugriffsmuster für das Laden von Programmcode und Daten unterschiedliche Cachedesigns verbauen kann. Außerdem kann man bei getrennten Caches diese räumlich besser zu den jeweiligen Einheiten auf dem Prozessor-Die plazieren und damit die kritische Pfade beim Prozessorlayout verkürzen. Desweiteren können Instruktionen und Daten gleichzeitig gelesen / geschrieben werden. Der Nachteil ist, dass selbstmodifizierender Code nicht sehr gut auf modernen Prozessoren läuft. Das gibt es aber nur noch sehr selten, so dass dies zu verschmerzen ist.