Bei selbst eingescannten Dokumenten gaht das jedoch nicht. Ist das auf irgendeine Weise auch hier möglich?
Ein selbst eingescanntes Dokument ist zunächst einmal ein Bild.
Auch wenn dieses Bild in eine PDF-Datei eingebettet wurde, ist es immer noch ein Bild.
Das Bild könnte man mit den Mitteln der Bildbearbeitung auch verändern. Die Arbeitsweise ist dann aber dennoch eine ganz andere als Du sie oben mit der "erhaltenen PDF-Datei" beschrieben hast. Und ein "brauchbares" Ergebnis wirst Du nur erzielen, wenn Du bereits hinreichende Erfahrungen mit der Bildbearbeitung hst.
Die "erhaltene PDF"-Datei wiederum enthält den Text nicht in Form eines Bildes sondern in editierbarer Form, deswegen kannst Du ihn (in gewissen Grenzen) relativ einfach bearbeiten.
Damit Du ein selbst eingescanntes Bild ähnlich bearbeiten kannst, wie Du es bei der "erhaltenen PDF-Datei" beschrieben hast, müsstest Du es zunächst mit OCR in editierbaren Text umwandeln.
Das Problem dabei: Das Original-Layout wird dabei nicht komplett erhalten bleiben. Den reinen Text kann man zwar extrahieren (und so später auch bearbeiten). Aber das Ergebnis sieht dann eben nicht mehr 100%ig so aus, wie das Original-Dokument.
Ist das denn ein häufiges Szenario, dass Du ein selbst eingescanntes Dokument verändern musst und dabei das Original-Layout erhalten bleiben soll?
Generell ist das PDF-Format eigentlich nicht für die Weiterbearbeitung durch den Empfänger eines Dokuments gedacht, was man an den hier diskutierten Problemen gut erkennen kann.