Ich bin heute damit beschäftigt, bestimmte Dokumente in ein anderes Format zu übertragen.
Diese Dokumente haben sich wieder einmal völlig unvorhergesehen geändert – natürlich gerade dann, als ich bei meinen Eltern war.
Jetzt muss ich meine Version entsprechend aktualisieren.
Der Zweck des Ganzen ist es, aus menschenlesbaren Texten maschinenlesbare Daten zu machen, die man dann automatisiert weiterverarbeiten kann.
So sitze ich jetzt heute schon seit mehreren Stunden da und copy’n’paste. Das ist stupide, fehlerträchtige Arbeit, aber man muss doch Konzentration und – für spezielle Fälle – auch Gehirnschmalz hineinstecken. Es ist gar nicht einfach, bei mehreren Tausend Seiten immer den Überblick zu behalten. Und da die Dokumente nicht streng sequenziell aufgebaut sind, muss ich ständig rauf und runter scrollen.
Das blödeste dabei ist, dass ich meinen Zeitaufwand keinem Kunden direkt in Rechnung stellen kann. Ich muss es aber trotzdem tun, um meine Daten auf dem Laufenden zu halten. Schließlich mache ich auch gerade mit diesen Daten mein Geschäft. Und den Aufwand dafür lege ich dann eben über meinen Stundensatz auf die Kunden um.
Es ist ja nicht so, dass ich mich nur immer als Programmierschlampe betätige oder mich mit Kunden vergnüge. Gelegentlich sind auch solche Arbeiten fällig.
Um welche (Art von) Dokumente(n) geht es denn?
LikeLike
PDF. Ich musste die relevanten Ausschnitte (auch Tabellen 😦 ) erstmal in ein simples ASCII-Textfile übertragen, und dann mit einem Konverter (Marke Eigenbau) in ein proprietäres Binärformat umwandeln.
Tatsächlich ist die Sache um einiges komplexer als simples Copy’n’Paste.
Um was es dabei eigentlich geht, habe ich aber bewusst unklar gelassen, und ich werde es auch jetzt nicht genauer schreiben.
Es handelt sich eher um ein Nischenthema (kleiner, überschaubarer Markt innerhalb einer bestimmten Branche), bei dem ich – zusammen mit ein paar Kollegen (oder besser gesagt Konkurrenten) – eine Art Oligopol halte.
Wenn ich konkreteres schreiben würde, wäre es ein Klacks, mich zu identifizieren. Und das wollen wir doch alle nicht. 🙂
LikeLike
Nein, das wollen wir alle nicht.
Aber wozu in ein Binärformat wandeln?
LikeLike
Weil es nicht nur reiner Text ist (gerade der Text ist eher irrelevant, steht halt da, damit der menschliche Leser etwas versteht), sondern auch Zahlen, Verknüpfungen, usw.
Das muss ich in eine Art Datenbank-Strukur bringen. XML würde die Sache zu sehr aufblähen und ist von der Performance her ganz mies.
LikeLike
Das macht mich neugierig.
LikeLike
DreihundertfünfundfünfzigDie haben wieder daran herumgepfuscht. Anders als Pfusch kann ich das leider nicht bezeichnen.
Das ganze Zeugs ist mittlerweile dermaßen verkorkst!
IMHO wäre es das vernünftigeste, da einen sauberen Schnitt zu machen, und den ganzen Kram von vorn n…
LikeLike
Pingback: Dreihundertfünfundfünfzig | breakpoint
Pingback: breakpoint’s Wayback Archive #13 //1682 | breakpoint