Beiträge von stendate

stendate · 16. Januar 2012

Zitat

Original geschrieben von frank_aus_wedau
Abgesehen von einigen Ausnahmen wandern die von mir gescanten Schriftstücke in einen Unviversalordner mit unbegrenztem Platzangebot ... aber leider ohne Wiederkehr.

Ich mach das so:

Postbote bringt die Post
Jeder Briefumschlag bekommt vor dem öffnen eine eindeutige ID inkl. Datum (wird auf dem Umschlag notiert)
Inhalt wird gescannt, PDF bekommt die ID mit in den Dateinamen und wird im Archiv abgelegt.
Original kommt in den Briefumschlag zurück
Alle Briefumschläge des gleichen Datums werden mit Tesa-Film zu einem Päckchen geschnürt und in einen Karton geworfen.
Je Kalenderjahr gibt es genau einen Karton.
Nach 10 Jahren fliegt der ganze Karton in den Ofen

Damit fnde ich im Notfall jedes Original zielsicher wieder und kann auch alle gesetzlichen Richtlinien einhalten.

stendate · 22. Dezember 2011

Man kann jetzt noch argumentieren, dass x64-Programme mehr Arbeitsspeicher benötigen können als x86-Programme (siehe [1] bei Nachteile). Man könnte sich nun überlegen ob die bevorzugten Programme mehrheitlich als x64-Version vorliegen und eben bei genau 4 GB verbautem Arbeitsspeicher auf X64 zu einer höheren Speicherbelastung führen oder eben nicht. Gegenrechnen muss man dann aber auch, dass die X86-Version von Windows eben nur "fast" 4GB RAM verwenden kann, ein Teil bleibt für immer ungenutzt.

Es dürfte m.E. einigermaßen egal sein, und da X64 das modernere System ist welches mehr Variabilität bringt, ist mir die Entscheidung nicht wirklich schwer gefallen. Im Übrigen ist RAM gerade so billig, dass 8GB auch nicht wirklich ein Problem sind.

Außerdem mache ich mir sorgen, ob es eines meiner Lieblingsprogramme noch lange als x86-Version geben wird [2].

[1] http://de.wikipedia.org/wiki/64-Bit-Architektur
[2] http://www.heise.de/ix/meldung…-den-Naehten-1393652.html

stendate · 11. November 2011

Das müsste IIRC der versteckte Ordner "C:\MSOCache" sein. Fehlt dieser, kann die Reparaturinstallation alternativ vom Datenträger vorgenommen werden.

stendate · 9. November 2011

Zitat

Original geschrieben von frank_aus_wedau
Zu welcher Lösung würdet ihr mir raten?

Hi Frank,

such dir einen Informatik-Studenten, drück ihm 3... 4 Hundert EUR in die Hand und lass dir was passendes Programmieren, was irgendeine dieser Scan-Engines benutzt die das kann was du brauchst.

Alles Andere scheint keine Lösug zu sein.

stendate · 3. November 2011

Das ist bei der Scanner-Software dabei:

Die ABBYY-Version die hier mitgeliefert wird ist sehr eingeschränkt, d.h. da kann man nur sehr grundlegende Dinge einstellen, die Steuerung übernimmt schon die Scanner-Software und ohne den Scanner ist die ABBYY-OCR anscheinend nicht verwendbar.

stendate · 3. November 2011

Ich glaub die Hölle friert zu... Frank ist zufrieden....

Ich hab diesen Flyer in meinen ScanSnap S1300 getan und auf die ScanTaste gedrückt.
Vorher hab ich in den Einstellungen noch "[x] in durchsuchbare PDF konvertieren" aktiviert, damit er es durch die mitgelieferte Abbyy-OCR durchschiebt.

http://www.fujitsu.com/us/serv…nners/scansnap/s1300.html

stendate · 3. November 2011

OK, hier mein wirklich letzter Versuch... ist zwar kein PDF/A aber es ist ein durchsuchbares PDF: Link

stendate · 29. Oktober 2011

Hier hat man TIFF-Archive nach PDF/A mit Volltext konvertiert:

http://www.pdfa.org/2006/11/an…ratech-nach-pdfa/?lang=de
http://www.pdfa.org/wp-content…/2011/08/dak-luratech.pdf

stendate · 28. Oktober 2011

Also ich hab mir das mal angeschaut und eine solche TIFF erstellt, OCR laufen lassen und dann mal im TiffTagViewer [1] geöffnet.
Einen "transparenten Layer" gibt es nicht, aber es gibt spezielle Tiff-Tags. Neben denen die wohl aus dem Tiff-Standard kommen hatt dieses Dokument u.a. für jede Seite einmal den Tag "37679" welcher den Klartext aus der OCR-Erkennung enthält. Weiterhin gibt es noch den Tag "37681", der enthält etwas kryptisches, wahrscheinlich die zugehörigen Koordinaten für die Anzeige im MODI-View-Control (wenn dann das blaue Rechteck gezeichnet wird welches den Suchtreffer markiert). Nur auf Seite 1 gibt es außerdem "37680", da steht so allgemeines "Blafasel" drin, sieht so aus wie Metadaten für MODI, also wahrscheinlich allgemeine Dokumenteneigenschaften.

D.h. MS hat hier wohl das Konzept der Tiff-Tags für eigene Zwecke erweitert, ist zwar nicht Standardkonform, aber folgt diesem zumindest so ungefähr...

PS: Öffne so eine Datei mal mit einem Texteditor... zwischen dem ganzen Gewusel an wilden unlesbaren Codes steht der Klartext aus der OCR drin.

PS2: Die MODI-Installation einfach auf'm USB-Stick zu kopieren dürfte mit Sicherheit den Lizenzvertrag verletzen, den Du beim Installieren von MS Office akzeptiert hast.

[1] http://www.awaresystems.be/imaging/tiff/astifftagviewer.html

stendate · 28. Oktober 2011

Zitat

Original geschrieben von frank_aus_wedau
Wie schaffst Du es, durchsuchbare Texte auf Rechnern zu verarbeiten, bei denen MODI nicht installiert ist? Kann man diesen MSPVIEWER auf Systemen nutzbar machen, auf denen kein passendes Office-Paket installiert ist? Das muss möglich sein; gelungen ist mir das aber nicht (obwohl ich zugebe, hier noch keine besondere Energie investiert zu haben, weil ich noch auf eine anderweitige Lösung hoffe).

Hm.. ich sag mal so.. ich nutze MODI um etwas Text von einem Screenshot (der in der Zwischenablage liegt) per OCR zu erkennen. Dazu muss ich IICR das Bild als TIFF zwischenspeichern, aber anschließend schmeiß ich das wieder weg, ich will ja nur den Text haben.

Es gibt da auch ne ActiveX-Komponente die man z.B. zur Anzeige von TIFF-Dateien nutzen kann (AxMODI.axMiDocView), diese funktioniert bei mir auch nur auf Rechnern, bei denen das "Microsoft Office Document Imaging" vollständig installiert ist.

Ohne es genau zu wissen würde ich schätzen, dass dieser Viewer (MSPVIEWER) genau die gleiche Komponente benutzt.

Beiträge von stendate

Das "Papierarme Büro"

Windows 7 32 oder 64 Bit Version auf IMac?

MS Office Formate mdi und/oder tiff verarbeiten

MS Office Formate mdi und/oder tiff verarbeiten

MS Office Formate mdi und/oder tiff verarbeiten

MS Office Formate mdi und/oder tiff verarbeiten

MS Office Formate mdi und/oder tiff verarbeiten

MS Office Formate mdi und/oder tiff verarbeiten

MS Office Formate mdi und/oder tiff verarbeiten

MS Office Formate mdi und/oder tiff verarbeiten