App installieren
How to install the app on iOS
Follow along with the video below to see how to install our site as a web app on your home screen.
Anmerkung: This feature may not be available in some browsers.
Du verwendest einen veralteten Browser. Es ist möglich, dass diese oder andere Websites nicht korrekt angezeigt werden.
Du solltest ein Upgrade durchführen oder ein alternativer Browser verwenden.
Du solltest ein Upgrade durchführen oder ein alternativer Browser verwenden.
Allg. Durchsuchbares Archiv erstellen
- Ersteller psychocyberdisc
- Erstellt am
psychocyberdisc
Grand Admiral Special
- Mitglied seit
- 31.03.2004
- Beiträge
- 2.517
- Renomée
- 151
- Standort
- Mystery Lake
- Mein Laptop
- OMEN by HP Laptop 16-c0095ng (4S1B8EA#ABD) // 16 Zoll
- Prozessor
- AMD Ryzen 9 5900HX (Cezanne, 3300 MHz, bis zu 4600 MHz, 4 MB L2-Cache, 16 MB L3-Cache)
- Mainboard
- HP 8912 (BIOS F.22 und AGESA CezannePI-FP6 1.0.0.Fa)
- Speicher
- 2 × Samsung M471A4G43AB1-CWE (64 GB, DDR4-3200)
- Grafikprozessor
- AMD Radeon Graphics, NVIDIA GeForce RTX 3070 Laptop GPU
- Display
- 2560 × 1440 Bildpunkte, 300 cd/m², 165 Hz // HP EliteDisplay E273q (1FH52AA#ABB)
- SSD
- Samsung SSD 970 EVO Plus (2 TB) // Samsung Portable SSD T7 (2 TB)
- Optisches Laufwerk
- Pioneer BDR-XD05T (BD-RE, extern)
- Soundkarte
- Realtek High Definition Audio
- Gehäuse
- OMEN by HP Laptop 16-c0xxx
- Netzteil
- 230 Watt
- Tastatur
- Cherry G81-3000LPDDE-0 // ohne Windows-Tasten
- Maus
- Razer DeathAdder V2 auf Func Surface 1030² XL
- Betriebssystem
- Microsoft Windows 10 Pro Version 22H2 (2022 Update)
- Webbrowser
- Google Chrome mit uBlock Origin
- Verschiedenes
- HP USB-C Dock G5 (5TW10AA#ABB), beyerdynamic MMX 300 Manufaktur, AVM FRITZ!Box 6690 Cable
- Internetanbindung
-
▼50 Mbit/s
▲25 Mbit/s
Hallo,
zur Umsetzung des folgenden Projekts habe ich ein paar Fragen:
Eine enorme Anzahl an Pressetexten aus Zeitungen und Zeitschriften soll digitalisiert und in ein durchsuchbares Archiv gebracht werden. Im Moment weiß ich noch nicht, ob die Texte per OCR bearbeitet werden sollen und ob ein Einzugsscanner zur Verfügung stehen wird.
In jedem Fall müssen die Texte eingescannt werden. Welches Dateiformat ist für die Archivierung wohl zu wählen? Das PDF-Format? Sollte man hierzu günstigerweise die Scannerfunktion "Scan to PDF" nutzen?
Das Archiv soll von mehreren PCs aus durchsuchbar sein. Benötigt man dazu ein Content-Management-System zusätzlich zum OCR-Programm? Erhält man mit einem solchen Content-Management-System eine Suchmaske und eine Weboberfläche ähnlich wie bei den Suchmaschinen?
Oder kann man das auch einfacher via Netzwerk lösen? Ich dachte an einen FTP-Server; die Verzeichnisse des FTP-Servers (beziehungsweise das Hauptverzeichnis ) müssten dann - irgendwie - unter Windows über einen Laufwerksbuchstaben ansprechbar sein. Allerdings ist es um die Durchsuchbarkeit bei der FTP-Lösung wahrscheinlich nicht so gut bestellt.
Fragen über Fragen - und ziemliche Ratlosigkeit. Ich bin leicht überfordert. Wer kann mir mit Ideen und Tipps bei der Planung und Umsetzung helfen?
zur Umsetzung des folgenden Projekts habe ich ein paar Fragen:
Eine enorme Anzahl an Pressetexten aus Zeitungen und Zeitschriften soll digitalisiert und in ein durchsuchbares Archiv gebracht werden. Im Moment weiß ich noch nicht, ob die Texte per OCR bearbeitet werden sollen und ob ein Einzugsscanner zur Verfügung stehen wird.
In jedem Fall müssen die Texte eingescannt werden. Welches Dateiformat ist für die Archivierung wohl zu wählen? Das PDF-Format? Sollte man hierzu günstigerweise die Scannerfunktion "Scan to PDF" nutzen?
Das Archiv soll von mehreren PCs aus durchsuchbar sein. Benötigt man dazu ein Content-Management-System zusätzlich zum OCR-Programm? Erhält man mit einem solchen Content-Management-System eine Suchmaske und eine Weboberfläche ähnlich wie bei den Suchmaschinen?
Oder kann man das auch einfacher via Netzwerk lösen? Ich dachte an einen FTP-Server; die Verzeichnisse des FTP-Servers (beziehungsweise das Hauptverzeichnis ) müssten dann - irgendwie - unter Windows über einen Laufwerksbuchstaben ansprechbar sein. Allerdings ist es um die Durchsuchbarkeit bei der FTP-Lösung wahrscheinlich nicht so gut bestellt.
Fragen über Fragen - und ziemliche Ratlosigkeit. Ich bin leicht überfordert. Wer kann mir mit Ideen und Tipps bei der Planung und Umsetzung helfen?
Dalai
Grand Admiral Special
- Mitglied seit
- 14.06.2004
- Beiträge
- 7.420
- Renomée
- 262
- Standort
- Meiningen, Thüringen
- Mein Laptop
- Thinkpad T43 mit 15" UXGA (1600x1200), 2x 1 GiB RAM, 100GB HD, Bluetooth, GBit LAN, ATi X300
- Prozessor
- AMD Ryzen 5 2600 (Pinnacle Ridge)
- Mainboard
- ASUS Prime X370-A
- Kühlung
- Noctua NH-U12S mit 1x NF-F12
- Speicher
- Crucial Ballistix Sport LT weiß (BLS2K8G4D32AESCK): 2x 8 GiB DDR4-3200 (CL16) @ 1,25V
- Grafikprozessor
- Zotac GeForce GTX 1060 6GB AMP Edition
- Display
- Dell U2410, 24 Zoll, IPS, 16:10
- SSD
- Samsung 850 Evo 250 GB
- HDD
- WD40EZRZ (WD Blue) 4000GB SATA3, WD20EZRX (WD Green) 2000GB SATA3
- Optisches Laufwerk
- Pio DVR-212 (DVD-RAM), ASUS E818A6T (DVD-ROM), Pio DVD-106S (Slot-in DVD-ROM)
- Soundkarte
- Creative SoundBlaster Audigy 2 ZS PCI
- Gehäuse
- Lian Li PC-8NB Midi-Tower
- Netzteil
- Enermax EMP400AGT MaxPro 400W
- Betriebssystem
- Windows 7 Professional x64 und immer mal wieder ein neues Linux :-)
- Webbrowser
- Mozilla Firefox mit diversen Erweiterungen
- Verschiedenes
- 2x 120mm Gehäuselüfter (Front und Rückwand), DVBSky T9580, Sharkoon Frontpanel B (2x USB 3.0)
Wenn das Ding durchsuchbar sein soll, muss eine OCR genutzt werden, denn sonst sind das ja nur Grafiken (ob in PDF eingebettet oder nicht, spielt keine Rolle). Welche OCR benutzt wird, ist erstmal zweitrangig.
Die Benutzung eines FTP-Servers kannste gleich wieder vergessen, weil weder das Verknüpfen als Laufwerk problemlos funktioniert noch das Benutzen selbst. Bei FTP müssen die Dateien immer komplett übertragen werden, damit damit was angestellt werden kann.
Ich hoffe, ich habe etwas helfen können, auch wenn mir keine große fertige Lösung bekannt ist.
MfG Dalai
Tja, man sollte versuchen, ein Dokumentenformat zu wählen, was möglichst lange noch gelesen werden kann. PDF ist sicherlich nicht ganz schlecht, besser wäre ODF, aber ich schätze, dass dort die softwareseitige Unterstützung noch nicht so doll ist... HTML wäre ggf. auch noch ne Möglichkeit - damit wäre auch die Durchsuchbarkeit gewährleistet und es funktioniert auch in Jahren, evtl. Jahrzehnten noch.psychocyberdisc schrieb:Welches Dateiformat ist für die Archivierung wohl zu wählen?
Diese Funktion wird vermutlich eine Grafik in ein PDF einbetten. Mit Durchsuchen ist es dann Asche. Ich fürchte, du kommst um eine größere Lösung nicht herum. Entweder etwas schon existierendes oder du musst die Einzelprogramme versuchen zu skripten (Batch, Parameter, programminterne Funktionen zum Stapeln von Aufträgen oder schlimmstenfalls AutoIt).psychocyberdisc schrieb:Sollte man hierzu günstigerweise die Scannerfunktion "Scan to PDF" nutzen?
Hier ist die Frage, wie du dir das Durchsuchen bzw. Benutzen vorstellst. Man kann natürlich eine einfache Freigabe machen, die von allen genutzt werden kann. Aber genausogut ist es möglich, dass in einer größeren Lösung (die wohl Einiges an Geld kosten dürfte) Interfaces existieren, die das Durchsuchen und Verwalten vereinfachen.psychocyberdisc schrieb:Das Archiv soll von mehreren PCs aus durchsuchbar sein. Benötigt man dazu ein Content-Management-System zusätzlich zum OCR-Programm?
Die Benutzung eines FTP-Servers kannste gleich wieder vergessen, weil weder das Verknüpfen als Laufwerk problemlos funktioniert noch das Benutzen selbst. Bei FTP müssen die Dateien immer komplett übertragen werden, damit damit was angestellt werden kann.
Ich hoffe, ich habe etwas helfen können, auch wenn mir keine große fertige Lösung bekannt ist.
MfG Dalai
Ähnliche Themen
- Antworten
- 0
- Aufrufe
- 142K