1. Dashboard
  2. Forum
    1. Unerledigte Themen
  3. Mitglieder
    1. Letzte Aktivitäten
    2. Benutzer online
    3. Team-Mitglieder
    4. Trophäen
    5. Mitgliedersuche
  4. Tutorial Bereich
  • Anmelden
  • Registrieren
  • Suche
Dieses Thema
  • Alles
  • Dieses Thema
  • Dieses Forum
  • Seiten
  • Forum
  • Lexikon
  • Erweiterte Suche
  1. Informatik Forum
  2. Webmaster & Internet
  3. Entwicklung

Hilfe

  • outoftime
  • 4. Juli 2008 um 23:42
  • Unerledigt
  • outoftime
    3
    outoftime
    Mitglied
    Punkte
    65
    Beiträge
    9
    • 4. Juli 2008 um 23:42
    • #1

    hi!
    mein chef hat einige hunderte eingescannte dateien und ich soll irgendwie eine lösung finden, wie er eine "bessere" übersicht bekommt und bei problemen nicht alle dateien durchgehen muss, damit er eine information findet...

    was kann ich denn da machen? das wär ja quasi eine datenbank, oder?
    wenn ja, gibts auch für eingescannte dokumente eine lösung?

    wäre für jede hilfe sehr dankbar bzw. auch für tipps, wo ich hilfe finden kann!
    danke!!!

    lg

  • Paulchen
    1
    Paulchen
    Gast
    • 4. Juli 2008 um 23:44
    • #2

    Welche Art von Informationen befinden sich in den eingescannten Dateien? Text? Bilder? ...?

  • mdk
    26
    mdk
    Emeritus
    Reaktionen
    130
    Punkte
    7.120
    Beiträge
    1.390
    • 4. Juli 2008 um 23:45
    • #3

    Toller Threadtitel. Fehlen nur noch ein paar Rufzeichen.

  • outoftime
    3
    outoftime
    Mitglied
    Punkte
    65
    Beiträge
    9
    • 4. Juli 2008 um 23:45
    • #4

    fast nur texte, ein paar graphiken auch (statistiken)

  • outoftime
    3
    outoftime
    Mitglied
    Punkte
    65
    Beiträge
    9
    • 4. Juli 2008 um 23:47
    • #5

    weil ich null ahnung habe, unter was ich das einordnen kann, hätte ich eine lange zeile gebraucht, um einen passenden threadtitel zu finden :)

  • spinball
    11
    spinball
    Mitglied
    Reaktionen
    67
    Punkte
    1.192
    Beiträge
    223
    • 4. Juli 2008 um 23:59
    • #6

    Die erste Methode, die mir einfällt: Mit einem Texterkennungsprogramm sämtliche Wörter aus den Bildern extrahieren und in einer Textdatei abspeichern. Die Textdatei kannst du dann mit einem beliebigen Textverarbeitungsprogramm primitiv durchsuchen.

    Die bessere Methode: Eine Datenbank anlegen. Jeder Datensatz enthält das eingescannte Bild, den mit einem Texterkennungsprogramm extrahierten Reintext und optional die Seitennummer, falls du die originalen Dokumente kreuzreferenzieren möchtest. Moderne Datenbanken bieten weitaus bessere Suchmöglichkeiten, als reine Textverarbeitungsprogramme. Allerdings ist diese Methode auch zeitaufwendiger, lieber outoftime.

  • a9bejo
    21
    a9bejo
    Mitglied
    Reaktionen
    42
    Punkte
    4.697
    Beiträge
    913
    • 5. Juli 2008 um 08:39
    • #7

    Bevor Du ueber die Umsetzung nachdenken kannst, musst Du die tatsaechlichen Anforderungen herausfinden. "Eingescannte Dokumente besser organisieren" ist noch kein Usecase, anhand dem man eine Software bauen kann.

    Die ersten Fragen die sich mir da stellen: Was sind denn das fuer Dokumente, und was macht Dein Chef? Wie sieht denn so eine Suchanfrage tatsaechlich aus? Wie gross ist das Budget fuer dieses Projekt?

    Wenn Dein Chef im Textinhalt suchen muss, brauchst du Schrifterkennung. Das kann ziemlich schlechte Qualitaet liefern, je nachdem was Da fuer Dokumente dabei sind (handgeschriebene Notizen z.b.). Die Ergebnisse kommen dann vielleicht in einen Suchindex wie Solr und es gibt ein Frontend.

    Wenn es wie Du sagst nur ein paar hundert Dokumente sind, und wenn Dein Chef nach bestimmten Kategorien sucht (z.b. alle Dokumente zu Projekt x im Zeitraum Y), dann macht es vielleicht Sinn, die Daten zu taggen: Also Die Dokumente werden manuell mit Stichwoerten versehen (z.b. von einem Praktikanten), und Dein chef tagged neue Dokumente selbst nach, wenn er sie einscannt. Das ist dann vor allem eine Datenbank oder ein Solr Index mit einem Admin Frontend.

    Je nach den tatsaechlichen Anforderungen kann die effizienteste Loesung auch sein, die Daten fuer deinen Chef einfach sinnvoller in Unterverzeichnissen abzulegen

    Und zum Abschluss noch ein Tip: Es gibt bereits fuer alle grossen Betriebsysteme kostenlose Desktopsuchmaschinen. D.h. wenn dein Scanner OCR macht, dann kann Google Desktop, Beagle, Stringi, Recoll Spotlight, das Microsoft Ding oder was auch immer Deine Daten indizieren und Dein Chef kann danach suchen. Das ist vermutlich am billigsten, wenn es Volltextsuche sein soll.


    Zitat von outoftime

    weil ich null ahnung habe, unter was ich das einordnen kann, hätte ich eine lange zeile gebraucht, um einen passenden threadtitel zu finden :)

    Vorschlag fuer einen Titel, der besser gewesen waehre: "Suche in eingescannten Dokumenten".

    lg, Benjamin Ferrari, bookworm.at

    3 Mal editiert, zuletzt von a9bejo (5. Juli 2008 um 08:46)

  • phudy
    10
    phudy
    Mitglied
    Reaktionen
    12
    Punkte
    1.087
    Beiträge
    182
    • 5. Juli 2008 um 10:50
    • #8
    Zitat von mdk

    Toller Threadtitel. Fehlen nur noch ein paar Rufzeichen.

    fullack :sudern:

  • outoftime
    3
    outoftime
    Mitglied
    Punkte
    65
    Beiträge
    9
    • 25. Juli 2008 um 22:36
    • #9

    vielen dank für die antworten!

    naja das problem ist, dass ich der praktikant sein werde! die info habe ich erst erhalten und mache mir jetzt schon gedanken, wie ich das problem lösen könnte... er meinte sie haben zahlreiche eingescannte dokumente (einige hundert, aber computerschrift!) und er möchte nicht alle möglichen durchstöbern, um manche infos zu bekommen....

    @datenbank:
    könnte ich access für die stichwörter oder den text (durch texterkennungsprogramm rausgenommen) dafür verwenden?
    wenn ja, dann werd ich mich halt in access ordentlich einlesen müssen....

    fällt euch eine leichte variante ein, wie ich eben diese stichwörter oder die ganzen texte durch eine datenbank abfragen kann? was mach ich da am besten?

    desweiteren soll ich nach einer lösung suchen, wie die diagramme in excel "lebendiger" werden,... er meint er möchte das viel veranschaulichter haben, als sie zur zeit vorhanden sind...
    was da genau ist, bekomm ich in einer woche raus, wo ich mein praktikum anfangen werde :)

  • outoftime
    3
    outoftime
    Mitglied
    Punkte
    65
    Beiträge
    9
    • 25. Juli 2008 um 22:39
    • #10

    übrigens... kennts ihr gute bücher über excel und access? oder hilfreiche seiten, wo ich mich "einlesen" könnte?

    danke

  • a9bejo
    21
    a9bejo
    Mitglied
    Reaktionen
    42
    Punkte
    4.697
    Beiträge
    913
    • 26. Juli 2008 um 11:48
    • #11
    Zitat von a9bejo


    Und zum Abschluss noch ein Tip: Es gibt bereits fuer alle grossen Betriebsysteme kostenlose Desktopsuchmaschinen. D.h. wenn dein Scanner OCR macht, dann kann Google Desktop, Beagle, Stringi, Recoll Spotlight, das Microsoft Ding oder was auch immer Deine Daten indizieren und Dein Chef kann danach suchen. Das ist vermutlich am billigsten, wenn es Volltextsuche sein soll.


    +
    http://www.pdfzone.com/c/a/Search/Goo…les-PDF-Search/

    lg, Benjamin Ferrari, bookworm.at

  • outoftime
    3
    outoftime
    Mitglied
    Punkte
    65
    Beiträge
    9
    • 27. Juli 2008 um 09:44
    • #12

    ah danke :)

  • Maximilian Rupp 27. Dezember 2024 um 12:04

    Hat das Thema aus dem Forum Programmieren nach Entwicklung verschoben.

Jetzt mitmachen!

Sie haben noch kein Benutzerkonto auf unserer Seite? Registrieren Sie sich kostenlos und nehmen Sie an unserer Community teil!

Benutzerkonto erstellen Anmelden

Tags

  • hilfe
  • holunderblütensirup
  • marty mcfly

Benutzer online in diesem Thema

  • 1 Besucher

Rechtliches

Impressum

Datenschutzerklärung