1. Weiterleitung zu NetzLiving.de
  2. Forum
    1. Unerledigte Themen
  3. zum neuen Forum
  • Anmelden
  • Suche
Dieses Thema
  • Alles
  • Dieses Thema
  • Dieses Forum
  • Seiten
  • Forum
  • Erweiterte Suche
  1. Informatik Forum
  2. Webmaster & Internet
  3. Entwicklung

Suche gute (freie) Search Engine für HTML und PDF

  • Myc0rrhizal
  • 16. November 2006 um 18:12
  • Unerledigt
Hallo zusammen,

das Informatik-Forum geht in den Archivmodus, genaue Informationen kann man der entsprechenden Ankündigung entnehmen. Als Dankeschön für die Treue bekommt man von uns einen Gutscheincode (informatikforum30) womit man bei netzliving.de 30% auf das erste Jahr sparen kann. (Genaue Infos sind ebenfalls in der Ankündigung)

Vielen Dank für die Treue und das Verständnis!
  • Myc0rrhizal
    Gast
    • 16. November 2006 um 18:12
    • #1

    Kennt jemand eine gute freie search engine die ich auf miener hp einbinden kann. Lieber wäre es mir mit index suche - aber auf jeden fall soll sie auch in pdf suchen können.

    Und je einfacher zum einbinden desto besser!

  • Myc0rrhizal
    Gast
    • 19. November 2006 um 13:31
    • #2

    Gut ich habe bei planetsearch was gefunden, falls es wen interresiert.

  • Marky
    Punkte
    310
    Beiträge
    59
    • 19. November 2006 um 13:39
    • #3

    ginge das nicht auch einfach mit der google-suche?

  • xnay
    Punkte
    998
    Beiträge
    187
    • 19. November 2006 um 14:26
    • #4
    Zitat von For3st

    Gut ich habe bei planetsearch was gefunden, falls es wen interresiert.


    Planetsearch durchsucht auch PDFs?

  • Swoncen
    Punkte
    5.331
    Beiträge
    993
    • 19. November 2006 um 14:48
    • #5

    Ich hab mal so eine Suchmaschine programmiert, allerdings nur für PDF's durchsuchen.

  • Myc0rrhizal
    Gast
    • 19. November 2006 um 14:51
    • #6

    1. Nein da man nicht beinflussen kann welche seiten einer homepage google indiziert - bei mir sind es nur so 5 von ca. 40

    2.Nein ist aber sonst die beste - hab keine gute freie gefunden die pdfs durchsucht. AUßerdem wollt ich eine indizierte suche haben um bandbreite zu sparen und da is die auswahl noch geringer.

    3.Ja interressant wäre es die routine zu erweitern, aber das mach ich wenn ich zeit hab

  • kartoo
    Punkte
    5
    Beiträge
    1
    • 11. Mai 2007 um 09:09
    • #7

    versuch mal auf http://www.kartoo.com

  • a9bejo
    Punkte
    4.697
    Beiträge
    913
    • 11. Mai 2007 um 20:59
    • #8

    Lucene ist die freie search engine schlecht hin. Ich habe schon einige Projekte mit Lucene gemacht
    und was Performance und Features betrifft kenn ich nichts, was dem gleichkommt. Die Suche auf
    Wikipedia.org basiert z.B. auf Lucene.

    Mit Lucene kannst Du (unter anderem) Text indizieren und darin suchen. Wie du an den zu indexierenden
    Text kommst, bleibt allerdings Dir überlassen. Lucene ist kein Crawler, und es macht auch keine Datenextraktion.
    Dafür gibt es dann aber z.B. PDFBox, eine Open Source Lösung mit der du den Text aus PDF dateien auslesen
    kannst.

    Sowohl Lucene als auch PDFBox sind in Java geschrieben, allerdings gibt es fuer Lucene ports
    fuer alle moeglichen Plattformen, darunter auch fuer PHP/ZEND.

  • Maximilian Rupp 27. Dezember 2024 um 12:05

    Hat das Thema aus dem Forum Programmieren nach Entwicklung verschoben.

  1. Datenschutzerklärung
  2. Impressum