Solr (lucene-search) auf dem RP - Volltextsuche

Heute ist Stammtischzeit:
Jeden Donnerstag 20:30 Uhr hier im Chat.
Wer Lust hat, kann sich gerne beteiligen. ;)
  • Hallo zusammen,

    nach einigen Spielereien habe ich nun neue Pläne mit meinem RP.
    Da ich eine relativ große Newslettersammlung habe (~4000 Stk.), welche beständig wächst, möchte ich gerne eine Volltextsuche einrichten, welche ich auch auserhalb des Heimnetzes (ggf. über DNS) erreichen kann. Diese soll die Datein durchsuchen und Treffer ausgeben (inkl. Download bzw. Anzeigen der entsprechenden Datein)
    Nach einigen Versuchen, welche teilweise einfach an der Anzahl derDatein in die Knie gegangen sind, bin ich nun auf "Solr" aufmerksam geworden, welcher auf der "lucene-search-engine" aufbaut.

    Jetzt meine Frage:
    Hat schon jmd. Erfahung mit einer/dieser Volltextsuche auf dem RP gemacht?

    Die Datein liegen als .html bzw. .txt vor. Später möchte ich diese Volltextsuche ggf. auf PDFs ausweiten.

    Derzeit läuft ein Webserver auf "nginx"-Basis auf dem RP.

    _____________
    Beste Grüße
    CrazyBubbles

  • Da Lucence auf Java basiert, würde ich vermuten das es zu Problemen kommen. Ich hatte bisher mit Java Anwendungen auf dem Pi Problem. Die Anwendungen benötigten alle zu viel RAM. Ob sich das mit Lucene genauso verhält weiß ich allerdings auch nicht.

    Eine Alternative, bzw. einen Test wert, könnte auch eine MySql-Datenbank mit Volltextsuche sein.

  • Danke für den Tipp Bjoern. Das Java-Anwendungen i.d.R. so RAM-intensiv sind wusste ich nicht.
    Allerdings habe ich auch schon einmal versucht eine Suche auf MySql-Basis zu implementieren, bin jedoch bei der "Indexierung", vermutlich durch fehlende Kenntnisse auf dem Bereich, trotz Tutorial gescheitert.

    Kennst du zufällig noch eine idiotensichere Beschreibung ;). Leider habe ich derzeit kaum Zeit mich in das Thema in ausreichendem Umfang einzuarbeiten (ich weiß - nicht ideal ...).

    _____________
    Beste Grüße
    CrazyBubbles

    • Offizieller Beitrag


    ...Das Java-Anwendungen i.d.R. so RAM-intensiv sind wusste ich nicht....
    _____________
    Beste Grüße
    CrazyBubbles


    Da musste ich wirklich schmunzeln :D

    Du könntest dir Sphinx mal anschauen, das kann auf auch auf ARM compliert werden. Allerdings wirst du ohne Einarbeitung wohl keinen Erfolg haben ;)

    Der Unterschied zwischen Genie und Wahnsinn definiert sich im Erfolg.

    Einmal editiert, zuletzt von dbv (10. Juni 2013 um 11:26)


  • Du könntest dir Sphinx mal anschauen


    Sieht auf den ersten Blick ganz gut aus. Werde ich mir einmal näher anschauen. Danke für den Tipp.



    Generell benötigt der Rpi Computer Kenntnisse

    Ist ja nicht so, als ob ich gar keine Ahnung hätte, nur eine Eierlegendewollmilchsau bin ich dann eben doch nicht, sodass ich HTML, PHP, MySql, C, Perl, Java, etc. aus dem FF beherrsche ;)

    Einmal editiert, zuletzt von CrazyBubbles (10. Juni 2013 um 13:23)

Jetzt mitmachen!

Du hast noch kein Benutzerkonto auf unserer Seite? Registriere dich kostenlos und nimm an unserer Community teil!