hier habe ich ein paar fragen und antworten gelistet, die bei installation / betrieb von openbenno mailarchiv immer wieder auftreten bzw auftreten koennten. bevor fragen an die mailingliste gestellt werden, bitte immer erstmal eine suchmaschine bemuehen um das oeffentlichen archiv der mailingliste zu durchsuchen und diese faq lesen (welche zu einem grossen teil aus der mailingliste entstanden ist).
wenn ich zeit habe und akuten anlass sehe, dann wird diese faq stetig erweitert.
mittlerweile pflege ich diese FAQ auch auf der webseite von openbenno.

letztes update: 19.11.2009

Q: Wie ist admin-Passwort von bennosearch nach der Installation?
Q: Nach dem Login in bennosearch sehe ich keine Emails, obwohl ich welche importiert bzw. zugestellt habe
Q: Wie kann ich E-Mails aus dem Archiv weiterleiten? Wenn ich auf “Mails weiterleiten” drücke, passiert garnichts.
Q: Ist das Repository sauber angelegt?
Q: Wie kann ich prüfen, ob benno-smtp läuft?
Q: Wo kann ich in bennosearch die Pfade für den Index und das Repository einstellen?
Q: Wie kann ich das Layout von bennosearch ändern?
Q: Wie kann ich Prüfen, ob mein Index in Ordnung ist?
Q: Mails sind nicht sofort sichtbar nach Einlieferung über SMTP – Betrifft: 1.0.2, 1.0.3
Q: Wie richte ich fetchmail ein?
Q: Wird beim einliefern zu Openbenno auf der Stelle nach Attachments gesucht und diese Volltext-indiziert
Q: Welche Dokumenttypen werden indiziert?
Q: Gibt es Wortlimitierungen (>3 Buchstaben < 30 oder so etwas)?
Q: Wo kann man Benutzer anlegen?
Q: Löscht OpenBenno die Emails nach Ablauf der 10-jahres Frist?
Q: Gibt es eine Möglichkeit, Duplikate aus dem Archiv zu löschen?
Q: Was ist die Datei write.lock und warum bleibt diese manchmal bestehen?
Q: Ist zur Authentifizierung eine Anbindung an ein Active Directory möglich?


Q: Wie ist admin-Passwort von bennosearch nach der Installation?

A: username: admin, passwort: passwd


Q: Nach dem Login in bennosearch sehe ich keine Emails, obwohl ich welche importiert bzw. zugestellt habe

A: Das ist so gewollt. Emails werden nur nach einer erfolgreichen Suche angezeigt. Das ist die einzig logische Aktion, denn was sollte sonst aus einem riesigen Archiv angezeigt werden? Die ersten 25 Emails, die letzten 25 Emails? Macht das sinn?


Q: Wie kann ich E-Mails aus dem Archiv weiterleiten? Wenn ich auf “Mails weiterleiten” drücke, passiert garnichts.

A: Der Button sollte eigentlich (vorerst) deaktiviert sein. Das Feature ist implementiert, [...] nur noch nicht die Integration in das Frontend getestet.
(version 1.0.1, siehe ml-archiv)


Q: Ist das Repository sauber angelegt?

A: Man kann sich die einzelnen Mail mittels zcat anschauen. Oder mit einem
java -jar bennoadmin check-consistency /srv/mailarchive/index /srv/mailarchive/repo
überprüfen, ob die Einträge in Index und Repository zueinander passen.
(version 1.0.1, siehe ml-archiv)


Q: Wie kann ich prüfen, ob benno-smtp läuft?

A: mit dem Befehl: netstat -antp|grep 2500


Q: Wo kann ich in bennosearch die Pfade für den Index und das Repository einstellen?

A: in der Datei “applicationContext-index.xml”, welche sich im verzeichnis “WEB-INF” befindet.
- Das BennoSearch WAR-File entpacken
- WEB-INF/applicationContext-index.xml anpassen
- wieder zippen.


Q: Wie kann ich das Layout von bennosearch ändern?

A: Das Layout wird mit WingS einem Java-Framework, generiert. Anpassung von außen gehen momentan nur minimal über die CSS-Datei in WEB-INF/css/.
(version 1.0.1, siehe ml-archiv)


Q: Wie kann ich Prüfen, ob mein Index in Ordnung ist?

A: mit dem tool bennoadmin:
java -jar bennoadmin.jar query /path/to/mailarchive/index/ "suchbegriff"
oder
java -jar bennoadmin.jar check-consistency /path/to/mailarchive/repository /path/to/mailarchive/index


Q: Mails sind nicht sofort sichtbar nach Einlieferung über SMTP – Betrifft: 1.0.2, 1.0.3

A: Mails erscheinen nicht in der Suchoberfläche, nachdem sie scheinbar erfolgreich vom Benno SMTP-Daemon angenommen wurden. Eine Einlieferung über die Funktionen von bennoadmin funktioniert. Ein Konsistenzcheck mit bennoadmin zeigt eine Diskrepanz zwischen archivierten und inizierten Mails.

Ursache:
Der Index enthält zwar die Informationen, diese sind aber noch nicht auf die Platte geschrieben. Sie werden erst sichtbar, wenn der Index vom Daemon ordnungsgemäß geschlossen wird (z.B. /etc/init.d/benno-smtp stop).

Workaround: Daemon schließen und neu starten
Lösung für 1.0.4: Nach jeder Mail wird der Index wieder direkt auf Festplatte geschrieben. Dies ist das Verhalten der Version <1.0.2.
(siehe ml-archiv)


Q: Wie richte ich fetchmail ein?

A: z.B. auf dem Server, auf dem OpenBenno läuft, für einen unprivilegierten user (benno) in dessen Home-Verzeichnis die Datei “.fetchmailrc” mit folgendem Inhalt erstellen:

poll "pop.server.tld"
proto pop3
user "archiv@mydomain.tld"
pass "topsecret"
smtphost "localhost/2500"
options ssl

Das “option ssl” ist natuerlich optional. Das angegebene Postfach ist das mit den geammelten Emails, welche archiviert werden sollen.

Per crontab -e für diesen User einen Cronjob einrichten, um Emails stündlich abzuholen:

0 */1 * * * /usr/bin/fetchmail


Q: Wird beim einliefern zu Openbenno auf der Stelle nach Attachments gesucht und diese Volltext-indiziert

A: Die Volltextsuche steht sofort zu Verfügung. Manche Komfortfunktionen (z.B. automatische Ergänzung von Adressen) sind erst nach einem erneuten Login auf den neuesten Stand gebracht.


Q: Welche Dokumenttypen werden indiziert?

A: Openbenno hat einen eigenen Parser für XML und HTML, und unterstützt alle Typen, die von Tika 0.3 unterstützt werden.


Q: Gibt es Wortlimitierungen (>3 Buchstaben < 30 oder so etwas)?

Openbenno verwendet den Standard Analyzer von Lucene. Dieser filtert einige (englische) Stopwörter heraus (the, a ,…) und begrenzt die Länge der einzelnen Wörter auf 255 Zeichen.


Q: Wo kann man Benutzer anlegen?

A: In BennoSearch als Admin anmelden, dann rechts oben “Benutzerverwaltung” anklicken.


Q: Löscht OpenBenno die Emails nach Ablauf der 10-jahres Frist?

A: Die Dateien werden in einer intelligenten Struktur direkt einzeln im Filesystem abgelegt. Ein kleines Skript kann den Baum durchgehen und entsprechend alte Mails löschen. Damit sind sie als Volltextanzeige nicht mehr sichtbar. Ein Neuaufbau des Indexes ist optional, dann werden die Mails auch nicht mehr in der Trefferliste angezeigt. Im nächsten Majorrelease wird es einfacher werden.


Q: Gibt es eine Möglichkeit, Duplikate aus dem Archiv zu löschen?

A: Wirkliche Duplikate, d.h. byteidentische Mails, werden vom Archiv gar nicht angenommen und so auch geloggt. Damit sind die meisten Fällen, z.B. cc und bcc Mails, abgedeckt, sofern der Mailserver richtig konfiguriert ist.

Heuristische Duplikatssuche ist aus zwei Gründen problematisch:
1) Sie ist nicht besonders transparent für den Benutzer und eine potentielle Fehlergefahr. Der Grundsatz lautet: lieber zu viel als zu wenig.
2) Ansonsten muss gewährleistet werden, dass es keinen Weg für den normalen Anwender gibt, Mail nachträglich zu entfernen. Es muss nachweisbar bleiben, was passiert.

Wir haben uns für die Weg einer besseren Rechtssicherheit gegenüber etwas potentiellem Speicherplatzverlust entschieden.

Für die nächste Version, die eine bessere Pluginarchitektur haben wird, ist es denkbar, die Suchanzeige zu modifizieren, so dass z.B. sehr ähnliche Mails in den Ergebnissen zusammengefasst werden.
(siehe ml-archiv)


Q: Was ist die Datei write.lock und warum bleibt diese manchmal bestehen?

A: Die lock-Dateien werden dann angelegt, wenn in den Index geschrieben werden muss (z.B. benno-smtp, benno-maildir, bennoadmin). Der Schreibzugriff auf einen Index darf nur einem Prozess gleichzeitig gewährt werden. Wird der Prozess “unsanft” beendet, bleiben die Dateien bestehen und weitere Prozesse können keinen Lock bekommen. Dies ist eine Sicherheitsmaßnahme, um eine Zerstörung des Indexes zu verhindern.
Fazit: Wenn man also Mails importieren will, muß zuerst der Indexdienst gestoppt werden. Ist dieser sicher gestoppt und es bestehen trotzdem Lockdateien, können sie gelöscht werden.
(siehe ml-archiv)


Q: Ist zur Authentifizierung eine Anbindung an ein Active Directory möglich?

A: Niels Jäckel hat eine Lösung vorgestellt. Eine Beschreibung, Beispielkonfiguration, das zusätzliche JAR und dessen Sourcen gibts es im Communardo Techblog.

1 kommentar
kommentar abgeben

MySQL query error