[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [lugbe] Perl Projekt Vorschlag



Hallo

Ich habe für das LUGBE Perl Search Engine (lpse) Project eine Mailingliste
eingerichtet...
lpse at mountpoint.ch

subscribed habe ich mal mich (hals at bigfoot.com), bstocker at pythias.ch,
remo.goetschi at bigfoot.com und breml at trash.net weil sie alle ihre
bereitschaft angekündigt haben, hier mitzuarbeiten... wenn euch das stört
-> weiter unten unsubscriben wie beschrieben...

Alle die sich sonst noch für den weiteren verlauf des Projekt interessieren
können sich natürlich auch subscriben.
mail an: majordomo at mountpoint.ch
body: subscribe lpse

zum unsubscriben einfach in body: unsubscribe lpse

Eine Projekt-Homepage habe ich auch mal gemacht... naja, ist mehr ein
vorab-draft als dass es wirklich durchdacht wäre... vielleicht solltet ihr
sie vorläufig noch ignorieren...
http://www.mountpoint.ch/projects/lpse/

ich möchte gerne mal anfangen... als erstes müsste man ein schlaues konzept
ausarbeiten.

Todo liste: (die auf der Homepage ist ein witz, ich weiss...)

ich gehe davon aus, dass ich für alles zuständig bin, wo sich niemand für
bereit erklärt, diesen part zu übernehmen. Natürlich sollten wir das ganze
zusammen konzeptionieren, doch ich finde, jeder teil des projekts muss
einen "verantwotlichen" oder maintainer haben der dafür zuständig ist...
Das Projekt würde ich vom Umfang her als mittel einstufen. Ich bin froh
wenn mir wer dabei hilft. Ich werde eine Todo-Liste auf der Homepage
aufschalten, wo man automatisch neue Punkte anfügen kann oder sich als
maintainer einschreiben kann für jeden Todo-Eintrag den einen interessiert...
Maintainer sollte einer sein, der entweder davon ziemlich was versteht,
oder einer der zwar noch nicht so der Profi ist, doch sich brennend dafür
interessiert und es lernen will.

- Datenbankdesign
	Vielleicht das vorläufig wichtigste.
	Offene Punkte hier:
	o was wird in der Datenbank alles gespeichert?
	o wie sieht das relationale Datenbankmodell aus?
	o wie implementierung in einer non-SQL-dB?
	Schwerpunkte:
	o performance
- Spider
	Aufbau des WebSpiders. Schnittstellen zu Gatherer, Parser...
	Offene Punkte:
	o Wie interagieren die Module des Gatherers und des Parsers
	o Wie wird das Dokument übergeben
	Schwerpunkte:
	o Flexibilität
- Gatherer
	Offene Punkte:
	o Wie wird entschieden, welches Gatherermodul (HTTP Gatherer, FTP
	  Gatherer) für was benutzt wird?
	o Wie wird mit den Gatherer-Modulen interagiert?
	Schwerpunkte:
	o Ausbaufähigkeit
- Parser
	Offene Punkte:
	o Was soll überhaupt geparst werden?
	o Wie werden die Daten aufbereitet?
	o Wie wird mit den Parser-Modulen (HTML, plain text,..) interagiert?
	o White-/Blacklists?
	Schwerpunkte:
	o Ausbaufähigkeit

von jetzt an sollten wir wohl besser die diskussion nach lpse at mountpoint.ch
verschieben... ich hoffe es entsteht eine diskussion.

Ich erwarte also Rückmeldungen.. Was denkt ihr?

Gruss
 Stefan

-- 
"Those are my principles! And if you don't like them... well, I have
others..."
	-- Groucho Marx