PhpDig
Vous recherchiez un (bon) moteur de recherche pour votre site sous Apache/PHP/mySQL ? PhpDig semble tout à fait indiqué "sur le papier" (car non testé in situ par nos services débordés).Clair dans son interface et dans son affichage des résultats il possède de nombreuses caractéristiques qui méritent l’attention. Son fonctionnement est classique : "PhpDig suit les liens contenus dans les documents fournis par un serveur web, comme n’importe quel navigateur, afin de constituer sa liste de pages à indexer".
Par défaut il ne gère pas les mots de moins de trois lettres et les expressions courantes (de votre choix). Il ne gère pas non plus les expressions exactes (car sinon la base sql serait pour le moins volumineuse et les requêtes pas mal longues !). Vous pouvez bien entendu paramétrer la sortie des résultats (à commencer par traduction en français).
L’installation semble facile puisqu’automatisée à l’aide d’un script (comme souvent il suffit juste d’avoir le nom de sa base sql, l’identifiant et le mot de passe).
On notera par ailleurs la possibilité d’indexer les fichiers pdf, doc, xls (comme Google quoi !) "si vous installez sur la machine qui effectue l’indexation des exécutables externes capables d’extraire le contenu textuel de ces documents".
On attend vos retours d’expérience ! (surtout qu’on va peut-être l’adopter pour nous tant il a l’air séduisant)
<< Mettre à jour >>
:: lien mort :: orthographe :: nouveauté :: mise à jour ::
Vous souhaitez mettre à jour la notice ? La première chose à faire est de déterminer s'il s'agit d'une mise à jour mineure ou d'une mise à jour majeure
.
- Mineure : un lien mort, des fautes d'orthographe, un lien à ajouter ou encore une petite précision.
- Majeure : une nouvelle version avec des nouveautés, des changements majeurs.
Commentaires
<< Poster un message >>
:: question :: précision :: avis :: commentaire :: bug ::
PhpDig , le 8 août 2006 par Léo Studer (0 rép.)
Application intéressante, malheureusement le forum du site officiel est payant... pas cher, mais c’est une question de principes.
Dommage car rien n’est fait pour faciliter la prise en main, et du coup il faut passer à la caisse pour obenir les informations concernant l’intégration de l’application dans un site web déjà existant par exemple.
PhpDig , le 13 juillet 2006 par Miketatoon (0 rép.)
> PhpDig , le 17 juin 2005 (0 rép.)
Ce script est géniale mais il prend énormement de place qu mon serveur car il stocke une partie, des donné dans des fichiers texte dans le fichier text_content.
Je cherche quelqu’un ayant réussie a faire ce script être 100% sql
-----> Problème
> PhpDig , le 14 janvier 2005 par twanoo (0 rép.)
ok, je l’ai installé et testé, assez efficace pour ce qui est des recherches. ( assez rapide ) l’indexing du site prend un peu de temps, mais ça me semble normal car il y a beaucoup de lecture / écriture au niveau de mysql.
Il est possible d’administrer le moteur via une interface web, ou en lignes de commandes. pour ma part, je recommande de gerer l’indexing en lignes de commandes, cela prend beaucoup moins de resources CPU , donc c’est unpeu plus rapide. quoi qu’il en soit , le soft est assez gourmand, donc faire attention si vous etes hebergés sur un serveur mutualisé...
a part ce petit "defaut", la solution est tres souple , ultra parametrable, il est possible de faire un "renice" sur le process ( cela se parametre dans le fichier de conf , au cas ou on a pas toute la cpu pour soi )
des templates pour la page de recherche sont livrés avec le soft à titre d’exemple, et il est tres facile d’en crééer ( ils sont en XML)
il est aussi possible de faire tourner le spider avec cron. le forum de leur site est assez réactif, ils vous donnent volontier un coup de main.
voila, je crois que j’en ai grossierement fait le tour. :))
Antoine.
> PhpDig, Probleme d’utilisation avec les Pdf , le 8 octobre 2004 par Daaniel (3 rép.)
Bonjour Ce logiciel me pose un problème. Il est très intéressant, car il utilise php, mysql, il est convivial, paramétrable, beau, etc … (et pas de bogue) Les référencements que j’ai à faire sont tous des pdf. Il scrute bien les pdf mais il n’indexe rien. (Les fichiers textes, html, etc.. c’est parfait) J’utilise une configuration sous Windows 2000.
Normalement il doit y avoir une procédure que transforme le pdf en texte, il indexe le texte en faisant référence au pdf. Je n’ai pas trouvé comment faire, donc pour moi, cet excellent logiciel est inutile. Avez vous une solution ?
> PhpDig, Probleme d’utilisation avec les Pdf , le 14 janvier 2005 par twanoo
il faut utiliser un soft du style pdftotext, mais je ne suis pas sur que ça fonctionne sous windows.> PhpDig, Probleme d’utilisation avec les Pdf , le 28 avril 2005 par Daaniel
Tout à fait, il faut utiliser pdftotext, le probleme c’est que phpdig gardera comme référence le fichier texte converti et non pas le fichier pdf d’origine.> PhpDig, Probleme d’utilisation avec les Pdf , le 7 octobre 2005 par Kithnos
Ca fonctionne avec Pdftotext (recherche la librairie Xpdf et telecharge uniquement la partie pdftotext) une fois que c’est fait et bien tu paramètre ton fichier de config sur PhpDig en lui indiquant d’indexer le PDF et en lui indiquant le chemin ou se trouve Pdftotext. si tu est sur un serveur mutualisé et bien tu ne pourra pas le faire !!! car tu ne peut pas installer Pdftotext donc se que tu peux faire est de l’installer en local chez toi ensuite d’indexer le site et puis tu transfert la base de données de Phpdig en local vers la base de données de ton serveur et le tour est joué, je sais que c’est lourd, mais c’est la seule solution que j’ai trouvé pour un hebergement mutualisé.... voir aussi je pense que tu peux même passer directement par FTP....voilà> PhpDig , le 9 janvier 2004 par shaders (0 rép.)
Génial ! ! !
Un programme fantastique, il m’indexe une centaine d’hôte et 4000 page sur 80 000 keywords. soit une base de 20 Mo grosso modo.
Aucun pbm de rapidité ni d’accés.
Attention toutefois à la lenteur d’indexation et de rafraichissement, ne pas être trop dans l’urgence.
-----> Moteur Snakes
> Pas mal du tout. , le 19 décembre 2003 par Lycurgue (0 rép.)
J’ai installé PHpDig en local puis sur le Net, il fonctionne parfaitement dans les deux cas.
Le référencement n’est pas si long qu’annoncé par la documentaion (200 pages en 2 ou 3min.) et sans aucun problème. Le site indexé est en html compatible navigateur 3.0et +, ceci explique peut-être cela. Il semblerait (voir forum du site) que l’indexation cale sur des pages php complexes.
L’intérêt annexe est l’analyse de l’indexation par mots clés : cela donne une vision claire du contenu de votre site, mieux que tous les outils dédiés que j’ai utilisé jusqu’à maintenant.
Un bémol : la documentation très claire par ailleurs est encore trop ardue pour un débutant en php comme moi : les évidences et les non-dits de l’auteur ont rallongé l’intégration du moteur dans mes pages en m’obligeant à faire de longues recherches sur le net pour y trouver le fil à couper le beurre.
En bref, du très bon pour qui connaît -un peu - le php.
Informations complémentaires
Faire un don ? (défiscalisé)
Aidez-nous à atteindre notre objectif de 600 donateurs récurrents pour assurer notre pérennité et notre développement ! (nous y sommes presque).
Autres logiciels
Framasoft needs you !
Autres rubriques
Libre : agenda
- Rennes : Gulliver - Permanence autour du libre, le vendredi 12 juillet 2013
- Wintzenheim : Réunion du Club Linux, le samedi 06 juillet 2013
- Rennes : Gulliver - Permanence autour du libre, le vendredi 05 juillet 2013
- Caen : Calvix, Premier Jeudi du Libre, le jeudi 04 juillet 2013
- Poitiers : Jeudi du libre de l'APP3L, le jeudi 04 juillet 2013
Informations générales
Sur le Framablog
Sur Framagora
- Clé malade
- Mettre en page nombreuses photos
- Mettre PMB 3.4 en réseau
- PRISM
- C'est l'histoire d'un mooc libre francophone
- Dolibarr - Retour d'utilisateur
- Faire un support pédagogique de programmation pour enfants
- [Présentation] Marius (Noël)
- Lanceur Frama DVD bloqué par Avast
- MAJ framabird portable1703 esr ne se lance pas completement
Juste une image
No title- Creative Commons BY
Framakey
Nous suivre
Flux RSS
Page Wikipédia





