|
07-15-2004, 11:35 PM | #16 |
Orange Mole
Join Date: Apr 2004
Location: Nancy (54)
Posts: 38
|
ben uniquement quito.citipro.fr/documents, avec les sous-rep et doc dedans. j'ajoute une fonction Ã* phpdig pour typer l'info dans la base d'indexe afin de pouvoir apposer des filtres Ã* la recherche (les droits/doc par exemple)
j'ai travailler avec VERITY et il fct bien comme ça j'essaie donc d'isoler la focntion INDEXATIon et ajouter cette colonne afin d'avoir plusieurs indexation /type dans la meme table ou plusieurs tables (Ã* voir) |
07-15-2004, 11:36 PM | #17 |
Orange Mole
Join Date: Apr 2004
Location: Nancy (54)
Posts: 38
|
(j m'absence 3 heures)
|
07-16-2004, 01:53 AM | #18 |
Orange Mole
Join Date: Apr 2004
Location: Nancy (54)
Posts: 38
|
ok ...
|
07-16-2004, 02:28 AM | #19 |
Orange Mole
Join Date: Apr 2004
Location: Nancy (54)
Posts: 38
|
ce que je ne comprends pas c pourquoi il m'indexe la pahe http://quito.citipro.fr/index/pages/fr/20.htm.
si cette page est indexée, c que PHPDIG indexe la racine web quito.citipro.fr, qui redirige vers http://quito.citipro.fr/index/pages/fr/20.htm PHPDIG sait il se comporter correctemetn avec des sites qui utilisent le mod REWRITING URL d'apache (ce qui est mon cas) ce qui explique le chemin /index/ qui est virtuel |
07-16-2004, 02:31 AM | #20 |
Orange Mole
Join Date: Apr 2004
Location: Nancy (54)
Posts: 38
|
le fait qu'il index http://quito.citipro.fr/index/pages/fr/20.htm provient du chemin "Parent Directory" sous quito.citipro.fr/documents/, mais pourquoi remonte t il sous quito.citipro.fr ? devrais je peut être interdire ce chemin ?
|
07-16-2004, 03:35 AM | #21 |
Orange Mole
Join Date: Apr 2004
Location: Nancy (54)
Posts: 38
|
dans la cadre d'une indexation de repertoire de documents, il n'est pas possible de limiter la pronfondeur de recherche car il n'est pas possible de connaitre le nombre de repertoires ou de sous repertoires créés avant indexation.
donc comment ne pas limiter la profondeur ? et le nombre de liens /niveau ? |
07-16-2004, 06:31 PM | #22 |
Head Mole
Join Date: May 2003
Posts: 2,539
|
Ne pas limiter: augmenter le profondeur de recherche et diminuer le nombre de liens par Ã* zéro.
Eviter que phpdig indexe autre chose que l'url donnée: diminuer le nombre par Ã* zéro pour les deux. Interdire remonte: effacer et exclure la branche dans le admin ou robots.txt document. quito.citipro.fr/index/pages/fr/20.htm provient du chemin "Parent Directory" sous quito.citipro.fr/documents/: S'il vous plaît voir ceci lien. (l'exemple de non "parent directory") Quelle URI voulez-vous indexer: http://quito.citipro.fr/documents/ LIMIT_TO_DIRECTORY: true (seulement documents/) Profondeur de recherche: 5 Liens par: 5 Exploration des liens en cours... -------------------------------------------------------------------------------- SITE : http://quito.citipro.fr/ Chemins exclus : - http 1:http://quito.citipro.fr/documents/ (time : 00:00:11) Pas de liens dans la table temporaire -------------------------------------------------------------------------------- Liens trouvés : 1 http://quito.citipro.fr/documents/ Optimizing tables... Indexation terminée ! J'espère que ceci est compréhensible.
__________________
Responses are offered on a voluntary if/as time is available basis, no guarantees. Double posting or bumping threads will not get your question answered any faster. No support via PM or email, responses not guaranteed. Thank you for your comprehension. |
|
|
Similar Threads | ||||
Thread | Thread Starter | Forum | Replies | Last Post |
spider ignores links | Maarten Wijnen | Troubleshooting | 2 | 03-17-2005 02:23 PM |
Spider From A File Thru Web Interface | vinyl-junkie | Mod Requests | 3 | 12-15-2004 03:15 AM |
Spider site with links | dell_10 | External Binaries | 10 | 09-20-2004 06:42 AM |
spider only one site/file | jdc32 | Troubleshooting | 2 | 07-02-2004 05:49 AM |
phpdig spider hangs (a powerpoint file problem) | davideyre | Troubleshooting | 1 | 03-29-2004 12:35 PM |