Bonjour,
J'ai déjà posé une question sur le sujet, mais je ne suis pas
convaincu de la réponse.
Mon problème est le suivant :
Avec HTTPSocket, il est possible de charger des pages. Il s'avère
qu'à la différence de Curl, et ce pour une raison qui m'échappe,
HTTPSocket refuse les url du type :
http://www.elpais.es/rss/rss_section.html?anchor=elpporcul
Plus précisément, il refuse les url qui comporte un ? sans un slash
"/?". Or, ce type d'URL est très courant.
Il suffit en apparence de vérifier l'URL et de mettre un slash s'il
n'y en a pas. Mais ce n'est pas une solution sérieuse, car cela n'est
plus la même URL et certains sites y sont sensibles. Voici un exemple :
Prenons l'URL d'un article du quotidien espagnol ElPais. Le format
d'impression comporte l'extension ?print=1. Or, si l'on met un slash
avant le ?, le site d'ElPais supprime l'extension et le contenu de la
page est donc différent.
Ex :
http://www.elpais.com/articulo/cultura/Definitivo/Poeta/Nueva/York/
elpepucul/20071021elpepicul_1/Tes?print=1
http://www.elpais.com/articulo/cultura/Definitivo/Poeta/Nueva/York/
elpepucul/20071021elpepicul_1/Tes/?print=1
ne pointent pas vers la même page !!!
Quelqu'un peut-il m'expliquer pourquoi HTTPSocket refuse les URL du
type :
http://www.elpais.es/rss/rss_section.html?anchor=elpporcul
Existe-t-il une solution qui permette de charger une page du type :
http://www.elpais.com/articulo/cultura/Definitivo/Poeta/Nueva/York/
elpepucul/20071021elpepicul_1/Tes?print=1
Powel
|