FeedBurner, Buzz και BlogSpot
Posted by Νεόφυτος Δημητρίου Fri, 21 Sep 2007 09:56:49 EEST
Μετακινώντας τα feeds από το blogspot στο feedburner (επίσης, ιδιοκτησία του Google) νόμισα αρχικά ότι 'χε αλλάξει η πολιτική στο robots.txt που αφορά ξένους συναθροιστές. Τέτοιο πράγμα δεν φαίνεται να ισχύει (το robots.txt είναι εντάξει). Είναι φανερό, ωστόσο, ότι το FeedBurner προσπαθεί και δυσχεραίνει το έργο της αυτόματης ανάκτησης των άρθρων (ενδιάμεσες σελίδες με ανακατεύθυνση διαφορετικού τύπου κάθε φορά).
Αυτό είναι πρόβλημα για το buzz… το buzz σωστά κοιτάζει πρώτα το περιεχόμενο του feed κι έπειτα φέρνει τη σελίδα του άρθρου ώστε να κατασκευάσει τη σχετική περίληψη και να σημειώσει την πραγματική διεύθυνση της καταχώρησης. Αν τώρα, κάποιος μεσολαβεί (καλή ώρα το feedburner) μπορεί να δημιουργήσει αρκετά προβλήματα σε άλλες υπηρεσίες (είναι φυσιολογικό σε κάποιο βαθμό). Για παράδειγμα, δείτε μερικά παραδείγματα ενδιάμεσων διευθύνσεων σε feeds που φιλοξενούνται στο FeedBurner:
Βλέπετε εκείνους τους εννιαψήφιους αριθμούς μέσα στις διευθύνσεις; Αύριο το feedburner μπορεί να έρθει και να τους αλλάξει με αποτέλεσμα να είναι δύσκολο εώς αδύνατο για άλλους συναθροιστές να διαπιστώσουν κατά πόσο πρόκειται για νέα άρθρα ή παλιά που έχει αλλάξει η διεύθυνση τους στο feedburner. Γι αυτό ακριβώς το λόγο, το buzz προσπαθεί να ακολουθήσει την ανακατεύθυνση (redirect) ώστε να φτάσει την πραγματική σελίδα.
Τις πλείστες φορές αυτό γίνεται επιτυχώς… υπάρχουν, ωστόσο, φορές που δεν είναι "δυνατό"… π.χ. επιστρέφεται 200-άρα σελίδα, αντί μόνιμο-redirect (301) ή προσωρινό-redirect (302) η οποία προκαλεί την ανακατεύθυνση μέσω javascript (για όσους θέλουν να γνωρίζουν τις λεπτομέρειες και τι σημαίνει αυτό, ευχαρίστως να το αναλύσω). Ακόμη και έτσι, το buzz δεν έχει πρόβλημα αφού δοκιμάζει ωσότου πετύχει μια ανακατεύθυνση που δουλεύει όπως πρέπει. Αυτό όμως σημαίνει ότι θα δοκιμάζει σε τακτά χρονικά διαστήματα ωσότου καταλήξει στο άρθρο (κι όχι στη σελίδα του feedburner που κατευθύνει τον κόσμο προς το άρθρο). Λόγω των πολλών επαναλαμβανόμενων requests (φαίνεται ότι ψες είχε παραγίνει) το Google έβγαζε το μήνυμα αποτροπής DOS επιθέσεων (κάτι παρόμοιο με αυτό που σας βγάζει στο phigita.net όταν κάνετε συχνά και επαναλαμβανόμενα requests για την ίδια πάντα σελίδα).
Για να 'μαι ειλικρινής δεν είμαι σίγουρος κατά πόσο είναι οφέλιμο (από πλευράς κίνησης) να βρίσκεται το feed στο feedburner ή όχι. Υπάρχει ο μηχανισμός στο phigita.net για να συγκεντρώνει τις νέες καταχωρήσεις και χωρίς τη χρήση των feeds αλλά είναι κρίμα να πηγαίνει χαμένη τόση προσπάθεια για το τίποτα.
Ωσότου βρεθεί μια καλύτερη λύση (θα εξετάσω κάτα πόσο υπάρχει κάποιο API) έχω απενεργοποιήσει τα feeds από το feedburner ώστε να μην μας ξανακόψουν. Τα feeds που είχαν αρχικά προστεθεί στο συναθροιστή (Buzz) με διευθύνσεις του blogspot οι οποίες τώρα ανακατευθύνουν προς το FeedBurner θα συνεχίσουν να εξετάζονται (σε περίπτωση) που το feed επανέρθει στη "σωστή" του διεύθυνση. Σημειώνεται και τονίζεται, ωστόσο, ότι ο συναθροιστής δεν θα επιχειρήσει να κάνει resolve διευθύνσεις όπως και οι πιο πάνω ενδιάμεσες του FeedBurner για τους λόγους που έχω εξηγήσει. Θα δοκιμάσω να βρω κάποια άλλη λύση και βλέπουμε.