Τρίτη 27 Μαΐου 2008

Οι σημασιολογικές αναζητήσεις ανοίγουν νέους δρόμους.

Δημοσιεύτηκε στις 27-5-2008 στο περιοδικό PCWORLD
Πριν από 10 περίπου χρόνια οι ιδρυτές της Google, Larry Page και Sergey Brin, χρησιμοποίησαν μία διαφορετική μέθοδο για κάνουν την μηχανή αναζήτηση τους πιο έξυπνη από τις αντίστοιχες της Υαhoo ή της Altavista, με τα γνωστά αποτελέσματα. Τώρα ίσως ήρθε ο καιρός για κάτι καινούργιο.

Σήμερα η μέθοδος του Google αποτελεί το πρότυπο αναζήτησης, ακόμα και αν πολλές φορές τα αποτελέσματα που μας επιστρέφει η αναζήτηση μας δεν είναι αυτά που θα περιμέναμε να δούμε. Το Google χρησιμοποιεί αυτοματοποιημένα προγράμματα (robots) των οποίων η «δουλειά» είναι να σαρώνουν ιστοσελίδες και να αποθηκεύουν αντίγραφα αυτών σε ένα τεράστιο διαδικτυακό ευρετήριο. Στην συνέχεια διάφοροι πολύπλοκοι αλγόριθμοι «τρέχουν» στο ευρετήριο για να δημιουργήσουν συσχετίσεις ανάμεσα στις σελίδες και στους πιθανούς όρους αναζήτησης.

Η νέα ιδέα έρχεται από την εταιρεία Powerset ,της οποίας η μηχανή αναζήτησης κάνει το λεγόμενο semantic search (σημασιολογική αναζήτηση). To semantic search προσπαθεί να συλλέξει και να συνδέσει πληροφορίες από διαφορετικές πηγές αλλά και να δημιουργήσει συσχετίσεις από διαφορετικά κομμάτια πληροφορίας. Στόχος δεν είναι η απλή καταγραφή και αντιγραφή κάθε ιστοσελίδας αλλά η κατανόηση του περιεχομένου που υπάρχει εκεί. Κάθε πρόταση κειμένου αναλύεται από ιδιαίτερους αλγόριθμους, οι οποίοι βρίσκονται ακόμα σε αρχικό στάδιο, ώστε να εξαχθεί ένα πιθανό νόημα πίσω από κάθε παράγραφο.

Το στοίχημα που πρέπει πάντως να κερδίσει η Powerset είναι πάντως περισσότερο οικονομικής παρά τεχνολογικής φύσεως. Ακόμα και αν τα αποτελέσματα που φέρνουν οι αναζητήσεις της είναι καλύτερα από αυτά του Google, η καταχωρημένη βάση είναι μέχρι τώρα σε εμβρυακό στάδιο και στηρίζεται μόνο στη Wikipedia και την database της Metaweb Technologies. Το Google από την άλλη έχει χαρτογραφήσει όλο το διαδίκτυο. Για την Powerset τα πράγματα είναι αρκετά δύσκολα μίας και χρειάζεται και ανθρώπινο δυναμικό αλλά και αρκετός χρόνος και χρήμα ώστε να συνάψει συνεργασίες με δημιουργούς copyrighted περιεχομένου.

Αν κάνει τα πρώτα βήματα και οι χρήστες δείξουν την αγάπη τους για την αποτελεσματικότητα της μηχανής αναζήτησης, τότε ίσως να κάνει την δική της, αντίστοιχη με του Google, επανάσταση. Αν όμως εμπλακεί στα γρανάζια της γραφειοκρατίας, ίσως μία πολύ καλή ιδέα θαφτεί κάτω από την έλλειψη χρημάτων και πίστης σε αυτήν.

Δεν υπάρχουν σχόλια: