Η Baidu Ενημερώνει την Υπηρεσία Baike για να Αποτρέψει την Αντιγραφή Περιεχομένου από Google και Bing
Η κινεζική εταιρεία παροχής υπηρεσιών αναζήτησης στο διαδίκτυο, Baidu, έχει ενημερώσει την υπηρεσία της Baike, παρόμοια με τη Wikipedia, για να αποτρέψει την αντιγραφή του περιεχομένου της από τις μηχανές αναζήτησης Google και Microsoft Bing. Αυτή η αλλαγή παρατηρήθηκε στην τελευταία ενημέρωση του αρχείου robots.txt της Baidu Baike, το οποίο πλέον αρνείται την πρόσβαση στους ανιχνευτές Googlebot και Bingbot. Σύμφωνα με την Wayback Machine, η αλλαγή πραγματοποιήθηκε στις 8 Αυγούστου.
Αλλαγές στην Πρόσβαση και η Σημασία των Δεδομένων
Προηγουμένως, οι μηχανές αναζήτησης Google και Bing είχαν τη δυνατότητα να ευρετηριάζουν το κεντρικό αποθετήριο της Baidu Baike, το οποίο περιλαμβάνει σχεδόν 30 εκατομμύρια καταχωρήσεις, αν και ορισμένοι υποτομείς του ιστότοπου ήταν περιορισμένοι. Αυτή η ενέργεια της Baidu έρχεται σε μια περίοδο αυξανόμενης ζήτησης για μεγάλα σύνολα δεδομένων που χρησιμοποιούνται στην εκπαίδευση μοντέλων τεχνητής νοημοσύνης και εφαρμογών.
Παρόμοιες Κινήσεις από Άλλες Εταιρείες
Ακολουθώντας παρόμοιες κινήσεις από άλλες εταιρείες για την προστασία του διαδικτυακού τους περιεχομένου, τον Ιούλιο, το Reddit μπλόκαρε διάφορες μηχανές αναζήτησης, εκτός από την Google, από το να ευρετηριάζουν τις αναρτήσεις και τις συζητήσεις του. Η Google, όπως και το Reddit, έχει μια οικονομική συμφωνία με το Reddit για την πρόσβαση στα δεδομένα του για την εκπαίδευση των υπηρεσιών τεχνητής νοημοσύνης της.
Περιορισμοί Πρόσβασης και Συνεργασίες
Σύμφωνα με πηγές, το τελευταίο έτος, η Microsoft εξέτασε το ενδεχόμενο περιορισμού της πρόσβασης σε δεδομένα αναζήτησης στο διαδίκτυο για ανταγωνιστές της, κυρίως για εκείνους που χρησιμοποιούν τα δεδομένα για chatbots και υπηρεσίες γενετικής τεχνητής νοημοσύνης. Εν τω μεταξύ, η κινεζική Wikipedia, με τις 1,43 εκατομμύρια καταχωρήσεις της, παραμένει διαθέσιμη στους ανιχνευτές μηχανών αναζήτησης.
Η Σημασία των Μεγάλων Συνόλων Δεδομένων
Μια έρευνα που διεξήχθη από την South China Morning Post βρήκε ότι οι καταχωρήσεις από την Baidu Baike εξακολουθούν να εμφανίζονται στις αναζητήσεις τόσο της Bing όσο και της Google, πιθανώς επειδή οι μηχανές αναζήτησης χρησιμοποιούν παλαιότερο αποθηκευμένο περιεχόμενο. Αυτή η κίνηση αναδεικνύεται σε ένα πλαίσιο όπου οι προγραμματιστές γενετικής τεχνητής νοημοσύνης σε όλο τον κόσμο εργάζονται όλο και περισσότερο με εκδότες περιεχομένου για να αποκτήσουν πρόσβαση σε περιεχόμενο υψηλής ποιότητας για τα έργα τους.
Συνεργασίες με Εκδότες Περιεχομένου
Για παράδειγμα, σχετικά πρόσφατα, η OpenAI υπέγραψε συμφωνία με το περιοδικό Time για την πρόσβαση σε ολόκληρο το αρχείο του, που χρονολογείται από την πρώτη ημέρα δημοσίευσης του περιοδικού πριν από περισσότερο από έναν αιώνα. Μια παρόμοια συνεργασία υπογράφηκε με τους Financial Times τον Απρίλιο.
Η Αξία των Δεδομένων στην Εποχή της Τεχνητής Νοημοσύνης
Η απόφαση της Baidu να περιορίσει την πρόσβαση στο περιεχόμενο της Baidu Baike για τις μεγάλες μηχανές αναζήτησης υπογραμμίζει τη αυξανόμενη σημασία των δεδομένων στην εποχή της τεχνητής νοημοσύνης. Καθώς οι εταιρείες επενδύουν σημαντικά στην ανάπτυξη της τεχνητής νοημοσύνης, η αξία των μεγάλων, επιμελημένων συνόλων δεδομένων έχει αυξηθεί σημαντικά. Αυτό έχει οδηγήσει σε μια αλλαγή στον τρόπο με τον οποίο οι διαδικτυακές πλατφόρμες διαχειρίζονται την πρόσβαση στο περιεχόμενό τους, με πολλές να επιλέγουν να περιορίσουν ή να μονοποιήσουν την πρόσβαση στα δεδομένα τους.
Συμπέρασμα
Καθώς η βιομηχανία της τεχνητής νοημοσύνης συνεχίζει να εξελίσσεται, είναι πιθανό ότι περισσότερες εταιρείες θα επανεξετάσουν τις πολιτικές τους σχετικά με την κοινή χρήση δεδομένων, οδηγώντας ενδεχομένως σε περαιτέρω αλλαγές στον τρόπο με τον οποίο οι πληροφορίες ευρετηριάζονται και προσπελάζονται στο διαδίκτυο.














