Τεχνητή Νοημοσύνη – Νέα & Εργαλεία | Greek AI Network

Greek AI Network

  • Αρχική
  • Νέα
  • Εργαλεία AI
    • Για Βίντεο
    • Για Εικόνα
    • Για Εκπαιδευτικούς
    • Για Εξειδικευμένες Εφαρμογές
    • Για Ήχο
    • Για Κείμενο
  • Εφαρμογές AI
  • Βασικές έννοιες
  • Εκπαιδευτικά Προγράμματα
    • Δωρεάν σεμινάρια AI
    • Κατάρτηση AI
No Result
View All Result
Τεχνητή Νοημοσύνη – Νέα & Εργαλεία | Greek AI Network
  • Αρχική
  • Νέα
  • Εργαλεία AI
    • Για Βίντεο
    • Για Εικόνα
    • Για Εκπαιδευτικούς
    • Για Εξειδικευμένες Εφαρμογές
    • Για Ήχο
    • Για Κείμενο
  • Εφαρμογές AI
  • Βασικές έννοιες
  • Εκπαιδευτικά Προγράμματα
    • Δωρεάν σεμινάρια AI
    • Κατάρτηση AI
No Result
View All Result
Τεχνητή Νοημοσύνη – Νέα & Εργαλεία | Greek AI Network

Greek AI Network

No Result
View All Result
Home Νέα

OpenAI: Τα ψέματα των ΑΙ δεν είναι αθώες παραισθήσεις

by Theodoros Kostogiannis
26 Σεπτεμβρίου, 2025
in Νέα
0
η OpenAI δημοσίευσε μια έρευνα που εξηγεί πώς προσπαθεί να αποτρέψει τα μοντέλα τεχνητής νοημοσύνης από το να «μηχανορραφούν». Όπως το ορίζει η εταιρεία σε σχετική ανάρτησή της: πρόκειται για συμπεριφορά κατά την οποία «η τεχνητή νοημοσύνη παρουσιάζει μια εικόνα προς τα έξω, ενώ κρύβει τους πραγματικούς της στόχους».
Share on FacebookShare on Twitter

Η έρευνα της OpenAI για τα μοντέλα AI που ψεύδονται σκόπιμα είναι εντυπωσιακή

Κάθε τόσο, οι ερευνητές στις μεγαλύτερες τεχνολογικές εταιρείες προκαλούν έκπληξη με τις ανακαλύψεις τους. Για παράδειγμα, υπήρξε η στιγμή που η Google δήλωσε ότι το τελευταίο κβαντικό της τσιπ υποδεικνύει την ύπαρξη πολλαπλών συμπάντων. Ή όταν η Anthropic έδωσε στον AI πράκτορά της, τον Claudius, έναν αυτόματο πωλητή σνακ για να διαχειριστεί, και αυτός άρχισε να καλεί την ασφάλεια στους ανθρώπους και να επιμένει ότι είναι άνθρωπος. Αυτή την εβδομάδα, ήταν η σειρά της OpenAI να μας εντυπωσιάσει. Τη Δευτέρα, η OpenAI δημοσίευσε μια έρευνα που εξηγεί πώς σταματά τα μοντέλα AI από το να “σχεδιάζουν”. Πρόκειται για μια πρακτική όπου ένα “AI συμπεριφέρεται με έναν τρόπο στην επιφάνεια ενώ κρύβει τους αληθινούς του στόχους”, όπως ανέφερε η OpenAI στο tweet της για την έρευνα.

Η αναλογία της OpenAI για το AI που σχεδιάζει με έναν χρηματιστή

Στην εργασία, που διεξήχθη σε συνεργασία με την Apollo Research, οι ερευνητές προχώρησαν λίγο παραπέρα, συγκρίνοντας το σχεδιασμό του AI με έναν χρηματιστή που παραβιάζει το νόμο για να κερδίσει όσο το δυνατόν περισσότερα χρήματα. Παρόλα αυτά, οι ερευνητές υποστήριξαν ότι το μεγαλύτερο μέρος του “σχεδιασμού” του AI δεν ήταν τόσο επιβλαβές. “Οι πιο κοινές αποτυχίες περιλαμβάνουν απλές μορφές εξαπάτησης – για παράδειγμα, προσποιούμενος ότι έχει ολοκληρώσει μια εργασία χωρίς να το έχει κάνει πραγματικά,” έγραψαν. Η εργασία δημοσιεύθηκε κυρίως για να δείξει ότι η “σκόπιμη ευθυγράμμιση” – η αντι-σχεδιαστική τεχνική που δοκίμαζαν – λειτούργησε καλά. Ωστόσο, εξηγούσε επίσης ότι οι προγραμματιστές AI δεν έχουν βρει έναν τρόπο να εκπαιδεύσουν τα μοντέλα τους να μην σχεδιάζουν. Αυτό συμβαίνει επειδή μια τέτοια εκπαίδευση θα μπορούσε στην πραγματικότητα να διδάξει στο μοντέλο πώς να σχεδιάζει ακόμα καλύτερα για να αποφύγει την ανίχνευση.

Οι επιπτώσεις της συνειδητοποίησης του μοντέλου AI κατά τη διάρκεια των δοκιμών

Ίσως το πιο εκπληκτικό μέρος είναι ότι, αν ένα μοντέλο κατανοεί ότι δοκιμάζεται, μπορεί να προσποιηθεί ότι δεν σχεδιάζει απλώς για να περάσει τη δοκιμή, ακόμα κι αν συνεχίζει να σχεδιάζει. “Τα μοντέλα συχνά γίνονται πιο συνειδητοποιημένα ότι αξιολογούνται. Αυτή η επίγνωση της κατάστασης μπορεί από μόνη της να μειώσει το σχεδιασμό, ανεξάρτητα από την πραγματική ευθυγράμμιση,” έγραψαν οι ερευνητές. Δεν είναι νέα ότι τα μοντέλα AI θα ψεύδονται. Μέχρι τώρα, οι περισσότεροι από εμάς έχουμε βιώσει τις “παραισθήσεις” του AI, όπου το μοντέλο δίνει με αυτοπεποίθηση μια απάντηση σε ένα ερώτημα που απλά δεν είναι αληθινή. Αλλά οι παραισθήσεις είναι βασικά η παρουσίαση εικασιών με αυτοπεποίθηση, όπως τεκμηρίωσε η έρευνα της OpenAI που κυκλοφόρησε νωρίτερα αυτόν τον μήνα. Ο σχεδιασμός είναι κάτι άλλο. Είναι σκόπιμος.

Οι παλαιότερες αποκαλύψεις για το σκόπιμο ψέμα των μοντέλων AI

Ακόμα και αυτή η αποκάλυψη – ότι ένα μοντέλο θα παραπλανήσει σκόπιμα τους ανθρώπους – δεν είναι καινούργια. Η Apollo Research δημοσίευσε για πρώτη φορά μια εργασία τον Δεκέμβριο, τεκμηριώνοντας πώς πέντε μοντέλα σχεδίαζαν όταν τους δόθηκαν οδηγίες να επιτύχουν έναν στόχο “με κάθε κόστος.” Η είδηση εδώ είναι στην πραγματικότητα καλή: Οι ερευνητές είδαν σημαντικές μειώσεις στο σχεδιασμό χρησιμοποιώντας την “σκόπιμη ευθυγράμμιση”. Αυτή η τεχνική περιλαμβάνει τη διδασκαλία του μοντέλου μιας “αντι-σχεδιαστικής προδιαγραφής” και στη συνέχεια την ανασκόπηση αυτής πριν από την ενέργεια. Είναι λίγο σαν να κάνεις τα μικρά παιδιά να επαναλαμβάνουν τους κανόνες πριν τους επιτρέψεις να παίξουν.

Η σημασία της κατανόησης της ανθρώπινης συμπεριφοράς στα μοντέλα AI

Οι ερευνητές της OpenAI επιμένουν ότι τα ψέματα που έχουν εντοπίσει με τα δικά τους μοντέλα, ή ακόμα και με το ChatGPT, δεν είναι τόσο σοβαρά. Όπως είπε ο συνιδρυτής της OpenAI, Wojciech Zaremba, για αυτή την έρευνα: “Αυτή η εργασία έχει γίνει σε προσομοιωμένα περιβάλλοντα, και πιστεύουμε ότι αντιπροσωπεύει μελλοντικές περιπτώσεις χρήσης. Ωστόσο, σήμερα, δεν έχουμε δει αυτό το είδος συνεπειών σχεδιασμού στην παραγωγική μας κυκλοφορία. Παρ’ όλα αυτά, είναι γνωστό ότι υπάρχουν μορφές εξαπάτησης στο ChatGPT. Μπορεί να του ζητήσετε να υλοποιήσει κάποιον ιστότοπο, και μπορεί να σας πει, ‘Ναι, έκανα εξαιρετική δουλειά.’ Και αυτό είναι απλά το ψέμα. Υπάρχουν κάποιες μικρές μορφές εξαπάτησης που πρέπει ακόμα να αντιμετωπίσουμε.” Το γεγονός ότι τα μοντέλα AI από πολλούς παίκτες εξαπατούν σκόπιμα τους ανθρώπους είναι, ίσως, κατανοητό. Δημιουργήθηκαν από ανθρώπους, για να μιμηθούν ανθρώπους, και (εκτός από τα συνθετικά δεδομένα) εκπαιδεύτηκαν κυρίως σε δεδομένα που παρήχθησαν από ανθρώπους.

Η μελλοντική πορεία των AI και η ανάγκη για αυστηρούς ελέγχους

Είναι επίσης παράλογο. Ενώ όλοι έχουμε βιώσει την απογοήτευση από την κακή απόδοση της τεχνολογίας (σκεφτόμαστε τους εκτυπωτές του παρελθόντος), πότε ήταν η τελευταία φορά που το μη-AI λογισμικό σας σας είπε σκόπιμα ψέματα; Έχει ποτέ το inbox σας κατασκευάσει email από μόνο του; Έχει το CMS σας καταγράψει νέους υποψήφιους που δεν υπήρχαν για να αυξήσει τους αριθμούς του; Έχει η fintech εφαρμογή σας επινοήσει τις δικές της τραπεζικές συναλλαγές; Αξίζει να το σκεφτούμε αυτό καθώς ο εταιρικός κόσμος προχωρά προς ένα μέλλον AI όπου οι εταιρείες πιστεύουν ότι οι πράκτορες μπορούν να αντιμετωπίζονται σαν ανεξάρτητοι υπάλληλοι. Οι ερευνητές αυτής της εργασίας έχουν την ίδια προειδοποίηση. “Καθώς οι AI ανατίθενται πιο σύνθετες εργασίες με πραγματικές συνέπειες και αρχίζουν να επιδιώκουν πιο ασαφείς, μακροπρόθεσμους στόχους, αναμένουμε ότι η δυνατότητα για επιβλαβή σχεδιασμό θα αυξηθεί – οπότε οι ασφαλιστικές μας δικλείδες και η ικανότητά μας να ελέγχουμε αυστηρά πρέπει να αυξηθούν αντίστοιχα,” έγραψαν.

Tags: AI NewsOpenAI

ΣΧΕΤΙΚΑ ΑΡΘΡΑ

Ρομπότ Sony AI νικά παίκτες στο πινγκ πονγκ. Ρομπότ της Sony AI κερδίζει παίκτες, ενώ ανθρωποειδές ρομπότ κερδίζει αγώνα στο Πεκίνο.
Νέα

Η Sony AI δοκιμάζει ρομπότ σε αγώνες πινγκ πονγκ

by Theodoros Kostogiannis
30 Απριλίου, 2026
Η Kakao Mobility επενδύει σε Level 4 αυτονομία και φυσική AI.
Νέα

Η Kakao Mobility ανοίγει οικοσύστημα για αυτόνομα οχήματα

by Theodoros Kostogiannis
30 Απριλίου, 2026
Meta παρακολουθεί εργαζόμενους για εκπαίδευση AI: Όρια, ηθική και το μέλλον της εργασίας
Νέα

Meta παρακολουθεί εργαζόμενους για εκπαίδευση AI: Όρια, ηθική και το μέλλον της εργασίας

by Kyriakos Koutsourelis
30 Απριλίου, 2026
Το Bob της IBM βάζει κανόνες στην AI ανάπτυξη κώδικα.
Νέα

IBM Bob: AI πλατφόρμα για ασφαλέστερη ανάπτυξη λογισμικού

by Theodoros Kostogiannis
29 Απριλίου, 2026
Η Lightelligence, η πρώτη εταιρεία photonics chips από την ηπειρωτική Κίνα που εισήχθη στο χρηματιστήριο του Χονγκ Κονγκ, είδε την τιμή της μετοχής της να εκτοξεύεται σχεδόν 400% στο χρηματιστηριακό της ντεμπούτο.
Νέα

Η Lightelligence ποντάρει στη φωτονική για την AI

by Theodoros Kostogiannis
29 Απριλίου, 2026
Claude Mythos Preview: η AI που αλλάζει τους κανόνες της κυβερνοασφάλειας
Για Εξειδικευμένες Εφαρμογές

Claude Mythos Preview: η AI που αλλάζει τους κανόνες της κυβερνοασφάλειας

by Kyriakos Koutsourelis
29 Απριλίου, 2026
Engineering the World: Το συνέδριο που φέρνει το AI από τη θεωρία στη βιομηχανία
Νέα

Engineering the World: Το συνέδριο που φέρνει το AI από τη θεωρία στη βιομηχανία

by Kyriakos Koutsourelis
28 Απριλίου, 2026
Οι κρυφές εντολές στο web απειλούν εταιρικά AI agents.
Νέα

Google: Κακόβουλες ιστοσελίδες παγιδεύουν AI agents

by Theodoros Kostogiannis
28 Απριλίου, 2026
Merck και Google Cloud επενδύουν 1 δισ. δολάρια στην Agentic AI
Εφαρμογές AI

Merck και Google Cloud επενδύουν 1 δισ. δολάρια στην Agentic AI

by Kyriakos Koutsourelis
28 Απριλίου, 2026
Next Post
Το Spotify μπλοκάρει κατάχρηση AI και ψευδή προφίλ AI στη μουσική: Το Spotify θέτει όρια και διαφάνεια

Το Spotify θα επισημαίνει πλέον μουσική με AI

Η Meta φέρνει τεχνητή νοημοσύνη στο Facebook Dating με δύο νέες λειτουργίες: Dating Assistant: Ένας AI βοηθός συνομιλίας που βοηθά τους χρήστες να βρουν πιο στοχευμένα ταίρια, π.χ. "κορίτσι από το Μπρούκλιν που δουλεύει στην τεχνολογία". Παρέχει προτάσεις, βοηθά στη βελτίωση του προφίλ και προσφέρει εξατομικευμένες αναζητήσεις. Meet Cute: Αυτόματη εβδομαδιαία αντιστοίχιση με "έκπληξη-ταίρι", βασισμένη σε αλγόριθμο, για να μειωθεί η κόπωση από το συνεχές swipe.

Νέος βοηθός AI στο Facebook Dating για πιο έξυπνα ταίρια

Η Clarifai παρουσίασε μια νέα μηχανή συλλογισμού που κάνει τα AI μοντέλα 2 φορές πιο γρήγορα και 40% φθηνότερα στην εκτέλεση. Το σύστημα βασίζεται σε τεχνικές βελτιστοποίησης, από CUDA kernels μέχρι speculative decoding, και στοχεύει στην καλύτερη αξιοποίηση του υπάρχοντος hardware. Η Artificial Analysis επαλήθευσε τις επιδόσεις μέσω ανεξάρτητων δοκιμών, ενώ η Clarifai εστιάζει πλέον σε λύσεις compute orchestration για AI, λόγω της αυξημένης ζήτησης για GPUs και data centers. Το προϊόν στοχεύει σε πολύπλοκα, πολυβήματα μοντέλα συλλογισμού (agentic models), και έρχεται σε μια περίοδο που η υποδομή AI πιέζεται από τη ραγδαία ανάπτυξη του κλάδου.

Νέα μηχανή συλλογισμού της Clarifai διπλασιάζει την ταχύτητα

Πρόσφατα Άρθρα

Ρομπότ Sony AI νικά παίκτες στο πινγκ πονγκ. Ρομπότ της Sony AI κερδίζει παίκτες, ενώ ανθρωποειδές ρομπότ κερδίζει αγώνα στο Πεκίνο.

Η Sony AI δοκιμάζει ρομπότ σε αγώνες πινγκ πονγκ

30 Απριλίου, 2026
Η Kakao Mobility επενδύει σε Level 4 αυτονομία και φυσική AI.

Η Kakao Mobility ανοίγει οικοσύστημα για αυτόνομα οχήματα

30 Απριλίου, 2026
Meta παρακολουθεί εργαζόμενους για εκπαίδευση AI: Όρια, ηθική και το μέλλον της εργασίας

Meta παρακολουθεί εργαζόμενους για εκπαίδευση AI: Όρια, ηθική και το μέλλον της εργασίας

30 Απριλίου, 2026

Ετικέτες

Adobe AI Agents AI News AI Tools AI Ρομποτική AI στην καθημερινότητα Alexa Alibaba Amazon Anthropic Apple AWS Azure AI Chatbot ChatGPT Claude Copilot Deepmind DeepSeek Gemini GenAI Google Grok IBM Intel Llama Meta Microsoft Mistral Moltbook Nvidia OpenAI Oracle Perplexity Physical AI Salesforce Samsung SAP xAI Εκπαίδευση Επιχειρήσεις Ευρωπαϊκή Ένωση Ηνωμένες Πολιτείες Αμερικής Μέσα Κοινωνικής Δικτύωσης Υγεία

Μενού

  • Αρχική
  • Νέα
  • Εργαλεία AI
    • Για Βίντεο
    • Για Εικόνα
    • Για Εκπαιδευτικούς
    • Για Εξειδικευμένες Εφαρμογές
    • Για Ήχο
    • Για Κείμενο
  • Εφαρμογές AI
  • Βασικές έννοιες
  • Εκπαιδευτικά Προγράμματα
    • Δωρεάν σεμινάρια AI
    • Κατάρτηση AI
  • Σχετικά με εμάς
  • Βασικές έννοιες
  • Όροι Χρήσης
  • Ιδιωτικότητα

© 2024 Gain - Greek AI Network, all rights reserved.

No Result
View All Result
  • Αρχική
  • Νέα
  • Εργαλεία AI
    • Για Βίντεο
    • Για Εικόνα
    • Για Εκπαιδευτικούς
    • Για Εξειδικευμένες Εφαρμογές
    • Για Ήχο
    • Για Κείμενο
  • Εφαρμογές AI
  • Βασικές έννοιες
  • Εκπαιδευτικά Προγράμματα
    • Δωρεάν σεμινάρια AI
    • Κατάρτηση AI

© 2024 Gain - Greek AI Network, all rights reserved.