Süni intellekt məlumatı haradan alır

Süni intellekt məlumatlarını haradan alır?

Heç oturub başınızı qaşıyıb düşünmüsünüzmü ki... bu şeylər əslində haradan gəlir ? Yəni, süni intellekt tozlu kitabxana yığınlarını və ya YouTube qısa videolarını gizlicə izləmir. Amma nədənsə, lazanya fokuslarından tutmuş qara dəlik fizikasına qədər hər şeyə cavab tapır, sanki içərisində dibsiz bir arxiv şkafı var. Reallıq daha qəribədir və bəlkə də düşündüyünüzdən daha maraqlıdır. Gəlin bir az araşdıraq (və bəli, bəlkə də yol boyu bir neçə mifi dağıdaq).


Bu sehrdirmi? 🌐

Bu, sehrbazlıq deyil, baxmayaraq ki, bəzən belə hiss olunur. Baş verənlər əsasən nümunə proqnozlaşdırmasıdır . Böyük dil modelləri (LLM) faktları beyninizin nənənizin peçenye reseptini saxladığı kimi saxlamır; bunun əvəzinə, onlar əvvəlki sözə əsasən növbəti sözü (jetonu) təxmin etməyə öyrədilirlər [2]. Praktikada bu o deməkdir ki, onlar münasibətlərə yapışırlar: hansı sözlərin bir-birinə yapışdığı, cümlələrin adətən necə formalaşdığı, bütöv ideyaların necə iskele kimi qurulduğu. Buna görə də nəticə səslənir , baxmayaraq ki, tam dürüstlük - bu, anlama deyil, statistik təqliddir [4].

Bəs süni intellekt tərəfindən yaradılan məlumatları əslində nə faydalı ? Bir neçə məqam:

  • Məlumat müxtəlifliyi - bir dar axından deyil, saysız-hesabsız mənbədən məlumat əldə etmək.

  • Yeniləmələr - yeniləmə dövrləri olmadan tez köhnəlir.

  • Filtrləmə - ideal olaraq, zibil içəri sızmazdan əvvəl tutmaqdır (amma, doğrusu, həmin torda dəliklər var).

  • Çarpaz yoxlama - əksər süni intellekt idarəetmə oyun kitablarında mütləq olması vacib olan səlahiyyətli mənbələrə (NASA, ÜST, böyük universitetlər kimi) əsaslanmaq [3].

Buna baxmayaraq, bəzən inamla uydurur. Həmin sözdə hallüsinasiyalar ? Əsasən, düz üzlə deyilən cilalanmış cəfəngiyatdır [2][3].

Bundan sonra oxumaq istəyə biləcəyiniz məqalələr:

🔗 Süni intellekt lotereya nömrələrini təxmin edə bilərmi?
Süni intellekt lotereya proqnozları haqqında mif və faktları araşdırmaq.

🔗 Süni intellektlə bağlı vahid yanaşma nə deməkdir?
Süni intellektlə etika və təsir mövzusunda balanslı perspektivlərdən istifadə edərək onu anlamaq.

🔗 Müqəddəs Kitab süni intellekt haqqında nə deyir?
Texnologiya və insan yaradılışı ilə bağlı Müqəddəs Kitab perspektivlərini araşdırmaq.


Tez Müqayisə: Süni intellekt haradan gəlir 📊

Hər mənbə eyni deyil, amma hər biri öz rolunu oynayır. Budur, qısa görüntü.

Mənbə Növü Kim istifadə edir (AI) Qiymət/Dəyər Niyə işləyir (və ya işləmir...)
Kitablar və Məqalələr Böyük dil modelləri Qiymətsiz (əla) Sıx, strukturlaşdırılmış bilik - sadəcə tez köhnəlir.
Veb saytlar və bloqlar Demək olar ki, bütün süni intellektlər Pulsuz (səs-küylə) Vəhşi müxtəliflik; parlaqlıq və mütləq zibil qarışığı.
Akademik Məqalələr Tədqiqat baxımından ağır süni intellektlər Bəzən ödəniş divarı ilə bağlıdır Ciddilik + etibarlılıq, lakin ağır jarqonla ifadə olunub.
İstifadəçi Məlumatları Fərdiləşdirilmiş süni intellektlər Yüksək həssaslıq ⚠️ Dəridə kəskinlik, amma məxfilik məsələsində çoxlu problem var.
Real Zamanlı Veb Axtarışla əlaqəli süni intellektlər Pulsuz (onlayndırsa) Məlumatı təzə saxlayır; mənfi cəhət şayiələrin yayılma riskidir.

Təlim Məlumatları Kainatı 🌌

Bu, "uşaqlıq dövründə öyrənmə" mərhələsidir. Təsəvvür edin ki, bir uşağa milyonlarla nağıl kitabı, xəbər parçaları və Vikipediya dovşan yuvalarını birdən paylayırsınız. Təlim öncəsi belə görünür. Real dünyada provayderlər ictimaiyyətə açıq məlumatları, lisenziyalı mənbələri və təlimçi tərəfindən yaradılan mətnləri [2].

Üst qat: gücləndirmə başlamazdan əvvəl seçilmiş insan nümunələri - yaxşı cavablar, pis cavablar, düzgün istiqamətə yönəlmiş təkanlar [1].

Şəffaflıq xəbərdarlığı: şirkətlər hər detalı açıqlamır. Bəzi mühafizə dirəkləri məxfidir (əqli mülkiyyət, təhlükəsizlik məsələləri), buna görə də faktiki qarışıqla yalnız qismən tanış olursunuz [2].


Real Zaman Axtarışı: Əlavə Üstlük 🍒

Bəzi modellər artıq təlim qabarcığının xaricinə baxa bilirlər. Bu, bərpa ilə artırılmış nəsil (RAG) - əsasən canlı indeks və ya sənəd mağazasından hissələr götürərək sonra cavaba birləşdirir [5]. Xəbər başlıqları və ya səhm qiymətləri kimi sürətli dəyişən şeylər üçün idealdır.

Nəticə nədir? İnternet həm dahilik, həm də zibil atəşidir. Filtrlər və ya mənşə yoxlamaları zəifdirsə, lazımsız məlumatların risk çərçivələrinin xəbərdarlıq etdiyi kimi geri qayıtma riskini daşıyırsınız [3].

öz qoşurlar , buna görə də cavablar mövcud İnsan Resursları siyasətinə və ya yenilənmiş məhsul sənədinə istinad edir, əksinə onu təkzib etmir. Düşünün: daha az "uh-uh" anları, daha etibarlı cavablar.


İncə tənzimləmə: Süni intellektdə cilalama addımı 🧪

Əvvəlcədən hazırlanmış xam modellər yöndəmsizdir. Beləliklə, onlar incə tənzimlənir :

  • köməksevər, zərərsiz və dürüst olmağı öyrətmək (insan rəyindən möhkəmləndirmə öyrənməsi, RLHF vasitəsilə) [1].

  • Təhlükəli və ya zəhərli kənarların zımparalanması (hizalanma) [1].

  • Səmimi, rəsmi və ya zarafatcıl kinayəli olmasından asılı olmayaraq, tonunu tənzimləmək.

Bu, almazı cilalamaqdan daha çox, statistik uçqunu daha çox söhbət tərəfdaşı kimi davranmağa məcbur etməkdir.


Zərbələr və Uğursuzluqlar 🚧

Gəlin qüsursuz olduğunu iddia etməyək:

  • Halüsinasiyalar - tamamilə səhv olan dəqiq cavablar [2][3].

  • Qərəzlilik - məlumatlara daxil edilmiş nümunələri əks etdirir; işarələnmədikdə onları hətta gücləndirə bilər [3][4].

  • Şorba reseptlərindən danışa bilər

  • Həddindən artıq özünəinam - nəsr, hətta bilməsə belə, bildiyi kimi axır. Risk çərçivələri fərziyyələri vurğulayır [3].


Niyə hiss olunur 🧠

Onun nə inancı, nə insani mənada yaddaşı, nə də əlbəttə ki, "mənliyi" var. Lakin cümlələri rəvan birləşdirdiyinə görə beyniniz onu sanki başa düşürmüş kimi . Baş verənlər sadəcə böyük miqyaslı növbəti işarə proqnozudur : saniyələr içində trilyonlarla ehtimalı hesablamaq [2].

“Kəşfiyyat” atmosferi ortaya çıxan davranışdır - tədqiqatçılar bunu bir az qəribə şəkildə “stoxastik tutuquşu effekti” adlandırırlar [4].


Uşaqlar üçün uyğun analogiya 🎨

Kitabxanadakı bütün kitabları oxuyan bir tutuquşunu təsəvvür edin. başa düşmür , amma sözləri müdrik hiss etdirən bir şeyə çevirə bilir. Bəzən yerində olur; bəzən cəfəngiyatdır - amma kifayət qədər istedadla həmişə fərqi görmək mümkün deyil.


Xülasə: Süni intellekt məlumatlarının mənşəyi 📌

Sadə dillə desək:

  • Kütləvi təlim məlumatları (ictimai + lisenziyalı + təlimçi tərəfindən yaradılan) [2].

  • İnsan rəyi ilə forma tonunu/davranışını dəqiq tənzimləmək

  • Canlı məlumat axınlarına qoşulduqda əldə etmə sistemləri

Süni intellekt heç nəyi "bilmir" - mətni proqnozlaşdırır . Bu, həm onun super gücü, həm də Axilles dabanıdır. Əsas məsələ? Həmişə vacib məlumatları etibarlı mənbə ilə müqayisə edin [3].


İstinadlar

  1. Ouyang, L. və b. (2022). Dil modellərinin insan rəyi ilə təlimatları izləməsi üçün təlim (InstructGPT) . arXiv .

  2. OpenAI (2023). GPT-4 Texniki Hesabatı - lisenziyalı, ictimai və insan tərəfindən yaradılan məlumatların qarışığı; növbəti token proqnozunun məqsədi və məhdudiyyətləri. arXiv .

  3. NIST (2023). Süni intellekt Risklərinin İdarə Edilməsi Çərçivəsi (Sİ RMF 1.0) - mənşəyi, etibarlılığı və risk nəzarəti. PDF .

  4. Bender, EM, Gebru, T., McMillan-Major, A., Mitchell, S. (2021). Stoxastik tutuquşuların təhlükələri haqqında: Dil modelləri çox böyük ola bilərmi? PDF .

  5. Lewis, P. və b. (2020). Bilik İntensiv NLP üçün Axtarışla Genişləndirilmiş Nəsil . arXiv .


Ən son süni intellekt texnologiyalarını rəsmi süni intellekt köməkçisi mağazasında tapın

Haqqımızda

Bloqa qayıt