Süni intellekt məlumatlarını haradan alır?

Heç oturub başınızı qaşıyıb düşünmüsünüzmü ki... bu şeylər əslində haradan gəlir? Yəni, süni intellekt tozlu kitabxana yığınlarını və ya YouTube qısa videolarını gizlicə izləmir. Amma nədənsə, lazanya fokuslarından tutmuş qara dəlik fizikasına qədər hər şeyə cavab tapır, sanki içərisində dibsiz bir arxiv şkafı var. Reallıq daha qəribədir və bəlkə də düşündüyünüzdən daha maraqlıdır. Gəlin bir az araşdıraq (və bəli, bəlkə də yol boyu bir neçə mifi dağıdaq).

Bu sehrdirmi? 🌐

Bu, sehrbazlıq deyil, baxmayaraq ki, bəzən belə hiss olunur. Baş verənlər əsasən nümunə proqnozlaşdırmasıdır. Böyük dil modelləri (LLM) faktları beyninizin nənənizin peçenye reseptini saxladığı kimi saxlamır; bunun əvəzinə, onlar əvvəlki sözə əsasən növbəti sözü (jetonu) təxmin etməyə öyrədilirlər [2]. Praktikada bu o deməkdir ki, onlar münasibətlərə yapışırlar: hansı sözlərin bir-birinə yapışdığı, cümlələrin adətən necə formalaşdığı, bütöv ideyaların necə iskele kimi qurulduğu. Buna görə də nəticə səslənir , baxmayaraq ki, tam dürüstlük - bu, anlama deyil, statistik təqliddir [4].

Bəs süni intellekt tərəfindən yaradılan məlumatları əslində nə faydalı? Bir neçə məqam:

Məlumat müxtəlifliyi - bir dar axından deyil, saysız-hesabsız mənbədən məlumat əldə etmək.
Yeniləmələr - yeniləmə dövrləri olmadan tez köhnəlir.
Filtrləmə - ideal olaraq, zibil içəri sızmazdan əvvəl tutmaqdır (amma, doğrusu, həmin torda dəliklər var).
Çarpaz yoxlama - əksər süni intellekt idarəetmə oyun kitablarında mütləq olması vacib olan səlahiyyətli mənbələrə (NASA, ÜST, böyük universitetlər kimi) əsaslanmaq [3].

Buna baxmayaraq, bəzən inamla uydurur. Həmin sözdə hallüsinasiyalar? Əsasən, düz üzlə deyilən cilalanmış cəfəngiyatdır [2][3].

Bundan sonra oxumaq istəyə biləcəyiniz məqalələr:

🔗 Süni intellekt lotereya nömrələrini təxmin edə bilərmi?
Süni intellekt lotereya proqnozları haqqında mif və faktları araşdırmaq.

🔗 Süni intellektlə bağlı vahid yanaşma nə deməkdir?
Süni intellektlə etika və təsir mövzusunda balanslı perspektivlərdən istifadə edərək onu anlamaq.

🔗 Müqəddəs Kitab süni intellekt haqqında nə deyir?
Texnologiya və insan yaradılışı ilə bağlı Müqəddəs Kitab perspektivlərini araşdırmaq.

Tez Müqayisə: Süni intellekt haradan gəlir 📊

Hər mənbə eyni deyil, amma hər biri öz rolunu oynayır. Budur, qısa görüntü.

Mənbə Növü	Kim istifadə edir (AI)	Qiymət/Dəyər	Niyə işləyir (və ya işləmir...)
Kitablar və Məqalələr	Böyük dil modelləri	Qiymətsiz (əla)	Sıx, strukturlaşdırılmış bilik - sadəcə tez köhnəlir.
Veb saytlar və bloqlar	Demək olar ki, bütün süni intellektlər	Pulsuz (səs-küylə)	Vəhşi müxtəliflik; parlaqlıq və mütləq zibil qarışığı.
Akademik Məqalələr	Tədqiqat baxımından ağır süni intellektlər	Bəzən ödəniş divarı ilə bağlıdır	Ciddilik + etibarlılıq, lakin ağır jarqonla ifadə olunub.
İstifadəçi Məlumatları	Fərdiləşdirilmiş süni intellektlər	Yüksək həssaslıq ⚠️	Dəridə kəskinlik, amma məxfilik məsələsində çoxlu problem var.
Real Zamanlı Veb	Axtarışla əlaqəli süni intellektlər	Pulsuz (onlayndırsa)	Məlumatı təzə saxlayır; mənfi cəhət şayiələrin yayılma riskidir.

Təlim Məlumatları Kainatı 🌌

Bu, "uşaqlıq dövründə öyrənmə" mərhələsidir. Təsəvvür edin ki, bir uşağa milyonlarla nağıl kitabı, xəbər parçaları və Vikipediya dovşan yuvalarını birdən paylayırsınız. Təlim öncəsi belə görünür. Real dünyada provayderlər ictimaiyyətə açıq məlumatları, lisenziyalı mənbələri və təlimçi tərəfindən yaradılan mətnləri [2].

Üst qat: gücləndirmə başlamazdan əvvəl seçilmiş insan nümunələri - yaxşı cavablar, pis cavablar, düzgün istiqamətə yönəlmiş təkanlar [1].

Şəffaflıq xəbərdarlığı: şirkətlər hər detalı açıqlamır. Bəzi mühafizə dirəkləri məxfidir (əqli mülkiyyət, təhlükəsizlik məsələləri), buna görə də faktiki qarışıqla yalnız qismən tanış olursunuz [2].

Real Zaman Axtarışı: Əlavə Üstlük 🍒

Bəzi modellər artıq təlim qabarcığının xaricinə baxa bilirlər. Bu, bərpa ilə artırılmış nəsil (RAG) -əsasən canlı indeks və ya sənəd mağazasından hissələr götürərək sonra cavaba birləşdirir [5]. Xəbər başlıqları və ya səhm qiymətləri kimi sürətli dəyişən şeylər üçün idealdır.

Nəticə nədir? İnternet həm dahilik, həm də zibil atəşidir. Filtrlər və ya mənşə yoxlamaları zəifdirsə, lazımsız məlumatların risk çərçivələrinin xəbərdarlıq etdiyi kimi geri qayıtma riskini daşıyırsınız [3].

Ümumi bir həll yolu: şirkətlər modelləri öz daxili verilənlər bazalarına qoşurlar , buna görə də cavablar mövcud İnsan Resursları siyasətinə və ya yenilənmiş məhsul sənədinə istinad edir, əksinə onu təkzib etmir. Düşünün: daha az "uh-uh" anları, daha etibarlı cavablar.

İncə tənzimləmə: Süni intellektdə cilalama addımı 🧪

Əvvəlcədən hazırlanmış xam modellər yöndəmsizdir. Beləliklə, onlar incə tənzimlənir:

Onlara köməksevər, zərərsiz və dürüst olmağı öyrətmək (insan rəyindən möhkəmləndirmə öyrənməsi, RLHF vasitəsilə) [1].
Təhlükəli və ya zəhərli kənarların zımparalanması (hizalanma) [1].
Səmimi, rəsmi və ya zarafatcıl kinayəli olmasından asılı olmayaraq, tonunu tənzimləmək.

Bu, almazı cilalamaqdan daha çox, statistik uçqunu daha çox söhbət tərəfdaşı kimi davranmağa məcbur etməkdir.

Zərbələr və Uğursuzluqlar 🚧

Gəlin qüsursuz olduğunu iddia etməyək:

Halüsinasiyalar - tamamilə səhv olan dəqiq cavablar [2][3].
Qərəzlilik - məlumatlara daxil edilmiş nümunələri əks etdirir; işarələnmədikdə onları hətta gücləndirə bilər [3][4].
Şorba reseptlərindən danışa bilər , amma heç vaxt dadına baxmayıb [4]
Həddindən artıq özünəinam - nəsr, hətta bilməsə belə, bildiyi kimi axır. Risk çərçivələri fərziyyələri vurğulayır [3].

Niyə hiss olunur 🧠

Onun nə inancı, nə insani mənada yaddaşı, nə də əlbəttə ki, "mənliyi" var. Lakin cümlələri rəvan birləşdirdiyinə görə beyniniz onu sanki başa düşürmüş kimi. Baş verənlər sadəcə böyük miqyaslı növbəti işarə proqnozudur: saniyələr içində trilyonlarla ehtimalı hesablamaq [2].

“Kəşfiyyat” atmosferi ortaya çıxan davranışdır - tədqiqatçılar bunu bir az qəribə şəkildə “stoxastik tutuquşu effekti” adlandırırlar [4].

Uşaqlar üçün uyğun analogiya 🎨

Kitabxanadakı bütün kitabları oxuyan bir tutuquşunu təsəvvür edin. başa düşmür , amma sözləri müdrik hiss etdirən bir şeyə çevirə bilir. Bəzən yerində olur; bəzən cəfəngiyatdır - amma kifayət qədər istedadla həmişə fərqi görmək mümkün deyil.

Xülasə: Süni intellekt məlumatlarının mənşəyi 📌

Sadə dillə desək:

Kütləvi təlim məlumatları (ictimai + lisenziyalı + təlimçi tərəfindən yaradılan) [2].
İnsan rəyi ilə forma tonunu/davranışını dəqiq tənzimləmək [1]
Canlı məlumat axınlarına qoşulduqda əldə etmə sistemləri [5]

Süni intellekt heç nəyi "bilmir" - mətni proqnozlaşdırır. Bu, həm onun super gücü, həm də Axilles dabanıdır. Əsas məsələ? Həmişə vacib məlumatları etibarlı mənbə ilə müqayisə edin [3].

İstinadlar

Ouyang, L. və b. (2022). Dil modellərinin insan rəyi ilə təlimatları izləməsi üçün təlim (InstructGPT). arXiv.
OpenAI (2023). GPT-4 Texniki Hesabatı - lisenziyalı, ictimai və insan tərəfindən yaradılan məlumatların qarışığı; növbəti token proqnozunun məqsədi və məhdudiyyətləri. arXiv.
NIST (2023). Süni intellekt Risklərinin İdarə Edilməsi Çərçivəsi (Sİ RMF 1.0) - mənşəyi, etibarlılığı və risk nəzarəti. PDF.
Bender, EM, Gebru, T., McMillan-Major, A., Mitchell, S. (2021). Stoxastik tutuquşuların təhlükələri haqqında: Dil modelləri çox böyük ola bilərmi? PDF.
Lewis, P. və b. (2020). Bilik İntensiv NLP üçün Axtarışla Genişləndirilmiş Nəsil. arXiv.

Ən son süni intellekt texnologiyalarını rəsmi süni intellekt köməkçisi mağazasında tapın

Haqqımızda

Bloqa qayıt