AI Təlimçisi nədir?

Süni intellekt bəzən sanki sehrli fənd kimi hiss olunur. Siz təsadüfi sual yazırsınız və bam - hamar, cilalanmış cavab saniyələr ərzində görünür. Ancaq burada əyri top var: hər bir "dahi" maşının arxasında onu dürtmək, düzəldən və yol boyu formalaşdıran faktiki insanlar var. süni intellekt üzrə təlimçilər deyilir və onların gördükləri iş əksər insanların düşündüyündən daha qəribə, gülməli və səmimidir.

Gəlin bu təlimçilərin nə üçün vacib olduğunu, onların gündəlik həyatlarının əslində necə göründüyünü və niyə bu rolun hər kəsin proqnozlaşdırdığından daha tez partladığını görək.

Bundan sonra oxumaq istədiyiniz məqalələr:

🔗 AI arbitrage - Buzzword arxasında həqiqət
AI arbitrajını, onun risklərini, faydalarını və ümumi yanlış təsəvvürləri izah edir.

🔗 AI üçün məlumat saxlama tələbləri: Həqiqətən bilməli olduğunuz şey
Süni intellekt sistemləri üçün saxlama ehtiyaclarını, genişlənmə qabiliyyətini və səmərəliliyi əhatə edir.

🔗 AI atası kimdir?
Süni intellektin qabaqcıllarını və süni intellektin mənşəyini araşdırır.

Bərk AI Təlimçisini nə edir? 🏆

Bu, düymələri döymək işi deyil. Ən yaxşı məşqçilər istedadların olduqca qəribə qarışığına söykənirlər:

Səbir (çox şey) - Modellər bir atışda öyrənmirlər. Təlimçilər yapışana qədər eyni düzəlişləri vurmağa davam edirlər.
Spotting nüans - Sarkazm, mədəni kontekst və ya qərəzliyi tutmaq insan rəyinə üstünlük verən şeydir [1].
Birbaşa ünsiyyət - İşin yarısı AI-nin səhv oxuya bilməyəcəyi aydın təlimatlar yazmaqdır.
Maraq + etika - Yaxşı təlimçi cavabın "faktiki olaraq düzgün" olub-olmadığını, lakin sosial cəhətdən zəif olub-olmadığını soruşur - AI nəzarətində əsas mövzu [2].

Sadə dillə desək: təlimçi qismən müəllim, hissə redaktor və etik bir tiredir.

Bir Baxışda AI Təlimçisi Rolları (Bəzi Qüsurlarla 😉)

Rol növü	Kim Ən Yaxşı Uyğundur	Tipik Ödəniş	Niyə işləyir (və ya işləmir)
Məlumat etiketləyicisi	İncə detalları sevən insanlar	Aşağı-Orta $$	Mütləq həlledici; etiketlər səliqəsizdirsə, bütün model əziyyət çəkir [3] 📊
RLHF Mütəxəssisi	Yazıçılar, redaktorlar, analitiklər	Orta-Yüksək $$	İnsan gözləntiləri ilə ton və aydınlığı uyğunlaşdırmaq üçün cavabları sıralayır və yenidən yazır [1]
Domen Təlimçisi	Hüquqşünaslar, həkimlər, ekspertlər	Bütün xəritədə 💼	Sənayeyə aid sistemlər üçün niş jarqon və kənar vəziyyətləri idarə edir
Təhlükəsizlik Rəyçisi	Etik düşüncəli insanlar	Orta $$	Süni intellekt zərərli məzmunun qarşısını almaq üçün təlimatları tətbiq edir [2][5]
Yaradıcı Təlimçi	Rəssamlar, hekayəçilər	Gözlənilməz 💡	Təhlükəsiz sərhədlər daxilində qalaraq süni intellekt təxəyyülün əks-sədasına kömək edir [5]

(Bəli, formatlaşdırma bir az qarışıqdır - işin özü kimi.)

Süni intellekt üzrə Təlimçinin Həyatında Bir Gün

Beləliklə, faktiki iş necə görünür? Daha az məftunedici kodlaşdırma və daha çox düşünün:

Süni intellektlə yazılmış cavabların ən pisdən yaxşıya doğru sıralanması (klassik RLHF addımı) [1].
Qarışıqların düzəldilməsi (məsələn, model Veneranın Mars olmadığını unutduqda).
Chatbot cavablarının daha təbii səslənməsi üçün yenidən yazılması.
Mətn, şəkillər və ya audio dağlarının etiketlənməsi - dəqiqliyin həqiqətən vacib olduğu yerlərdə [3].
“Texniki cəhətdən düzgün”ün kifayət qədər yaxşı olub-olmadığını və ya təhlükəsizlik qaydalarına üstünlük verilməli olduğunu müzakirə etmək [2].

Bu, bir hissəsi üyütmək, bir hissəsi tapmacadır. Düzünü desəm, bir tutuquşuya sadəcə danışmağı deyil, sözləri bir az səhv istifadə etməyi də öyrətdiyinizi təsəvvür edin - bu, vibedir. 🦜

Niyə Təlimçilər Düşündüyünüzdən Daha Önəmlidir

İnsan sükanı olmadan süni intellekt:

Səs sərt və robotik.
Qeyri-adiliyi yoxlayın (qorxulu fikir).
Yumor və ya empatiya tamamilə darıxır.
Həssas kontekstlərdə daha az təhlükəsiz olun.

Məşqçilər “dağınıq insan işlərinə” - jarqon, isti münasibət, arabir səliqəsiz metafora - gizlicə girənlərdir, eyni zamanda hər şeyi təhlükəsiz saxlamaq üçün qoruyucu barmaqlıqlar tətbiq edirlər [2][5].

Əslində sayılan bacarıqlar

Doktorluq dərəcəsinə ehtiyacınız olduğu barədə mifi unudun. Ən çox kömək edən budur:

Yazı + redaktə pirzola - Cilalanmış, lakin təbii səslənən mətn [1].
Analitik düşünmə - Təkrarlanan model səhvlərini aşkar etmək və düzəliş etmək.
Mədəni məlumatlılıq - İfadələrin nə vaxt səhv ola biləcəyini bilmək [2].
Səbir - Çünki süni intellekt dərhal işə düşmür.

Çoxdilli bacarıqlar və ya niş təcrübə üçün bonus xalları.

Təlimçilərin göründüyü yer 🌍

Bu iş təkcə chatbotlarla bağlı deyil - o, hər sektora gizlicə girir:

Səhiyyə - Sərhəd halları üçün annotasiya qaydalarının yazılması (sağlamlıq AI rəhbərliyində əks olunub) [2].
Maliyyə - İnsanları yalançı həyəcan siqnallarında boğmadan fırıldaqçılığın aşkarlanması sistemlərinin öyrədilməsi [2].
Pərakəndə satış - Köməkçilərə brend tonuna sadiq qalaraq cılız alış-veriş lingosu almağı öyrədir [5].
Təhsil - Repetitor botlarını himayə etmək əvəzinə həvəsləndirici olmaq üçün formalaşdırmaq [5].

Əsasən: süni intellektin stolda oturacağı varsa, arxa planda gizlənən bir məşqçi var.

Etika Biti (Bunu keçmək olmaz)

Burada ağırlaşır. Yoxlanılmayan süni intellekt stereotipləri, dezinformasiyaları və ya daha pisləri təkrarlayır. Təlimçilər RLHF və ya modelləri faydalı, zərərsiz cavablara yönəldən konstitusiya qaydaları kimi üsullardan istifadə etməklə bunu dayandırırlar [1][5].

Nümunə: bot qərəzli iş tövsiyələrini irəli sürürsə, məşqçi onu işarələyir, qaydalar kitabını yenidən yazır və bunun bir daha təkrarlanmamasına əmin olur. Bu fəaliyyətdə nəzarətdir [2].

O qədər də əyləncəli olmayan tərəf

Hamısı parlaq deyil. Təlimçilər məşğul olurlar:

Monotoniya - Sonsuz etiketləmə köhnə olur.
Emosional yorğunluq - Zərərli və ya narahatedici məzmunu nəzərdən keçirmək çox zərər verə bilər; dəstək sistemləri mühüm əhəmiyyət kəsb edir [4].
Tanınmamaq - İstifadəçilər nadir hallarda təlimçilərin mövcud olduğunu başa düşürlər.
Daimi dəyişiklik - Alətlər dayanmadan inkişaf edir, yəni təlimçilər ayaqlaşmalıdırlar.

Yenə də bir çoxları üçün texnologiyanın “beyinlərini” formalaşdırmaq həyəcanı onları bağlı saxlayır.

AI-nin Gizli MVP-ləri

Beləliklə, AI təlimçiləri kimlərdir? insanlar üçün işləyən xam alqoritmlər və sistemlər arasında körpüdür Onlar olmasaydı, süni intellekt kitabxanaçıları olmayan bir kitabxanaya bənzəyirdi - tonlarla məlumat, lakin istifadə etmək demək olar ki, qeyri-mümkündür.

Növbəti dəfə chatbot sizi güldürür və ya heyrətləndirici dərəcədə “ahəngdə” hiss edir, məşqçiyə təşəkkür edirəm. Onlar maşınları yalnız hesablamaqla yanaşı, [1][2][5] birləşdirən sakit fiqurlardır.

İstinadlar

[1] Ouyang, L. et al. (2022). İnsan rəyi ilə təlimatlara əməl etmək üçün dil modellərini öyrədin (InstructGPT). NeurIPS. Link

[2] NIST (2023). Süni İntellekt Risk İdarəetmə Çərçivəsi (AI RMF 1.0). Link

[3] Northcutt, C. et al. (2021). Test dəstlərində yayılmış etiket xətaları Maşın Öyrənmə Benchmarklarını qeyri-sabitləşdirir. NeurIPS Datasets & Benchmarks. Link

[4] ÜST/BƏT (2022). İş yerində psixi sağlamlıq haqqında təlimatlar. Link

[5] Bai, Y. et al. (2022). Konstitusiya AI: AI Əlaqəsindən zərərsizlik. arXiv. Link

Rəsmi AI köməkçisi mağazasında ən son AI-ni tapın

Haqqımızda

Bloqa qayıt

Ölkə/region