sajtó csomag
SAJTÓKAPCSOLAT
Tel: +36 1 457 0561
Fax: +36 1 457 0562
Cím: 1115 Budapest,
Bartók Béla út 105-113.
Életre kel Dr. Dolittle. Hogyan tanulja az MI a bálnák, elefántok és méhek kommunikációját?
Életre kel Dr. Dolittle. Hogyan tanulja az MI a bálnák, elefántok és méhek kommunikációját?
A néma természet mítosza
Sokáig ugyanis úgy tartottuk, hogy az állatok kommunikációja egyszerű, ösztönvezérelt jelzések összessége: éhség, félelem, párkeresés. (Szó sem volt még hörcsögökkel meg lovakkal történő kifinomult csevejről, habár már a bibliai idők óta ismertük Bálám szamarának történetét.) A tudományos konszenzus nagyjából ez volt évtizedeken át. Aztán jött az MI, és szertefoszlatta ezt a képet.
A modern számítási biológia az utóbbi öt évben alapvetően átírta, amit az állati kommunikációról gondolunk. A természet nem néma, hanem hipervokális és strukturálisan rendkívül összetett. Csak nem volt még eszközünk meghallani.
Bálnák, kódák és egy 35 milliós fogadás
A terület leglátványosabb vállalkozása a Project CETI (Cetacean Translation Initiative), amely 2020-ban indult azzal a kimondott céllal, hogy dekódolja az ámbráscetek kommunikációját. A projekt nem véletlenül választotta ezt a fajt: a nagy ámbráscet rendelkezik a Föld élőlényei között a legnagyobb aggyal, komplex közösségi hálózatokban él, és kommunikációja szinte kizárólag akusztikus alapú, ami ideálissá teszi a gépi tanulási algoritmusok számára.
A szervezeti háttér is figyelemre méltó. A CETI egy nonprofit tudományos együttműködés, amelyben több mint 15 akadémiai intézmény és technológiai vállalat vesz részt, köztük az MIT CSAIL, a Harvard, a Berkeley és az Imperial College London. A TED Audacious Project keretében 35 millió dolláros támogatást nyertek el, amelyet a Dalio Philanthropies, az OceanX és a Virgin Unite egészít ki.
Az ötlet még 2017-ben született egy harvardi Radcliffe Fellowship program keretében, ahol David Gruber tengerbiológus, Shafi Goldwasser kriptográfus és Michael Bronstein gépi tanulási szakértő felismerte: a modern természetes nyelvfeldolgozási (NLP) technikák alkalmazhatók lehetnek a cetek kódáinak (kattogássorozatainak)elemzésére.
Párhuzamosan, de eltérő módszertannal dolgozik az Earth Species Project (ESP), amelynek célja fajfüggetlen alapmodellek létrehozásaaz élet fájának bármely ágán. Az ESP kutatásai kiterjednek a kormos varjak kooperatív kommunikációjára Spanyolországban, a kardszárnyú delfinek dialektusaira Kanadában, valamint a zebrapintyek szintaxisának elemzésére.
Drónok, tapadókorongok és tengeri gliderek
De hogyan jutnak hozzá egyáltalán az adatokhoz? Az állati kommunikáció rögzítése önmagában mérnöki bravúr.
A hagyományos megfigyelési módszerek, például a hajóról történő adatgyűjtés, gyakran megzavarják az állatok természetes viselkedését. A CETI kutatói ezért FPV versenydrónokat módosítottak, amelyekkel távolról tapadókorongos szenzorokat helyeztek el a bálnák hátán. Ezek a szenzorok hidrofonokat, gyorsulásmérőket, magnetométereket, nyomás- és hőmérséklet-érzékelőket tartalmaznak. A legújabb eszközök, mint a mindössze 12,5 grammos MiniDTAG, már a teljes vokális spektrum rögzítésére képesek.
Emellett autonóm tengeri gliderek (autonóm víz alatti siklójárművek) kísérik a csoportokat akár több száz kilométeren át, a bálnák ekholokációs kattogásait követve, és a Dominica partjainál rögzített hidrofon-hálózatok figyelik folyamatosan az óceán hangjait.
Az összegyűjtött adatok feldolgozása során a kutatók messze túlléptek a hagyományos spektrogram-elemzésen. A modern bioakusztika alapköve ma a Transzformer-modell és az önfelügyelt tanulás (SSL): ezek a rendszerek az emberi csecsemők nyelvtanulásához hasonló módon, címkézetlen adatokból fedezik fel a hangok belső struktúráját. A NatureLM-audio nevű modell például több ezer fajt képes felismerni anélkül, hogy mindegyikre külön betanították volna.
2024: az áttörések éve
2024 kiemelkedő év volt a területen. Két eredmény különösen megrendítette azt, amit az állati intelligenciáról gondolunk.
Az ámbráscetek fonetikai ábécéje. 2024 májusában a Project CETI kutatói a Nature Communications szaklapban publikálták egyik legfontosabb eredményüket. Több mint 9000 kódaalapján az MI-modellek azonosították az ámbráscetek kommunikációjának kombinatorikus szerkezetét: a bálnák négy alapvető paramétert modulálnak, ezek a ritmus, a tempó, a rubato és az ornamentáció. Ez a felfedezés arra utal, hogy a cetek kommunikációja sokkal közelebb áll az emberi fonetikához, mint azt valaha gondoltuk. Egy 2025 novemberi tanulmány azt is kimutatta, hogy az ámbráscetek magánhangzókat és kettőshangzókat is használnak, amelyeket a frekvencia modulálásával hoznak létre.
Az elefántok saját nevei. 2024 májusában egy nemzetközi kutatócsoport a Nature Ecology & Evolution lapban mutatta be, hogy az afrikai elefántok egyedi, névszerű, vokális címkéket használnak egymás megszólítására. A meglepő az, hogy ezek a „nevek" nem utánzáson alapulnak – ellentétben a delfinekkel vagy a papagájokkal – hanem önkényes hangsorok, amelyek az absztrakt gondolkodás magas szintjét jelzik. A lejátszási kísérletekben az elefántok energikusan válaszoltak és közeledtek a forráshoz, ha a saját nevüket hallották, mások nevére viszont alig reagáltak.
A méhek sem maradtak ki a felfedezésekből: az Edinburgh-i Egyetem kutatói feltárták, hogy a követő méhek mindössze 100 neuron segítségével végzik el azt a számítást, amelyhez korábban bonyolult trigonometriai modelleket feltételeztek. Ebből már mezőgazdasági alkalmazás is születik: a neuromorfikus hardverekre épülő projektek célja a méhek táncának valós idejű GPS-koordinátákká alakítása a beporzás optimalizálásához.
Ahol még falakba ütközünk
A lelkesedést érdemes árnyalni. A mélytanulási modellek tanításához nagyságrendekkel több adat kellene, mint amennyivel ma dolgoznak: míg a nagy nyelvi modellek százmilliárd tokenen tanulnak, az ámbráscetek kódjaiból csupán néhány tízezer minta áll rendelkezésre. Ráadásul az óceáni háttérzaj, a viharok és a technikai meghibásodások a felvételek jelentős részét használhatatlanná teszik.
A tudományos közösségen belül komoly vita folyik arról is, hogy az MI valóban megérti-e a jeleket, vagy csupán mintát ismer fel. Az egyik álláspont szerint a statisztikai szabályszerűségek feltárása elegendő a kommunikációs rendszer dekódolásához, a másik szerint az MI csak a közmondásos „sztochasztikus papagáj", amely a következő hangot megjósolja, de a szándékot vagy az érzelmi tartalmat nem érti.
Az etikai kérdések sem elhanyagolhatók. Az MI által generált szintetikus hangok sugárzása a vadon élő populációk környezetében kulturálisan „szennyezheti" a bálnák vagy madarak vokális hagyományát, megzavarhatja a szaporodási és táplálkozási ciklusukat. Sőt, felmerül az is: kié is egyáltalán egy bálna éneke? Az ESP felmérése szerint az emberek 17%-a úgy véli, hogy magukat a bálnákat illetné a jog, 40% pedig a védelmet biztosító közösségnek adná a tulajdonjogot.
Mi jön 2030-ra?
A kutatók várakozása szerint 2030-ra eljutunk odáig, hogy ne csak passzív megfigyelői, hanem aktív résztvevői legyünk a fajok közötti kommunikációnak. A multimodális alapmodellek a hangon kívül videót, mozgásadatokat és környezeti változókat is integrálnak majd, ezzel feloldva a kontextusértelmezési problémákat.
Az MI-alapú bioakusztika korai figyelmeztető rendszerként is működhet az ökoszisztémák állapotára vonatkozóan: sok faj vokális mintázata megváltozik a környezeti stressz hatására hónapokkal azelőtt, hogy a fizikai tünetek láthatóvá válnának. Az orvvadászat elleni harcban már ma 96%-os pontossággal képesek a hangfelismerő szenzorok azonosítani nemcsak az állatokat, hanem a lőfegyvereket vagy a motorfűrészek zaját is az esőerdőkben.
A legmélyebb változás azonban az ember és a természet viszonyában várható. Ha bebizonyosodik, hogy az állatok absztrakt módon gondolkodnak és nevekkel szólítják egymást, az alapjaiban kérdőjelezi meg az emberi kivételesség évszázados doktrínáját. Az ESP 2025-ös felmérése szerint a globális népesség 60%-a nyitott lenne arra, hogy az állatokat is bevonják a demokratikus folyamatokba, emberi közvetítőkön keresztül, például környezetvédelmi döntésekben. Lehetetlen? Hihetetlen? Egykor az emberszabásúak védelme, a hollywoodi filmekben a gerinces állatok „megkímélése”, vagy a cirkuszban a vadállatokkal kapcsolatos produkciók betiltása is ugyanilyennek tűnt.
A következő évtized sorsdöntő lesz abban, hogy sikerül-e a technológiát az ökológiai egyensúly helyreállítására használni, vagy az csupán az állatok feletti kontroll újabb eszközévé válik. Addig is: talán érdemes más szemmel nézni arra a bálnára, amely kattog az óceánban. Lehet, hogy épp valakinek a nevét suttogja.
-
A homár felemelkedése, avagy az OpenClaw tündöklése
-
Az AI és az energiakérdés