◇曹夢雪 王志偉(語言學(xué)重點實驗室)
在嬰兒九個月大時,一場深刻的變革正在搖籃中悄然醞釀。美國發(fā)展心理學(xué)家邁克爾·托馬塞洛(Michael Tomasello)將這一個關(guān)鍵節(jié)點稱為人類認(rèn)知發(fā)展的“九月革命”,它標(biāo)志著嬰兒從孤立的個體走向共享的心智,具備了成為文化學(xué)習(xí)者的基本條件。我們將這一過程稱作“九月蛻變”,因為它不僅體現(xiàn)了生理成長,更是一次認(rèn)知結(jié)構(gòu)的重組。當(dāng)人工智能正試圖跨越從“工具”到“伙伴”的鴻溝時,搖籃中的秘密也許能為我們提供重要啟示。
“九月蛻變”與“認(rèn)知大爆發(fā)”
人類認(rèn)知發(fā)展的“九月蛻變”主要體現(xiàn)在共同注意、意圖理解、指點行為與模仿行為四個方面。這些能力的萌芽,就像心智發(fā)展中的四根支柱,為嬰兒搭建起通往語言、文化與社會生活的橋梁。
共同注意:從“我和你”到“我們和世界”。共同注意指兩個人同時將注意力聚焦在同一個外部目標(biāo)上,并意識到彼此都在關(guān)注它。這看似簡單,但卻是人類心智發(fā)展中的里程碑。正因如此,嬰兒開始意識到另一個人的目光和心智,并逐漸建立起“我們一起在看”的心理通道。在嬰兒、家長與世界的三元互動中,通過對共同注意關(guān)系的理解,嬰兒同樣可以成為交際鏈條的主導(dǎo)者。他們會根據(jù)自己的交際意圖,主動吸引他人的注意,并觀察對方的反饋。這也進(jìn)一步使語言學(xué)習(xí)成為可能。通過三元互動,嬰兒可以逐漸學(xué)會將他們聽到的聲音與同時看到的事物關(guān)聯(lián)起來,進(jìn)而建立聲音模式、信息結(jié)構(gòu)與現(xiàn)實意義之間的對應(yīng)關(guān)系。共同注意提供了語言系統(tǒng)的坐標(biāo)系,構(gòu)建了“形式—結(jié)構(gòu)—意義”的三維地圖。
意圖理解:行為背后的“小偵探”。嬰兒逐漸明白,一個人做出某個動作,不只是身體的物理運(yùn)動,更是出于心理目標(biāo)的驅(qū)動。此時的嬰兒不再只是觀察者,而開始主動嘗試?yán)斫馑诵袨楸澈蟮囊鈭D。意圖理解奠定了社會互動的基礎(chǔ)。突破對行為的簡單模仿,使嬰兒開始成為一個能揣摩他人、預(yù)測行動、參與協(xié)作的社會成員。與此同時,嬰兒還會積極從語音線索中捕捉規(guī)律。例如,通過韻律特征來區(qū)分說話者的意圖,將降調(diào)理解為默認(rèn)配置,而將非降調(diào)(如高調(diào)或升調(diào))理解為可以引起注意的手段。
指點行為:搖籃里的“第一句話”。伴隨主觀意識的萌芽,嬰兒開始用手指指向物體,同時還會伴隨眼神交互或咿呀的“話語”。這種“指點”行為不僅限于索取東西的“命令性指點”,他們還會指向感興趣的物體,希望大人同他們一起關(guān)注,這是一種“宣告性指點”。這些指點行為是嬰兒早期交流的重要方式,而當(dāng)大人忽視他們的指點時,他們會用自己的方式吸引大人的注意,顯示出對交流互動的期待。指點是心智透明化的第一步,是語言背后的社會性動力在現(xiàn)實中的體現(xiàn)。
模仿行為:社交游戲的開端。模仿,是嬰兒學(xué)習(xí)社會行為的法寶。通過模仿,嬰兒不只是復(fù)刻動作,而是在“扮演”對方的心智。幽默,這一高級社交能力得以在模仿中萌發(fā)。嬰兒會開始做鬼臉,會假裝做大人不讓做的事情以逗引大人。這種“有心智的模仿”標(biāo)志著嬰兒進(jìn)入了社會性學(xué)習(xí)的軌道。模仿不只是學(xué)習(xí)行為,更是進(jìn)入文化的鑰匙。在一次次你做我學(xué)的互動中,嬰兒逐漸掌握了社會習(xí)俗、交際規(guī)則和行為規(guī)范。同時,這也為語言發(fā)展早期階段的“模仿發(fā)音”行為打下了基礎(chǔ)。
探索人工智能的路徑與思辨
觀察當(dāng)下AI領(lǐng)域的主要探索方向,有兩條截然不同的路徑:一條注重輸出表現(xiàn),重視最優(yōu)解的判定鏈條;另一條則關(guān)注過程模擬,試圖還原智能的生成邏輯。哪一條路徑更有希望通向真正的智能?答案或許就隱藏在嬰兒那場九個月左右悄然爆發(fā)的深刻變革之中。
人工智能技術(shù)的主流發(fā)展路徑之一,是建立在大規(guī)模數(shù)據(jù)訓(xùn)練基礎(chǔ)之上的黑箱式方法。這種方法關(guān)注輸入和輸出之間的映射關(guān)系,目的在于尋求獲取最優(yōu)解的最佳路徑,而不考慮中間過程的可解釋性與機(jī)制建構(gòu)。依此構(gòu)建的大語言模型,能夠在眾多任務(wù)中展現(xiàn)出接近人類水平的語言生成能力。然而,模型內(nèi)部卻并不真正理解語言的意義,也不具備穩(wěn)定的世界知識結(jié)構(gòu)。這種形式的智能,只是對表面模式的高效提取和重組,而非源于內(nèi)部認(rèn)知系統(tǒng)的主動建構(gòu)。
黑箱路徑的成功,容易讓人產(chǎn)生錯覺:只要系統(tǒng)能夠模擬出人的行為輸出,就可以認(rèn)定它擁有了人的智能。被譽(yù)為“人工智能教父”的杰弗里·辛頓(Geoffrey Hinton)認(rèn)為,既然大語言模型能夠完成許多復(fù)雜任務(wù),我們就無需過多關(guān)注其內(nèi)部機(jī)制,甚至可以將模型本身視作一種全新的認(rèn)知體系。與黑箱路徑相對的,是一種強(qiáng)調(diào)過程建構(gòu)和認(rèn)知模擬的發(fā)展思路。這條路徑認(rèn)為,真正的人類智能,不僅體現(xiàn)在輸入與輸出的對應(yīng)關(guān)系上,更蘊(yùn)含于中間復(fù)雜而動態(tài)的信息加工過程之中。Meta首席AI科學(xué)家楊立昆(Yann LeCun)認(rèn)為,人工智能如果想達(dá)到動物乃至人類的智慧水平,就必須學(xué)習(xí)嬰兒認(rèn)知世界的方式,包括自主探索、動機(jī)驅(qū)動、因果推理、跨模態(tài)整合等多種機(jī)制。
“九月蛻變”揭示的不是經(jīng)驗驅(qū)動下行為技能的簡單積累,而是內(nèi)在機(jī)制推動的認(rèn)知架構(gòu)的系統(tǒng)性重組。人工智能的發(fā)展,不僅需要學(xué)習(xí)“結(jié)果”,更要學(xué)習(xí)“過程”;不僅要模仿表象,更要內(nèi)化機(jī)制。這種路徑雖然發(fā)展更慢、實現(xiàn)更難,但它所指向的,或許才是更接近人類認(rèn)知本質(zhì)的智能形態(tài)。
破解搖籃鏡像下的智能密碼
“九月蛻變”是人類智能真正啟動的關(guān)鍵時刻,它不僅揭示了人類認(rèn)知發(fā)展的基本邏輯,也為人工智能的未來提供了重要的理論參照。回顧嬰兒智能的萌芽過程,具有三點核心啟示。
首先,本質(zhì)突破不是量的堆積,而是質(zhì)的轉(zhuǎn)變。真正意義上的智能飛躍,并不是因為嬰兒接收了更多的信息輸入,而是因為其認(rèn)知機(jī)制本身發(fā)生了結(jié)構(gòu)性的變化。人類智能的根本特征不是信息處理本身,而是對他人意圖、關(guān)注與情感狀態(tài)的感知和理解。因此,AI系統(tǒng)僅僅復(fù)現(xiàn)人類的語言形式或行為表征還遠(yuǎn)遠(yuǎn)不夠,真正的智能需要在交互中推斷、理解甚至預(yù)期他人的意圖。實現(xiàn)智能突破,并不會單純依賴模型規(guī)模的擴(kuò)展或訓(xùn)練數(shù)據(jù)量的增長,更關(guān)鍵的是系統(tǒng)內(nèi)部觸發(fā)的認(rèn)知變革,以及信息整合和意義建構(gòu)的機(jī)制。
“多模態(tài)融合”是人類認(rèn)知世界的天然特性,但對于AI來說,整合語音、圖像、動作等多模態(tài)信息,不僅需要同步算法,更重要的是形成對“哪類信息該與哪類信息同步”的感知偏好和推理能力。AI想要提升智能,就必須具備在互動中理解心智的能力,例如利用副語言信息等多模態(tài)特征捕捉社交情境、識別言語意圖、理解情感態(tài)度,而不僅僅局限于解讀文字的表面含義。
其次,智能的關(guān)鍵在于主動建構(gòu),而非被動響應(yīng)。嬰兒從一個依賴外界刺激作出反應(yīng)的客體轉(zhuǎn)變?yōu)橐粋€能主動參與社會互動的主體,使學(xué)習(xí)成為一種主動建構(gòu)過程。他們通過注視、聲音、手勢等方式,吸引他人的注意,分享自己的興趣和體驗。這種主動性標(biāo)志著嬰兒學(xué)習(xí)模式和交互方式的轉(zhuǎn)變。
被動響應(yīng)型系統(tǒng),只是在已有信息上做匹配和優(yōu)化;而主動建構(gòu)型系統(tǒng),則需要不斷生成新的交互機(jī)會、創(chuàng)造新的信息鏈接。AI系統(tǒng)不能局限于根據(jù)輸入給出最優(yōu)回應(yīng),更要在交互中提出問題、引發(fā)探索、表達(dá)意圖、建構(gòu)新解,以實現(xiàn)從“感知—反應(yīng)”系統(tǒng)向“交互—建構(gòu)”系統(tǒng)的躍遷。
最后,從“黑箱”到“過程”,智能需要可解釋性和演化性。嬰兒的認(rèn)知發(fā)展是一個連續(xù)展開、不斷調(diào)整和重塑的過程,而不是一次性完成的結(jié)果擬合。“九月蛻變”展現(xiàn)了人類智能演化的過程性特征,新的能力不是直接“獲得”的,而是在與環(huán)境和他人持續(xù)的互動中自我組織、自發(fā)生成的。
當(dāng)前,大多數(shù)人工智能系統(tǒng)更多依賴的是結(jié)果導(dǎo)向的優(yōu)化。然而,真正有生命力的智能,不是單純的“輸入—輸出”擬合,而是需要經(jīng)歷一個動態(tài)演化的學(xué)習(xí)過程。系統(tǒng)內(nèi)部需要存在可以持續(xù)調(diào)整、不斷豐富的表征體系;外部環(huán)境則提供多樣化、可塑性的交互機(jī)會。兩者相互作用,智能才得以真正形成和成長。從嬰兒的“九月蛻變”中可以看出,真正類人的人工智能,必須經(jīng)歷從孤立信息處理到社會認(rèn)知理解、從單向輸入到雙向建構(gòu)的認(rèn)知飛躍。在未來,AI系統(tǒng)可能不僅僅是人類指令的執(zhí)行者,還會成為能夠理解人類意圖、共同建構(gòu)知識、參與社會互動的協(xié)作者。面對人口老齡化、教育資源不均、鄉(xiāng)村振興等重大社會問題,基于“九月蛻變”設(shè)計的社會型智能系統(tǒng),或?qū)⒊蔀槠平馕磥硖魬?zhàn)的重要力量。隨著人工智能沿著嬰兒認(rèn)知發(fā)展的軌跡逼近類人智能,關(guān)于機(jī)器意圖、情感理解與社會參與的倫理問題將日益凸顯。真正的心智意味著責(zé)任的誕生,我們必須重新界定智能體的社會地位與邊界。未來,如何在推動智能成長與守護(hù)倫理底線之間取得平衡,將成為人工智能發(fā)展不可回避的挑戰(zhàn)。理解嬰兒“九月蛻變”的智慧,不僅是技術(shù)創(chuàng)新的鑰匙,更是智能時代中維系人文關(guān)懷與責(zé)任意識的燈塔。
(本文系中國社會科學(xué)院語言學(xué)重點實驗室(2024SYZH001)階段性成果)