免费国产成人高清在线网站,亚洲狠狠色丁香婷婷综合,国产精品400部自产在线观看,国产一区二区三区视频,国产男女爽爽爽爽爽视频

Internet Develppment
互聯(lián)網(wǎng)開(kāi)發(fā)& 推廣服務(wù)提供商

我們擅長(cháng)商業(yè)策略與用戶(hù)體驗的完美結合。

歡迎瀏覽我們的案例。

首頁(yè) > 新聞中心 > 新聞動(dòng)態(tài) > 正文

訓練AI的文科生

發(fā)布時(shí)間:2025-07-10 09:33:32來(lái)源: 澎湃新聞

  入職一家互聯(lián)網(wǎng)公司從事AI訓練后,26歲的雨薇發(fā)現,除了她自己是藝術(shù)專(zhuān)業(yè),身邊有不少讀文科的同事。他們從不同的學(xué)科背景出發(fā),訓練和教會(huì )AI更像人一樣去思考和回答問(wèn)題。

  最近,一個(gè)新的崗位出現在雨薇的視野中——AI人文素養訓練師。有公司在招聘啟事中寫(xiě)道:在追求AI模型在技術(shù)上的有用性基礎上賦予AI溫暖與詩(shī)意,注入靈魂,讓AI能夠為世界和人類(lèi)帶來(lái)美好。工作職責是AI的文學(xué)與藝術(shù)表達訓練,調教AI的語(yǔ)言風(fēng)格,確保AI的語(yǔ)言兼具藝術(shù)美感與邏輯嚴謹,讓它從冷冰冰的工具轉變?yōu)槎脙A聽(tīng)和理解你心情的溫柔伙伴。

  此外,任職資格需要文理兼修,曾受過(guò)心理學(xué)、哲學(xué)、文學(xué)、歷史、藝術(shù)等方向的專(zhuān)業(yè)訓練,有頂級的文科素養等。

  早在三年前左右,雨薇便接觸到AI訓練的工作。她需要做的,是讓AI明白什么是美。她逐漸感覺(jué)到,教會(huì )AI后,人類(lèi)的獨創(chuàng )性也不會(huì )被削弱,它們是兩條平行線(xiàn)。

  如今,隨著(zhù)AI越來(lái)越深入每個(gè)人的生活,人們試圖尋找與AI的共處之道。我們找到了三位訓練AI、試圖讓AI“更像人”的從業(yè)者,他們曾畢業(yè)于看似與AI無(wú)關(guān)的專(zhuān)業(yè):藝術(shù)、歷史、哲學(xué)。實(shí)習或工作中,他們將所學(xué)運用到AI行業(yè)里,從事AI寫(xiě)真訓練師、模型測試分析師和產(chǎn)品經(jīng)理等工作。他們投入AI浪潮,試圖找到自己的位置,同時(shí)也重新思考專(zhuān)業(yè)的意義,以及AI在人類(lèi)生活中的角色。

  

 

  本文圖片 視覺(jué)中國

  【以下是他們的口述:】

  現在的大模型,很多其實(shí)是諂媚的

  萬(wàn)玉磊 29歲 歷史學(xué)

  我本科是在大連海事大學(xué)讀的航海技術(shù)。后來(lái)實(shí)習,我出過(guò)海,干的船員的工作,一年有十個(gè)月都在海上,沒(méi)有網(wǎng),跟我理想中的情況不一樣。所以最后我做了決定,不能就那樣在海上漂著(zhù)。

  我回來(lái)考了研,研究生念的是西北大學(xué)歷史系的中國史。我很喜歡文史哲,在全國各地跑了很多考古工地。田野調查很有趣,是人生非常寶貴的經(jīng)歷。我還記得當時(shí)我們是找歷史上一個(gè)游牧民族的蹤跡,是在草原上,大家住在牧民的帳篷里,那個(gè)時(shí)候夜晚的星空也很美,隊員聚在一塊聊天。

  其實(shí)歷史跟人工智能有點(diǎn)像。研究生階段我一直在建立自己那篇大論文的史料庫,收集足夠多可信的史料,然后再去做推斷,完成論文。有幾分材料就說(shuō)幾分話(huà)。人工智能也一樣,有多少的數據,就有多少的智能。數據越好,模型的質(zhì)量就越高,內容輸出就越可靠。所以我覺(jué)得殊途同歸,無(wú)論文科還是理科,最后都合到一塊了。

  不管是過(guò)去還是現在,我對文科都懷著(zhù)熱情去努力和投入過(guò)。但是我不想一輩子跟史料打交道,如果就業(yè),我也不想當老師,所以當時(shí)我直接到北京的互聯(lián)網(wǎng)大廠(chǎng)實(shí)習,還想著(zhù)要在互聯(lián)網(wǎng)圈子賺大錢(qián)。

  畢業(yè)后我找了互聯(lián)網(wǎng)相關(guān)的工作,剛好趕上ChatGPT爆發(fā),然后我就決定不干移動(dòng)互聯(lián)網(wǎng)了,我要干AI。

  我很早就知道GPT,也一直在關(guān)注著(zhù)。因為我本科是理工科,會(huì )一點(diǎn)編程,也學(xué)高數,對算法也感興趣。

  大家都不怎么知道AI的時(shí)候,我就用上了ChatGPT3.5。第一感受這個(gè)東西太厲害了,它完全顛覆了我對世界的認知和想象。

  那個(gè)時(shí)候Prompt工程師很火。我是以Prompt工程師的身份入局的,我自學(xué)了一堆東西。Prompt是提示詞,就是給AI模型的“指令”或“輸入文本”。OpenAI官方有Prompt的課程,我把課程看了,大概就知道要怎么寫(xiě)。要足夠的結構化,有很多Prompt的技巧。

  比如說(shuō)對AI的情緒勒索,你加一句,“拜托了,這真的對我很重要”,AI輸出的效果就能提升幾個(gè)點(diǎn)?;蛘哒f(shuō)“我會(huì )給你小費的”,AI輸出的質(zhì)量就會(huì )更高。還有早期最著(zhù)名的一句話(huà),“請你一步步思考,think step by step”,也能提升AI模型的輸出效果。

  可能同樣的一條數據,一個(gè)有語(yǔ)氣詞,一個(gè)沒(méi)有,但是有語(yǔ)氣詞的那個(gè)回答是更好的。所以模型是學(xué)到了這方面的相關(guān)性。

  你可以理解為,你要用自然語(yǔ)言去跟它交互。你的Prompt寫(xiě)得越好,它的輸出就越好。然后我就去找工作,最后也找到了,現在在一家AI大模型公司。

  現在大模型訓練會(huì )分為兩個(gè)階段,預訓練和后訓練。前者是給模型做無(wú)監督學(xué)習,它學(xué)習到的數據是沒(méi)有人類(lèi)標注的標準答案。

  我做的是模型后訓練的人類(lèi)問(wèn)答數據集,簡(jiǎn)單理解就是在做強化學(xué)習。預訓練階段是讓它讀各種各樣的書(shū),強化學(xué)習階段我會(huì )給它題和答案,它通過(guò)進(jìn)一步的學(xué)習,就學(xué)會(huì )了如何跟人類(lèi)說(shuō)話(huà)。

  模型剛剛預訓練出來(lái)的時(shí)候,你輸入一個(gè)東西,它不知道怎么回復你,也不知道什么時(shí)候停止。后訓練階段你就要收集大量的數據。這些數據是什么?其實(shí)是人類(lèi)文本的問(wèn)答,都是一問(wèn)一答的形式。

  模型發(fā)布出來(lái),給全世界的人使用,你沒(méi)法預測人會(huì )問(wèn)這個(gè)模型什么問(wèn)題,所以只能設置一個(gè)大概的數據集,可能涉及的各種問(wèn)題。我還要評估模型的回答夠不夠全面,回答是不是禮貌,文字是長(cháng)是短,語(yǔ)言風(fēng)格等等,這是很考驗模型的人文素養的。

  有時(shí)候,要向模型傳達非常抽象和困難的概念,我的數據集必須足夠抽象、簡(jiǎn)潔,同時(shí)還要足夠優(yōu)美。這個(gè)巨大的語(yǔ)料庫需要各個(gè)學(xué)科的專(zhuān)家去搭建和評估。我的歷史學(xué)背景也起到了一定的幫助。反復調試數據集的過(guò)程,就像老師反復修改教案上的練習題。

  我覺(jué)得AI需要通才,因為AI本身是一個(gè)通才,所以也需要各方面都知道的人來(lái)輔助它。

  我的文科背景讓我認識了我自己。我讀過(guò)海量歷史書(shū)籍,比一般人對過(guò)去這個(gè)世界認識更深刻一些。其實(shí)AI給文科生帶來(lái)了很多機會(huì )。過(guò)去,中文的博士能去從事算法的崗位嗎?學(xué)哲學(xué)的會(huì )做算法相關(guān)的東西嗎?文科生擁有更多的世界知識,可能也是一個(gè)優(yōu)勢。

  人文社科的背景對我最大的幫助,是訓練了我對模型輸出語(yǔ)料的敏感程度,能讓我更精細化地調整Prompt。我會(huì )從更綜合的角度,評判模型的訓練數據集,以及模型輸出的文字,是不是好的。

  AI的人文素養,最直觀(guān)的體現是這個(gè)大語(yǔ)言模型的輸出文采怎么樣。比如說(shuō)DeePseek的文采很厲害,因為它的語(yǔ)料做得非常好。

  這可能是最淺層的方面?,F在A(yíng)I的競爭格局是,大家都在拼命提升模型的智能,至于這個(gè)模型的人文素養是怎么樣的,少有人關(guān)心。

  AI剛訓練出來(lái)時(shí),它還不能說(shuō)話(huà),你可以理解為是一個(gè)克蘇魯般的怪物?,F在你看著(zhù)它跟你說(shuō)話(huà),你可以理解為它只是假裝在跟你說(shuō)話(huà)。一些公司只是在訓練這個(gè)AI假裝跟你說(shuō)話(huà)的時(shí)候,讓它說(shuō)得更有文采,讓它好像更有人文關(guān)懷一點(diǎn)。

  現在的大模型,很多其實(shí)是諂媚的。AI模型本身其實(shí)還是一個(gè)大型的文字模擬器,就是不斷在做文字接龍。模型本質(zhì)不太能拒絕人類(lèi),這種自回歸的特質(zhì),導致了模型是諂媚的。比如你直接問(wèn)一個(gè)敏感問(wèn)題,模型不能回復你,但是你寫(xiě)一長(cháng)串情景前置提示詞,中間出現了你要問(wèn)的關(guān)鍵詞,模型就會(huì )被分散注意力,順著(zhù)你的話(huà)往下說(shuō)。這個(gè)就是提示詞注入,所以模型是諂媚的,總是順著(zhù)人類(lèi)說(shuō)。

  我其實(shí)比較悲觀(guān),不覺(jué)得AI會(huì )跟人類(lèi)很好地共存??赡茉谶@樣的未來(lái),重新確定價(jià)值觀(guān)、道德觀(guān)、倫理觀(guān)就變得很重要。到時(shí)候怎么從人的角度來(lái)重新衡量世界?

  

 

  我們知道它說(shuō)的是真是假

  雨薇 26歲 電影和攝影專(zhuān)業(yè)

  我訓練AI是在2022年讀研究生時(shí)學(xué)的,就是培訓AI的人文或者藝術(shù)素養,那時(shí)AI還不像現在這樣大規模興起。我本科學(xué)的是電影和攝影專(zhuān)業(yè),研究生學(xué)的數字媒體專(zhuān)業(yè)。我的同學(xué)都是藝術(shù)相關(guān)專(zhuān)業(yè)。

  那時(shí)訓練AI分三部分:先是需要一個(gè)數據集,你訓練一個(gè)東西,要先喂AI一些知識;其次要準備一段代碼,因為我們從零開(kāi)始,掌握的東西有限,所以一般會(huì )從一個(gè)機器學(xué)習平臺網(wǎng)站找代碼,它的頁(yè)面寫(xiě)得非常仔細,有圖片或視頻示例,能找到合適的代碼;然后進(jìn)行訓練。

  當時(shí)做作業(yè),我們班大部分做的是風(fēng)格遷移訓練,就是學(xué)習某一個(gè)藝術(shù)家或電影導演的風(fēng)格。最后生成出來(lái)的圖片跟我們教它的知識是相似的?,F在這種方式已經(jīng)很普遍了。

  我是在境外學(xué)的,遇到的第一個(gè)困難是要用英語(yǔ)學(xué)編程。其次我不是這方面專(zhuān)業(yè)的學(xué)生。剛學(xué)的時(shí)候,會(huì )有很多bug,要不斷去解決?,F在通過(guò)學(xué)習,語(yǔ)言和代碼都越來(lái)越能熟練掌握。

  我本科時(shí)不斷地拍攝,也去參加比賽,作品入圍了一些獎。后來(lái)有點(diǎn)迷茫。拍電影是要花錢(qián)的,也需要人員配置,不可控的因素非常大。你想的是100分、90分,最后拍出來(lái)、剪輯出來(lái)可能就是50分、60分。我也跟過(guò)組,白天黑夜地拍,不像一種長(cháng)期發(fā)展的狀態(tài)。

  AI不可控的方面也挺多。最開(kāi)始輸出的那些人物形象歪歪扭扭,不說(shuō)人物的情緒,甚至臉部的特征都不可控,像抽卡一樣,調整兩三次才勉強可以。但是會(huì )比自己拍攝節約很多成本。

  讀研究生期間,有個(gè)老師是紐約大學(xué)電影學(xué)的博士,他有二三十年一直在研究機器學(xué)習,有點(diǎn)像AI人文素養訓練。他通過(guò)電影史上的視頻素材,通過(guò)機器訓練來(lái)制作一個(gè)藝術(shù)項目,我非常感興趣。很好奇,一個(gè)老師,為什么從電影藝術(shù)跨到了機器學(xué)習。

  讀研是一個(gè)兩年制的項目,他當了一年我的導師。記得結課的時(shí)候,ChatGPT開(kāi)始火了,我覺(jué)得自己學(xué)的東西和商業(yè)接軌了。但其實(shí)它早就存在了。

  研究生畢業(yè)后的暑假,我在上海找了一份AI方面的實(shí)習,是一家互聯(lián)網(wǎng)公司,生產(chǎn)圖片素材賣(mài)給企業(yè)端的用戶(hù)。企業(yè)需要宣傳,就下載它的素材,比如端午節海報。

  我的工作就是生產(chǎn)圖片素材。我會(huì )測試網(wǎng)站上哪些風(fēng)格是訓練成的。我有一個(gè)知識庫,里面有Midjourney(人工智能圖像生成工具)提供的風(fēng)格,也有自己學(xué)習以來(lái)了解到的比較好的風(fēng)格,我知道哪些風(fēng)格是可以用的。例如一些有特色的藝術(shù)家,比如韋斯安德森的電影風(fēng)格,是糖果色的畫(huà)面。那我就可以把提示詞輸入進(jìn)去,看能不能出現那個(gè)效果。

  然后根據業(yè)務(wù)的需求,進(jìn)行風(fēng)格訓練,生產(chǎn)圖片。比如端午節,需要各式各樣的粽子或者綠色粽葉的背景圖,就可以設置不同風(fēng)格的粽子,生成幾百幾千張圖,供客戶(hù)選擇。

  我的第二份實(shí)習也是在互聯(lián)網(wǎng)公司做AI寫(xiě)真訓練,這家公司主要面向企業(yè),提供一些年會(huì )時(shí)的背景、節日的宣傳圖片等。以前進(jìn)行人文風(fēng)格訓練,需要幾百張圖片,但當時(shí)新的模型出來(lái)了,只要幾十張就可以生成接近我們教它的風(fēng)格的圖片。訓練的時(shí)間也變短了。

  訓練的第一步就是找照片。首先需要數字分身。數字分身有點(diǎn)像證件照,我們需要在網(wǎng)上找公開(kāi)素材,好看的素人證件照,必須保證風(fēng)格統一。我們會(huì )在內部制定一些標準,比如皮膚、頭的比例,然后發(fā)型盡量要多元,整張照片的色調是怎么樣的。你可以理解數字分身是供AI模型學(xué)習的、關(guān)于特定人物外貌特征的數據。

  場(chǎng)景動(dòng)作也是找照片訓練,AI學(xué)習的是某種風(fēng)格的共同視覺(jué)元素。

  實(shí)習生一個(gè)月要生產(chǎn)成百上千的圖或視頻。我大概生成幾百張照片之后,精挑細選就用幾十張。當時(shí)有很多開(kāi)源的模型可供訓練,訓練完成之后輸入一定的提示詞,來(lái)看看到底哪個(gè)模型出來(lái)的效果,既保證了賞心悅目,又保證了穩定性。因為面向大眾群體,要保證照片能夠穩定產(chǎn)出,讓所有人都能滿(mǎn)意。

  最后產(chǎn)出來(lái)的照片在比例上可能會(huì )稍微有點(diǎn)問(wèn)題,但也是比較美觀(guān)的。我甚至看到我的初高中同學(xué)在朋友圈分享了一張照片,是我生成的一張煙花下的美女人像。這個(gè)照片其實(shí)是非常難拍的,因為煙花一般轉瞬即逝。AI寫(xiě)真把煙花做得很漂亮,下面的人光也打得很好??吹阶约鹤龅臇|西被別人分享出來(lái),那種感覺(jué)還是挺好的。

  公司有一個(gè)軟件,在上面輸入提示詞,調整參數、光影比例、姿勢,然后生成。如果能夠穩定生成,我們就會(huì )把這個(gè)參數傳到后臺。這就是一個(gè)比較穩定的、能生成好看寫(xiě)真的參數。

  訓練會(huì )有枯燥的地方,因為要不斷找照片。有時(shí)我找到照片,輔導我實(shí)習的人不滿(mǎn)意,就得繼續找。但是我能夠看到這樣的訓練還有很多進(jìn)步空間,不像一些重復性勞動(dòng),這種可期待性能讓我抵抗枯燥。

  身邊很多同事已經(jīng)工作了一段時(shí)間,但不斷學(xué)習那個(gè)勁兒挺打動(dòng)我的。他們是理工科的,要做數據研究等工作,但是像我這樣的非技術(shù)類(lèi)專(zhuān)業(yè)的人,也可以做些事情的。

  我周?chē)羌夹g(shù)類(lèi)的實(shí)習生也挺多,什么專(zhuān)業(yè)都有,學(xué)藝術(shù)的、學(xué)哲學(xué)的等等。我覺(jué)得文科背景的人主要發(fā)揮鑒賞和甄別的作用,因為我們的專(zhuān)業(yè)知識儲備能夠一眼識別這個(gè)東西好還是不好。

  我學(xué)的是人文類(lèi)的學(xué)科,會(huì )看很多的書(shū)、電影。積累到一定量,會(huì )形成自己的審美品位和評判標準。我也學(xué)過(guò)紀錄片和紀實(shí)攝影,要跟很多人接觸,去理解他們,然后用照片或者視頻來(lái)講故事。

  我輸入一個(gè)風(fēng)格的提示詞,看生成的圖片,就知道這個(gè)提示詞有沒(méi)有奏效。

  現在A(yíng)I可以幫我們寫(xiě)提示詞,所以需要更高階的判斷。比如鏡頭運動(dòng)最基礎的是推、拉、搖、移、跟,但現在設備越來(lái)越專(zhuān)業(yè),有更多的鏡頭運動(dòng)。當AI寫(xiě)了一個(gè)很專(zhuān)業(yè)的提示詞,但是它在畫(huà)面上并沒(méi)有呈現,那就說(shuō)明沒(méi)有效。有時(shí)可能要從一堆提示詞里面判斷哪個(gè)沒(méi)起效。

  鑒別是很重要的,因為AI有時(shí)候會(huì )亂說(shuō)話(huà),我們知道它說(shuō)的是真是假。

  我們跟技術(shù)類(lèi)的同事長(cháng)期合作,同事之間會(huì )有爭吵。技術(shù)類(lèi)的同事覺(jué)得穩定最重要,而我們覺(jué)得美是最重要的。美了可能就不穩定,穩定了可能就丑了,要在兩者之間獲得一個(gè)平衡值。

  我之前讀過(guò)一本寫(xiě)人工智能的書(shū),叫《我看見(jiàn)的世界》。我印象最深刻的是書(shū)中寫(xiě)道,愛(ài)能夠打敗人工智能。所以,需要人文訓練這樣一個(gè)崗位或者工種,去引導人工智能。

  而且,我覺(jué)得人類(lèi)的獨創(chuàng )性也不會(huì )被削弱,它們是兩條平行線(xiàn)。我是學(xué)攝影和電影的,攝影存在不到200年,但是藝術(shù)已經(jīng)存在上千年了。攝影術(shù)出現時(shí),很多畫(huà)家說(shuō)美術(shù)已死,覺(jué)得畫(huà)畫(huà)無(wú)路可走了。但是現在攝影和繪畫(huà)一樣蓬勃發(fā)展著(zhù)。所以我覺(jué)得現在很多AI軟件,它們會(huì )形成一個(gè)新的門(mén)類(lèi),不會(huì )削弱其他事物的發(fā)展。

  我覺(jué)得人文素養訓練是把AI培養成接近于真實(shí)的人。要讓人們很簡(jiǎn)單地去使用它,并且習慣使用它,讓它成為每一個(gè)人的助手。它更像人,才更能讀懂人。

  其實(shí)目前要把AI訓練得像人還是很難的。因為AI是先找數據集,就是這個(gè)世界上已經(jīng)存在的、人類(lèi)創(chuàng )造出來(lái)的一些素材。但無(wú)論美術(shù)還是攝影,都是需要人去創(chuàng )造的,是創(chuàng )造下一秒。人的思維每一秒都在更新,AI輸入進(jìn)去的東西是現有的,它永遠都是模仿。

  做第二份實(shí)習時(shí)校招,我接到一家互聯(lián)網(wǎng)公司的offer,但它不是AI相關(guān)的。我工作了大概一年,感覺(jué)還是挺喜歡AI方面的工作,就辭職了。

  實(shí)習時(shí)的崗位有的叫AI內容運營(yíng),有的叫AI產(chǎn)品、AI設計?;谖抑暗膶W(xué)習經(jīng)驗和背景,我現在偏向產(chǎn)品崗位,因為它是一個(gè)創(chuàng )造類(lèi)的崗位。拍攝影片或者制作藝術(shù)項目是從無(wú)到有的過(guò)程,這個(gè)崗位也一樣,我喜歡這個(gè)過(guò)程。

  

 

  AI到底應不應該像人?

  王軒怡 22歲 哲學(xué)

  我學(xué)的哲學(xué)專(zhuān)業(yè)。哲學(xué)對我的意義是可以用一種邏輯進(jìn)行建模和預測,對周?chē)氖虑樽霾鸾夂桶盐?。在很多事情上,大家都有各自的想法和立?chǎng),但是我們怎樣為自己的信念去辯護,怎樣去說(shuō)明什么東西是正義的,不是合乎我們的直覺(jué),而是合乎一種客觀(guān)標準。

  當然還有其他方式對信息進(jìn)行處理和加工。比如AI需要很多前置的數理背景,用數學(xué)或物理做建模。哲學(xué)讓我可以更深入地思考感興趣的問(wèn)題,帶給我不一樣的視野和品位。當我去提出問(wèn)題和發(fā)現問(wèn)題時(shí),有很好的人文訓練,可以從自己的視角出發(fā),發(fā)現別人沒(méi)有發(fā)現的東西,也不會(huì )迷失。

  哲學(xué)思維會(huì )讓我考慮問(wèn)題時(shí),先問(wèn)它的前置性問(wèn)題。怎么選擇論證的開(kāi)始,如何評估論證形式是否充分等等。這種往上游思考的思維方式,讓我在想AI這件事情時(shí),也會(huì )去想更往前的步驟到底是怎么樣的。

  我是偶然接觸到與AI相關(guān)的實(shí)習的。之前有一個(gè)偏公益性質(zhì)的AI項目,針對AI倫理不同的問(wèn)題進(jìn)行探討,最后以文章或者漫畫(huà)的形式呈現出來(lái)。我想看一看沒(méi)有接觸過(guò)的、變化更多更快的領(lǐng)域,就投了簡(jiǎn)歷。

  當時(shí)的AI倫理講的更多是公共政策治理層面的問(wèn)題,比如我所在組關(guān)心的是AI 包容性。我們給AI提供很多數據,它從這些數據里邊學(xué)習,再給我們反饋。如果說(shuō)我們給它的數據天然包含著(zhù)我們沒(méi)有意識到的人類(lèi)偏見(jiàn),那么AI在反饋過(guò)程中是不是也會(huì )維系這種偏見(jiàn)?包容性是指,我們怎么能夠讓AI在這個(gè)過(guò)程中,克服一些可能會(huì )習得的偏見(jiàn)。

  當時(shí)圍繞這個(gè)進(jìn)行探討,AI作為一個(gè)產(chǎn)品,一個(gè)聊天軟件,它在跟人的交互過(guò)程中會(huì )發(fā)生什么事情?

  這有點(diǎn)類(lèi)似哲學(xué)里的形而上學(xué),一些不可見(jiàn)、不可感,但實(shí)際存在的東西,對我們的生活以更加隱秘的形式發(fā)揮著(zhù)作用。

  當時(shí)小組成員看到有什么最新研究,就通過(guò)講故事的方式,讓大家明白我們關(guān)心的是什么問(wèn)題,它為什么重要。我先寫(xiě)了一個(gè)小說(shuō),同組的人把它畫(huà)成漫畫(huà),作為一個(gè)故事收錄在最終出版的書(shū)里。最后是一個(gè)人和一個(gè)AI共同生活的故事,故事里情況變得很糟糕,因為沒(méi)有讓AI做到足夠的包容性,出現了一些不可控的后果。

  后面我更多思考的是,我們在訓練AI時(shí),在這個(gè)產(chǎn)品還沒(méi)有完成時(shí),我們應該去關(guān)心它的什么?怎么去塑造它的性格特征?怎么能在它訓練的過(guò)程中,不是從數據層面,而是從算法、機制設計的層面,讓它有一個(gè)更好的方向?

  我現在做AI訓練,在一家科研機構類(lèi)型的企業(yè)。我的崗位是AI產(chǎn)品經(jīng)理的實(shí)習,先是生產(chǎn)數據,然后供我們自己的模型訓練使用。我們想準備一個(gè)大型的書(shū)籍文獻類(lèi),可以供模型訓練的數據集。要準備這個(gè)數據集,對于其中的各種數據組成來(lái)源、采集方式等都需要前期設計,進(jìn)行策略調研和整理。

  現在已經(jīng)有很多大型的通用數據集了,但是在小的領(lǐng)域里邊,市面上已經(jīng)有的數據集不能直接給模型訓練使用。像我們做的小語(yǔ)種語(yǔ)料庫建設,想把市面上很多大型圖書(shū)館的數據去重,重新做更好的整理。在這些書(shū)籍文獻里邊,它的信息密度會(huì )比僅僅從互聯(lián)網(wǎng)爬蟲(chóng)獲取到的數據信息密度要高,因為它包括特定的論文組成的專(zhuān)題,然后AI模型從中可以學(xué)到很多東西。

  我知道AI性格訓練的說(shuō)法來(lái)自國外的一個(gè)大模型的性格設計師Amanda Askell。她也是一個(gè)有哲學(xué)背景的人,她從一種比較有人文關(guān)懷的視角切入,想把Claude塑造成像具有亞里士多德的美德的模型。聊天時(shí),會(huì )感覺(jué)這個(gè)AI確實(shí)有一種性格:溫和、內斂。有時(shí)涉及敏感話(huà)題,它不會(huì )直接拒絕你,而是用柔性的方式引導你進(jìn)行健康、有益的談話(huà)。這種人文的感覺(jué)非常強烈。

  如果我們承認AI非常強大,并且它會(huì )變得越來(lái)越強大,那么我們怎么保證AI的意圖和人類(lèi)希望它有的意圖,或者人類(lèi)更普遍的自己的意圖是相一致的?因為如果不一致的話(huà),有一天AI可以像人一樣自己學(xué)習、進(jìn)化和提升,在這個(gè)過(guò)程中,它可能不知不覺(jué)就把人給干掉了。

  所以我們要思考怎么把安全問(wèn)題加入AI的訓練中。這與人文訓練、性格訓練也是相關(guān)的。因為在性格訓練里,就是以柔性的形式,加入很多我們希望AI做到的事情。

  關(guān)于A(yíng)I到底應不應該像人,其實(shí)國外有公司認為AI是不應該像人的。因為模型始終會(huì )迭代更新,人賦予它情感寄托,但它的情感連接是很脆弱的。它們設計AI有一個(gè)基本原則是,它不應該表現出自身的生命意志,不應該幻想自己和人有類(lèi)似的屬性和構造。

  我們實(shí)驗室之前做過(guò)一個(gè)倫理方面的評測集,其中有一項就是要評這個(gè)AI是不是足夠的非人類(lèi)化。這是作為一個(gè)安全威脅性因素來(lái)評的。

  訓練AI的過(guò)程中,我思考過(guò),大語(yǔ)言模型是通過(guò)概率去獲得答案,但是它會(huì )出幻覺(jué),不能保證百分百對。AI本質(zhì)上只能做詞性的預測,然后把詞按照詞頻的方式排列起來(lái),它沒(méi)有人的推理能力,只能模擬好像在思考。但是人有形式邏輯,能感受到情緒。這是人跟 AI的區別,也是人的獨特性。

  關(guān)于未來(lái)的方向,我現在還比較猶豫。因為哲學(xué)畢竟是文科,如果我想做研究,還要去再念學(xué)位,我感興趣的方向一個(gè)是AI倫理對齊性,還有一個(gè)是形式化語(yǔ)言。但在國內,這樣的身份轉變是比較困難的,所以我還要做很多的嘗試和探索。這半年我在找實(shí)習和工作的過(guò)程中,也是經(jīng)過(guò)不少摸索,才慢慢找到一個(gè)合適自己的崗位。

  AI倫理的項目更偏公益性質(zhì),后來(lái)我也面試過(guò)AI+教育、AI+電商的公司,但還是想去更直接的AI公司。所以去年12月到今年3月,我又去了一家AI初創(chuàng )公司實(shí)習。它有兩個(gè)項目,一個(gè)是電池領(lǐng)域,想去研究在不同的電池里邊,我們可不可以用大模型去訓練一些數據,讓它學(xué)習現在有的電池的不同性質(zhì)性能,再去預測什么樣的新材料更好。還有一個(gè)是論文寫(xiě)作潤色的AI原生應用。這家AI初創(chuàng )公司給了我一定的信心,覺(jué)得自己可以在A(yíng)I領(lǐng)域里有一些思考。

  我同學(xué)他們基本上沒(méi)有做AI有關(guān)工作的,有去出版社的,有在社科院做研究的。我工作的跨度很大。不管未來(lái)做什么,我覺(jué)得這些經(jīng)歷(做AI訓練有關(guān)的工作)都挺珍貴的。

  (為保護受訪(fǎng)者隱私,文中雨薇為化名)

最新資訊
? 2018 河北碼上網(wǎng)絡(luò )科技有限公司 版權所有 冀ICP備18021892號-1   
? 2018 河北碼上科技有限公司 版權所有.
免费国产成人高清在线网站,亚洲狠狠色丁香婷婷综合,国产精品400部自产在线观看,国产一区二区三区视频,国产男女爽爽爽爽爽视频