劃時代的扎克伯格·化身Metaverse訪談:虛擬與真實
文:城主
昨天知名播客博主Lex放出了和小札(Meta CEO 馬克·扎克伯格)的一個訪談。不到24小時,播放量已經突破天際的接近了百萬。
這並不是Lex和小札的首次訪談。這次訪談之所以在油管炸裂,是因爲正如訪談的名字:馬克·扎克伯格 | 在元宇宙Metaverse裡的首次訪談。
不是普通的元宇宙,而是一個超擬真寫實的元宇宙:
你看得出來這是根據人物實時渲染的avatar嗎?而且,有着和現實世界完全匹配的動態動作和表情。
城主看到這個訪談視頻的內心震撼程度,只有當時第一次看到Midjourney的畫作,和ChatGPT的橫空出世能相比。
或許Metaverse離我們不遠了。當這個技術真正普及的那天(需要解決初始頭像掃描的問題,從"3小時-專有設備"的門檻降低到"3分鐘-手機掃描", 但這是可以預期的),相信就是metaverse開始普及的開始 -- 無比期待使用這個技術來進行虛擬會議,以及虛擬人生。
視頻完整版傳送門:
【見證歷史!Meta小札化身的元宇宙訪談【中英精校】-嗶哩嗶哩】 https://b23.tv/EeGOO3G
只要看看下面這個短視頻,讀者能感受到這個metaverse對話帶來的震撼,如主持人全程震驚一般,這完全是真假難辨的虛擬世界:
城主相信,這次Metaverse播客以及背後所體現的技術,是足以劃時代的,所以爲之記。
=以下是本城對訪談的全文重寫整理=
以下是我與馬克·扎克伯格在虛擬宇宙中的一次對話。雖然在物理空間上,馬克和我相隔數百英里,但我們感覺彷彿就在同一空間,因爲我們都以3D柯達Avatar形式呈現。這項技術的逼真程度令人震驚,我堅信,這將是人類在互聯網上實現深度有意義交流的未來方式。這些頭像能夠捕捉許多微妙的表情差異,展現了我們人類通過面部表情傳遞情感的方式。我現在正致力於進一步提升這種底層人類情感表達能力。這是由萊克斯·弗裡德曼主持的播客。
親愛的朋友們,這是馬克·扎克伯格。我在哪裡?馬克,你在哪裡?我們都在哪裡?我們的臉被黑暗籠罩,感覺就如同身處同一房間。這真是我所見過的最不可思議的一幕。很抱歉侵入了你的個人空間。我說,我們之前曾一起學習柔術。
的確,我之前向團隊發表過看法,感覺我們似乎已經能從更遠的距離進行交流了。
這真是不可思議。我無法用言語表達我的感受。它真的給人一種我們身處同一房間的感覺。是的,這就像是未來。實在是太不可思議了。我正在逐漸適應它。這就是你,真的是你,但你並不在我身邊,對嗎?你戴着Headset,我也是。這真是令人震驚。
那麼,能否描述一下目前都用了哪些技術使我們看起來如此逼真呢?
好的。作爲背景信息,我們爲Meta的一項名爲“柯達頭像 Kodar Avatar”的研究項目進行了掃描。該項目的初衷是,我們的頭像是卡通風格的,而不是實際傳輸的視頻,它的目的是通過不同的表達方式來審視我們自己。我們建立了一個包含每個人的臉部、身體和不同表情的計算機模型,並將其整合到柯達系統中。因此,當你戴上Headset時,它能看到你的臉,捕捉你的表情,並可以通過網絡發送編碼版本,讓你看起來更逼真。因此,與傳輸完整的3D沉浸式視頻相比,它在帶寬效率上實際上更高。
它能捕捉到一切,甚至是臉上的小缺陷。對我來說,人臉的細微之處,甚至是那些小缺陷,都是令人吃驚的。這增強了你的身臨其境感。它讓你意識到,完美並不是最重要的,這會增強沉浸感。就像臉上的小雀斑、顏色變化,還有皺紋,鼻子的各種特徵,和不對稱性等。每個人的眼角和微笑都有所不同。眼睛是非常重要的。所有的研究都表明,大多數的交流並不僅僅是言語,而是一種表達方式。因此,我們試圖用我們擁有的經典表達化身系統來捕捉這一切。它的設計較爲卡通化,但你也可以在上面表現出這些表情。但無疑,提供這種逼真的體驗確實帶來了一種真實感。我只能說,這真的很奇妙。
這觸及了虛擬現實和增強現實願景的核心,就是傳遞一種存在感,讓人感覺彼此就在一起,不論實際上身處世界的哪個角落。我認爲這是一個很好的例證,我們雖然身處兩個不同的州,跨越半個國家,但感覺就像你坐在我對面一樣。這真是太不可思議了。
是的,我幾乎要激動得無法自持了。這完全是一種全新的體驗。當我與親人進行這樣的對話時,我感覺這會改變一切。爲了更詳細地瞭解相關內容,我訪問了匹茲堡,親身經歷了包含衆多令人驚歎技術的掃描過程。當前,軟硬件開發仍在進行中,這是一個漫長的過程。您對這個行業未來有何看法?是否會讓人們更容易接入?
衆所周知,最初這些詳細的掃描是由少數人進行的,這也是您和我目前所做的版本。在我們對大量人羣進行此類掃描之前,我們可能會過度收集表達式,因爲我們還未確定到底可以將流程簡化到何種程度,並從已完成的掃描中進行推斷。
然而,我們已有一個項目在努力實現目標,即僅通過手機進行快速掃描。用戶只需揮動手機幾分鐘,說幾句話,做一些表情,整個過程僅需兩到三分鐘,便可生成與現有質量相當的模型。我認爲這仍是我們面臨的重大挑戰之一。若您有幾個小時的時間,我們現有的技術和設備,例如市面上可購得的Meta Headset,都能夠進行掃描。但是,如何以高效的方式生成這些掃描仍是我們需要解決的問題之一。此外,還有與此相關的各種體驗問題。
當前,我們彷彿坐在黑暗的房間中,這一場景對您的播客觀衆而言應該很熟悉。但我相信,隨着時間的推移,我們的願景將不僅僅侷限於視頻通話。那樣的體驗確實很酷、很令人沉浸,但在虛擬世界中,我們能夠做的事情遠不止於在手機上的操作,我們可以一起做事、一起參與活動,玩遊戲,舉辦會議。一旦混合現實和增強現實技術得以實現,我們就可以創建類似的化身,參加會議,一些人實際在場,而另一些人則以逼真的形式出現,疊加在物理環境之上。我認爲這將非常具有革命性。
因此,我們還需要開發各種類型的應用程序並探索其使用場景。未來幾年將圍繞這個領域展開激烈的競爭,我對此感到無比興奮。這真是太不可思議了,我希望大家都能親眼見證這一切。真的感覺就像我們在同一個房間一樣。看起來,我們似乎已經穿越了所謂的“恐怖谷”,給人一種與真人無異的感覺。
當然,我們仍有很多需要調整的地方。每個人都有自己獨特的情感表達方式,如何調整化身以使其能夠更好地反映每個人的個性,將是我們需要解決的問題之一。例如,有些人可能更喜歡化身比真人更加情感化,而我常因爲表情相對僵硬而受到批評。但對我來說,我希望我的化身能夠比我的身體更好地表達我的感情。從捕捉人們實際情感和表達方式的基線出發,我們希望找到每個人的平衡點。
首個版本已經相當令人印象深刻,我覺得我們已經成功跨越了“恐怖谷”,這並沒有給人任何奇怪或不自然的感覺。但這使得問題變得更加複雜。眼睛的微妙表情在傳達喜悅、無聊等情感時是多麼的有表現力,即便有人說我表情單調,但其實不然,只是我的情感表達比較微妙。我非常好奇大家對此有何看法,因爲這是我第一次以這樣的化身身份進行播客。我們在VR和混合現實的工作中遇到的一個問題是,身臨其境的體驗往往比2D視頻更爲深刻,但我不知道,我非常好奇大家的看法。
確實,我對於人們是否能感受到我的心跳加速感到好奇。這真是一種有趣的體驗,通過遠程的方式便能實現如此親密的對話。正因爲如此,我並不做遠程播客。這就好像摧毀了一切,讓我感受到了一種難以置信的轉變,走向了一種不同類型的交流,打破了所有地理和物理的障礙。你是否有意識到,要實現這樣的技術,我們需要解決許多困難的問題,以便讓這一切變得更爲容易,就像使用智能手機進行掃描一樣?
是的,我預見我們會逐漸推出這項技術。因此,並不是說我們一推出這個產品,就會立刻看到人人都有一個柯達頭像。我們希望能夠讓更多的人接受掃描並加入到系統中,然後我們會開始將其集成到我們的每個應用程序中。實現這一點,我認爲,將對許多工作方式、生產力產生深遠的影響。在很多遊戲環境中,這可能並不構成問題,因爲遊戲本身就有其獨特的風格,不是嗎?你可能會希望更加符合遊戲的美學風格。但我覺得,對於開會這種場合,我們在工作室中得到了許多反饋,人們對於這種彷彿與人同坐一室的體驗感到非常震驚。
然而,我們也收到了一些反饋,指出人們難以適應化身表現力如此強烈,以及在這樣的環境中感覺不夠真實的事實。因此,我認爲這會對遠程會議產生重大影響,尤其是隨着Quest 3的推出,它將成爲第一個主流混合現實產品。在這裡,你可以真正實現數字化的人或物體,並將它們疊加到物理世界中。我認爲能夠進行遠程會議和類似的活動,就像你在任何地方與朋友進行遠程會議一樣,將是非常令人興奮的。
因此,是的,我們計劃在接下來的幾年內推出這項技術。雖然它還未準備好成爲一種主流產品,但我們將繼續調整,進行更多的掃描,並將其推廣到更多的功能中。但毫無疑問,你將在未來幾年看到更多這樣的體驗。我確實很想看到一些名人和非名人被掃描,並讓更多的人體驗到這一切。
看到這些,我簡直感到心碎,失去了言語。僅僅傳達信息就是如此困難,這真是令人難以置信。我如何感受這種情況,如何感受它的存在,如何感受這種情緒的微妙之處,在類似的工作會議或任何類型的場合,這對於播客來說都是極好的。我甚至不需要你的胳膊或腿,但是——好吧,我們必須得到它。這是它自身的一個挑戰。
問題的一部分在於,進行了掃描後,你需要一定量的計算來驅動它,無論是對於頭戴設備上的傳感器還是渲染它。因此,我們正努力解決的一個問題是,究竟什麼是最佳的保真度水平。你可以用編解碼器來渲染完整的主體,這可能是相當複雜的。但我們正在考慮的是,也許你可以將身體的保真度降低一些,但仍然保留主要動作的主要類型。然而,你的臉確實是我們最重視的部分,因爲它能夠閱讀和表達情感。就像你說的,眉毛的一絲微動,就足以改變你的表情和情緒,而移動手臂一英寸可能並不那麼重要。所以,是的,我們確實希望將所有這些因素都考慮在內,這也將是我們下一階段的工作重點。
你提到了即將推出的Quest 3,我也有幸試用了一下,真是太棒了。它不僅僅是虛擬現實,還實現了混合現實。
我相信,這將成爲第一個主流混合現實設備。我們去年推出了Quest Pro,價格高達1500美元,但我爲我們的創新努力感到非常自豪,我們不僅推動了最先進的技術和新功能的提供,還讓每個人都能使用它。我們即將推出這款定價500美元的產品。在某些方面,我認爲Quest 3中的混合現實比以前更爲出色,甚至超過了我們目前在Quest Pro中使用的技術。因此,我爲我們的團隊能夠實現這樣的創新感到非常自豪。
但是,大家也清楚,有些軟件隨着時間的推移不斷調整、優化,從而表現得更加出色。這其中,一部分工作是將多個產品整合在一起,進而找出什麼是妨礙良好體驗的瓶頸。因此,在 Quest 3 中,我們將混合現實攝像頭和傳感器的分辨率提升了數倍。當我們探索爲 Quest Pro 提供何種體驗時,我們發現這一改變產生了巨大的影響。部分原因也在於,高通近期推出了專爲 VR 和 MR 設計的下一代芯片組,我們便與之合作開發了一款定製版本。
然而,雖然今年的 Quest 3 上有了這一功能,但 Quest Pro 卻未能配備。所以,從某種角度來說,在 Quest 3 上,儘管它並非專業產品,實際上,它比 Pro 系列擁有更強大的芯片組,而價格僅爲 Pro 系列的三分之一。我爲能將這樣的產品交到用戶手中感到非常高興。它能實現高通爲 VR 所開發的所有功能,而且其他公司同樣可以實現。Quest 3 的表現更加出色,因爲它有更好的顯示效果和更強大的芯片,所以圖形表現更佳。而且,它的厚度減小了 40%,因此更加舒適。然而,混合現實確實代表了一次重大的技術飛躍。
當前,這個領域令人興奮的一點是,它並不像智能手機市場那樣,每年都會有新產品推出,但你幾乎分辨不出與前一年的型號有何不同。相反,我們每次推出新的頭戴設備時,都會有顯著的新功能。現在,最重要的新功能便是混合現實,即採用人或物體的數字表示,並將其融入到真實世界中。
基本上,這意味着你可以擁有這些增強或全息圖像和體驗,並將它們帶入你的客廳、會議室或辦公室。我認爲,還會有更爲簡單的創新出現。現在的很多 VR 體驗並不需要完全沉浸式。如果你在玩射擊遊戲或進行健身體驗,人們常常會擔心揮動手臂時會不會撞到燈或其他物體。在混合現實中,這種擔憂得到了緩解,對吧?你仍然可以獲得沉浸式和 3D 體驗,實現物理世界無法達到的效果,但通過觀察周圍的實體環境,人們會感覺更加安全、更有保障。我想,這也會是大家所喜歡的。所以,我真的很期待看到大家會如何使用它。而 Quest 3 預計將在今年秋天晚些時候推出。
是的,我必須要和他人一同體驗這個設備,在那裡有許多傢俱。這樣,你就能看到這些傢俱,看到那些和你一起享受揮舞手臂樂趣的人。即使他們會因此取笑你,但這背後也蘊含着友愛。我確實體驗過這一點。這與殭屍從牆裡涌出的純 VR 體驗有着天壤之別。
是的,這就像有人朝你開火,而你要躲在真實的沙發後避開。集成度令人難以置信,同時也有一些細微之處,比如,在一個沒有窗戶的房間裡,你可以添加窗戶,當殭屍向你跑來時,你可以透過窗戶看到外面,而外面的風景依然美麗。要實現這一點,我們需要在頭戴設備的外部安裝攝像頭。在小型頭戴設備上實現這種技術確實令人震驚。而這不僅僅是攝像頭的問題。你實際上需要多個攝像頭,以捕捉三維空間的不同角度和順序。然後,將其映射到你的視線中,這是一個極爲複雜的計算問題和人工智能問題。因爲攝像頭並不能精確地位於每個人眼睛的位置,每個人的眼睛位置都不盡相同,視角也會有所不同。你需要進行對齊,實時生成自然的視覺效果,併疊加你想要放置的任何數字對象。這無疑是一個技術挑戰,我相信我們將在未來幾年裡繼續進行優化和調整。
非常高興能夠推出Quest 3,我認爲這款產品將成爲數百萬人的首款混合現實設備。只有當數百萬人開始使用某項產品時,整個開發者社區纔會真正投入到試驗和構建中,因爲這意味着現在有人真正使用它了。我認爲,雖然我們在Quest Pro中已經配備了一些初步功能,但Quest 3的推出無疑會大大加速這一過程。我對此感到非常興奮。
此外,Quest 3具備手部追蹤功能,因此用戶無需使用控制器。這款設備的攝像頭不僅支持直通功能,還能捕捉用戶周圍的整個物理現實,並精確追蹤手部細節,便於進行手勢識別等操作。我們已經在較短的時間內取得了比預期更爲顯著的進展,這實在令人振奮。
我不知道你是否看到了我們圍繞鋼琴製作的演示體驗?這真是令人難以置信,用戶可以在桌子上彈奏虛擬鋼琴,無需任何控制器,就像真實世界中一樣。設備無延遲地追蹤用戶的雙手和周圍環境,實現了物理現實和數字現實的完美融合。
這種技術顯然與我們推出的柯達頭像密切相關,兩者相輔相成,共同爲我們在這個混合現實世界中提供了超現實的數字體驗。我個人非常享受這樣親密的交流,但這項技術解鎖的可能性遠不止於此。例如,用戶可以通過這種方式將數字對象疊加到物理世界中,實現照片級的真實感體驗。
我認爲,我們正朝着一個新的時代邁進,在這個時代,我們將擁有外觀如同普通眼鏡的設備,通過這些設備,我們不僅能看到物理世界,還能看到全息圖。我預測,在不遠的未來,也許在這個十年的末尾,我們將生活在一個充滿全息圖的世界,這些全息圖與物理物體一樣普遍。
這引發了一個有趣的問題:什麼是現實世界?我越來越認爲,現實世界是物理世界和數字世界的結合體。在混合現實技術出現之前,這兩個世界是分開的,我們通過屏幕進入數字世界。但這項技術的一大任務是將物理世界和數字世界結合起來,爲我們提供一個連貫的現代現實體驗。因爲我們是物理存在,所以物質世界始終至關重要,但我越來越認爲,許多我們現在擁有的物體都可以以數字全息圖的形式存在。
例如,任何屏幕、媒體、書籍和藝術品都可以以全息圖的形式存在,這同樣適用於各種物理遊戲,如棋盤遊戲、紙牌和乒乓球。全息圖具有極大的便利性,用戶可以隨時隨地實例化和展現它們,這無疑是一項強大的功能。
我認爲,這種技術最重要的應用之一是實現人與人之間的混合聚會,無論是社交活動還是商務會議。當你走進一個會議室時,你可能會短暫地戴上眼鏡或頭戴設備,但我希望在未來的五年左右,這將變成一副眼鏡。在這種情況下,一些人以物理形式存在,而另一些人則以全息圖的形式出現,給人的感覺就像他們真的在場一樣。
同時,這種融合也將涵蓋數字世界、物理世界和人工智能。我設想,在未來的會議中,除了真實的人和全息圖化身外,還會有像鮑勃這樣的AI團隊成員加入。
至於照片級真實的頭像能帶來什麼,我認爲這在很大程度上取決於人們對技術的接受度。我們現在能夠實現的眉毛、眼睛和臉頰的動作等,理論上也可以應用於更具表現力的化身上。雖然這些化身可能無法完全複製用戶的外貌,但用戶仍然可以創建具有幾乎同樣表現力的卡通版本。
總之,我認爲這種物理與數字的融合是一座橋樑,連接了我們目前在物理世界中的互動和我們在未來混合現實世界中的發展。這將使我們更容易接受這些新體驗,並從更爲逼真的化身開始探索。我對這個領域的長遠發展充滿了好奇和期待。
在我眼中,我能看到人們正努力塑造一個追求照片級寫實的世界。他們或許會調整這些形象使之更加有趣,但我們似乎本質上偏愛逼真之物。然而,另一方面,我也能看到,在人們逐漸適應逼真化身及其帶來的體驗後,實際上可能會出現這樣一個世界:人們更傾向於以某種方式表達自己,與他們的物理現實保持一定的距離。這正是讓我深感好奇的問題之一。
不可否認,在我們進行的一系列內部實驗中,有一點在心理層面上格外引人入勝,那就是人們似乎並不牴觸混合使用照片級真實感與其他形式的元素。因此,在某種特定場景下,例如我們此刻所處的黑暗房間,審美選擇或許部分基於個人對播客的偏好。我們曾經體驗過這樣一種情況,即你面前是一個逼真的人物,而背景卻是卡通風格的,人們似乎覺得這完全正常,不會感到不適或奇怪。
我們還經歷過另一種情況,那就是你與一個逼真的化身對話,而在他們旁邊,則是一個表情豐富的卡通化身。這種情況也同樣被視爲正常,畢竟,這只不過是與不同的人以不同的方式互動。所以,我還未能確定,這些逼真的化身在多大程度上將成爲我們從物理世界過渡到包括數字和物理元素的現代現實世界中不可或缺的一部分,或者它們是否會像長期以來那樣存在。隨着時間的推移,我認爲它們對於表現力和照片真實感的需求將逐漸消減。至於平衡將如何實現,我也是未知之數。
確實,這是一個引人深思、非常有趣的哲學問題。對我來說,短期內,照片般的真實感令人震驚,遠超我的預期,就像你所提到的工作室場景,或是我與朋友坐在海灘上喝啤酒的情景。能夠儘可能地體驗到真實,是一種令人難以置信的體驗。因此,我並不希望給他加上任何虛假的元素,我只想與朋友一同坐着,喝着啤酒,欣賞着大海,儘管我們並未真正坐在一起。這樣的經歷,從根本上說,是一種高品質的友誼體驗。無論我們在友誼中追求什麼,它似乎都以我當前所見的這種真實形式存在。這無疑改變了一切,所以對我而言,我可以預見我會長期堅持這一點。
是的,這也是一種創新,同時也是一項技術壯舉。實現這一點無疑是令人印象深刻的。我時常會忘記,你並非真實存在,這的確是新穎而深刻的哲學問題。
不過,這裡確實存在一些問題。例如,我今天早上戴上了這個化身,它的頭髮比我現實中的要短一些,這讓我覺得可能需要理髮。實際上,我今天早上確實颳了鬍子,但如果我沒刮鬍子,我依然可以選擇一個刮鬍子更乾淨的化身,即便我的實際外貌還需要幾天時間適應。因此,我認爲這將帶來一些微妙的問題,這些問題將影響到化身的真實感,它們展現了你被捕捉的樣子,但並不一定準確反映你當時的真實樣貌。隨着時間推移,這將成爲一系列有趣的問題。
您的意思是,我們的身份本質是什麼,您瞭解人們追求什麼,例如,人們嚮往擁有如夏日海灘般的身材,如果願意接受掃描,他們會嘗試減肥,通過打扮使自己看起來更加出色和性感。這確實提出了一個問題:如果衆多人都在與我們的數字版本互動,我們究竟是什麼?我們是驅動化身的實體還是化身?
確實,隨着時間的推移,我們的身體也會經歷變化。因此,我認爲一個類似的問題是:我們是哪個版本的自己?這確實是一個關於身份的有趣問題,因爲,例如體重的波動等,人們可能並不總是認爲自己是最好的版本。有人可能認爲自己是最糟糕的版本,但我認爲很多人可能認爲自己是最好的版本。然後,您的日常生活並不一定與其中任何一個版本完全相符。
我認爲,肯定會有社會科學家和心理學家研究我們對自己和他人的看法發生了何種變化。這可能是一個相對複雜且深沉的問題,但當我思考這個問題時,我首先想到的是與親人交流的願望,包括那些已經過世的。展望未來,人們雖然去世,但他們仍然可以在虛擬宇宙中存在。您還可以與去世的父母、祖父母交流。我認爲,我們需要圍繞這個主題制定很多規範。需要找到一種平衡,以便人們在失去親人並感到悲傷時,可以以多種方式互動或回憶,但也避免變得不健康。我不是這方面的專家,所以我認爲我們需要更深入地研究和理解這個問題。
我們已經積累了豐富的經驗,知道如何處理死亡和身份問題。可惜的是,人們已經開始通過社交媒體獲取數字內容,使用我們服務的人每天都會離世,他們的家人通常希望訪問他們的個人資料。我們已經有了一套完整的協議,使家人能夠訪問逝者的賬戶,這樣該賬戶就不會立即消失。但同時,還有一些私人信息,例如,我們不會允許家人查看逝者的私人消息。因此,我認爲當前數字世界的一些最佳實踐將會延續下去,但這也會帶來一些新的挑戰。
另一個考慮的方面是與人工智能的交融。我們真正關注的是,希望這個世界能夠發展到不只有單一的超級人工智能,而是讓衆多人通過AI工具完成工作,提高生活質量。如果您是一位創作者,例如經營播客,您會擁有一個非常願意與您交流的龐大社區。我知道您願意培養這個社區,並且也會在播客之外與他們在線互動。但由於時間的限制,您無法滿足與每個人互動的需求。因此,我認爲,您可以創建一個AI版本的自己,它可以在您還活着的時候幫助您與更多人互動,滿足他們的需求,同時幫助您建立社區。
圍繞這個問題,確實有很多有趣的議題,它們不僅存在於虛擬宇宙中。我們希望在所有消息平臺,例如WhatsApp、Messenger和Instagram Direct上,這一點都能發揮作用。如果您能在元宇宙中擁有一個自己的化身版本,人們可以與之互動,您可以定義這個AI版本,使人們知道他們正在與AI互動,而不是您本人。即便人們知道這是AI,這也可能是與您直接互動的下一個最佳選擇。我認爲這將是一種非常吸引人的體驗。
我們尚未準備推出能讓創作者構建自己版本的版本,但我們已經着手推出了一些可供人們以多種方式互動的人工智能。我預見,隨着時間的推移,這將成爲一組人們可以掌握的強大能力。
您提到了我們在開發早期人工智能個性方面所取得的重大進展。這個構想是,您可以通過Meta應用程序與它們進行有趣而獨特的對話。您能描述一下您對這些早期進展的願景以及其中存在的技術挑戰嗎?
的確,許多願景源自於這樣一個理念:我們不一定追求一種龐大的超級智能,而是希望每個人都能更加享受生活,實現他們的商業目標,完成他們所致力的一切。我們並不認爲所有事務都應由一個實體處理。我不認爲未來只有一種人工智能與我們合作。我預計會出現多種類型的人工智能,以滿足不同的需求。
例如,對於那些更傾向於使用助理的人,我們正在開發一種名爲META AI的簡單明瞭的人工智能,您可以在任何線程中與之對話。它沒有形象,是更通用、更中立、更真實的,能夠協助您處理衆多事務。然後,有更多以商業爲導向的應用場景。比如,一家小型企業可能不願僱傭專職人員接電話,而您也可能不願意等待與人交談。但如果有一個可以自然地與之交流的實體,無論是解決產品問題、進行預訂還是在線購物,都能爲您提供協助,這將大大提升用戶體驗。這對於企業和希望與之互動的用戶來說都是非常有益的。
此外,我預見將會出現許多有趣的應用場景。我相信會有能講笑話的人工智能,您可以將其加入到與朋友的聊天中。作爲一家社交公司,我們致力於幫助人們以多種方式建立聯繫。我對如何讓這些人工智能促進人與人之間的聯繫、使羣聊更加有趣、圍繞各種興趣主題,如運動、時尚、瑣事和視頻遊戲,感到非常興奮。我特別喜歡遊戲,《博德之門》就是一款令人難以置信的作品。有一個能與您一起遊戲的人工智能,雖然聽起來微不足道,但它能極大地豐富遊戲體驗。我深信 AI 將使遊戲中的 NPC 變得更加出色,這讓我非常激動。
我們在內部測試中開發的一種人工智能,人們最喜歡的部分就像是基於文本的冒險,類似於“地下城主”。這非常有趣,我們已經找到了一些真實的文化角色來扮演這些人工智能,使其成爲他們的化身。以史努比狗狗爲例,它實際上成爲了地下城的主人,這是個非常有趣的設定。
如果您提到創建一個受史努比啓發的人工智能,這其中會面臨哪些技術挑戰?對於史努比這樣的角色,創建一個人工智能的體驗會是怎樣的?
創建全新的角色會相對容易,因爲不必完全模仿真實人物的思維和行爲方式。史努比在這種情況下是一個演員,他扮演的是地下城主,並不真的是史努比狗狗。如果您真的想要一個能夠體現真實創作者個性的人工智能,就需要付出額外努力,以確保人工智能不會表達出創作者不願表達的內容。人工智能需要理解事物,並能夠以創作者期望的方式表達,按照創作者所知道的方式。我認爲,讓這些化身表達自己並非難事。
我們的V1版本即將發佈,隨着Connect的推出,這個版本不久將會推向市場,而且隨着時間的推移,將會有所改善。但多數情況下,我們仍在不斷地爲這些AI製作模型,以便它們變得更加豐富,但其可靠性或可預測性,我不能完全確定。因此,當你想要創建可以與你的社區交流的Lex助手AI時,你是在訓練它們,而不是像編程普通計算機一樣對其進行編程。你希望它們在一定範圍內保持可預測性,即便它們可能不是完美的。因此,我認爲這是我們需要爲創作者明確的重點之一。
這也是爲什麼我認爲,創建新角色實際上要比從頭開始更爲困難。所以我預計這可能會在明年某個時候發佈,而不僅僅是今年。我們會嘗試現有的角色、助手、遊戲以及不同的個性,同時也會探索一些小企業的可能性。我認爲這些今年都會準備就緒,並且我們基本上會在Connect發佈後立即推出它。
我很高興能夠反思並告訴自己:“嘿,夥計,你可能需要停止說爸爸笑話了。”我認爲,播客的想法、人工智能助手Lex的播客,甚至柯達頭像的體驗,都是一種全新的體驗,彷彿是首次意識到自己的存在。這是一種超現實的體驗,就像猿猴第一次照鏡子時意識到:“哦,那就是你。”這種體驗就像我第一次看到顏色,第一次以一種全新的方式看待世界。這是物理現實,但同時也是數字的,這種可能性讓我大吃一驚,非常令人興奮。
我經歷了互聯網前和互聯網時代,體驗了語音通訊、視頻通訊的變化。你會覺得這有一個上限,但這種體驗讓我意識到可能並沒有上限,可能會有物理現實和數字現實的結合,這就是未來。這是一種全新的生活方式,人們可能會抱怨互聯網不是現實,但這種體驗感覺真實,帶有所有的缺陷。在設計新計算產品時,一個重要方面是它們應該是物理的。
電腦、電視、手機等設備都有一個共同問題,雖然你可以在不同地方與它們互動,但它們基本上讓人靜止。我們不應該一直坐着,我們需要四處走動,這是我們成爲人的一部分。人類體驗是一種物理體驗,所以不僅僅是數字世界的沉浸式體驗,而是將兩者原生地整合在一起。我確實認爲現實世界是物理和數字的結合,有太多的數字內容無法侷限於一個小屏幕上,而物理世界同樣重要。
因此,我們不應整天坐在辦公桌前,我認爲這是未來的發展方向。我希望世界能夠以一種將物理和數字世界更加連貫地融合的方式運轉。作爲一個社會,我們需要解決一些困難的、哲學的甚至倫理的問題。
虛擬宇宙能夠解鎖我們在物質世界中無法體驗的許多事物。問題是,虛擬宇宙中允許什麼和不允許什麼?在電子遊戲中,我們允許各種瘋狂的事情發生,但在物理現實中,這些行爲很多都是非法的。那麼界限在哪裡呢?電子遊戲和物理現實之間的灰色地帶又在哪裡?
確實,我們有內容政策等,限制人們能夠創建的東西,但對於物理規則,我認爲我們應該儘可能地創建一個自由的社會,這意味着人們可以自由行動,除非這會傷害到他人,侵犯他們的權利。在數字環境中,“傷害”的概念有所不同。在現實世界中,我們不會互相射擊,因爲這會造成真實的傷害。但在遊戲中,這是一種有趣的互動,甚至是遊戲的一部分。我們需要重新審視這個問題,物理世界中可能有害的行爲在數字世界中可能就不再有害,因此數字世界的限制應該更少。然而,數字世界也可能出現新的傷害方式,如匿名性可能帶來更多問題和有毒行爲,這些都是我們需要解決的問題。
關於可接受的行爲,我覺得應該從其可能導致的傷害程度來審視。不過,還有些問題並不僅與傷害程度相關,它們更多地涉及到可能發生的事和物理定律。例如,要見我本人,你需乘坐數小時的飛機。但若進入虛擬會議室並戴上頭戴設備,我們能即刻感受彼此的存在,這突破了物理的束縛,我相信這將開啓許多新的機遇。
我時常思考關於遠程工作的話題。我覺得這使得我們即使身處不同地點,也能有身臨其境的感覺。我期望人們將來能在他們心儀的任何地方工作,同時享有與現場工作相同的體驗。我們目前主要依賴視頻會議和其他基礎技術,但我相信隨着技術進步,這個理想會更接近實現。這將爲人們提供在他們喜歡的地方生活的自由,同時仍然與同事保持緊密的聯繫,有助於塑造多元文化和加強彼此的信任。
真正的問題是,如果從未親自見過對方,會產生哪些影響。思考這種技術所帶來的所有潛在影響和風險是個巨大的挑戰。我們希望能放大正面效果並緩解潛在問題。但實際上,這是一個逐步推進的過程,我們只能不斷地觀察它的發展和人們如何使用。
至於Llama 2,這確實是個具體的技術議題。我知道你最近發佈了它,並覺得這周圍發生的一切都很令人興奮。關於你對Llama 2的發佈有何感想?是否計劃推出Llama 3?
記得上次播客中我們討論過Llama 2的開源話題,我爲我們最終做到了而感到自豪。我堅信,開源像Llama 2這樣的模型的價值遠大於其風險。我們經過了深入的評估和紅隊測試後決定發佈Llama 2,看到大家如此熱情地接受它真是激動人心。
關於Llama 3,我們一直在研究新模型。當前重點是將Llama 2集成到各種消費產品中,因爲Llama 2本身不是一個最終的消費品,而是供人們構建應用的基礎。我們正在微調Llama 2並創建基於它的消費品分支。當然,我們也在爲未來的模型做訓練,但目前沒有新的消息可提供。和Llama 2一樣,任何新版本的發佈都需要經過深入的評估和討論。
總之,感謝你開源了Llama 2並參與此次討論。你爲AI領域所做的透明化工作有助於我們開展更深入、有意義的對話。很有趣地看到如何將這些技術整合到個性化的AI系統中。當AI與人互動時,肯定會有一些有趣的失敗例子。這可能會看起來很愚蠢,或者走到一個奇特的方向。但這也是我們共同學習和探索的過程,不是嗎?
是的,在初始推出人工智能時,我們努力提供了多樣的用例,僅僅是爲了讓人們嘗試各種可能性,因爲無法預知哪些會取得成功。人們會喜歡文本冒險遊戲嗎?他們是否更喜歡與善於插入笑話的喜劇演員對話,或者願意與歷史人物互動?我們爲此塑造了簡·奧斯汀和馬可·奧勒留,而作爲他們的狂熱粉絲,我對這一切充滿期待。我已與他們進行了對話。
的確,看到互聯網上各種奇特反應,我爲之擊掌。這使我得以瞭解人們如何異想天開地構造模因,看到他們如何與之互動。在人工智能向全面智能化(AGI)邁進的初期,我認爲,通過大規模使用和互動這些系統,我們能夠更好地學習。
確實如此,這也是我們初步推出一組AI,同時開發名爲AI Studio的平臺的原因,它將允許任何人以用戶生成內容(UGC)的方式創建自己的人工智能。我對這一切感到非常興奮,因爲除非整個社區都投入到創造過程中,我們才能真正看到AI的全部潛力。當然,實現這一點還需要我們做很多工作,所以我很高興能分階段進行。
我確信,沒有人在做我們正在做的這些事情。有些人可能在做一些類似的虛擬角色類項目,但我們通過化身和表現力來構建這些項目,並使它們能夠在各種應用程序間互動,擁有個人資料,能夠在Instagram和Facebook上與人互動,這都是非常有趣的。
在與扎克伯格你的對話中,我一直感到驚訝,雖然你不在場,但給人的感覺卻彷彿你就在這裡。這讓我經常忘記我們其實並不在同一空間。能夠隨時與生活中的任何人進行深度對話,就像現在通電話一樣,將是一種全新體驗,我認爲我們甚至無法想象這將如何改變我們的生活。
這正是虛擬宇宙背後的衆多理論之一,即給予人們與他人在一起的感覺。這是我一直在討論的主題,但確實還有很多問題需要解決。從我的角度來看,我確實在這裡,我們只是不在同一物理空間。但這並不意味着你沒有與人工智能進行對話,對吧?
因此,我認爲真正新穎的是通過技術傳達一種近乎物理存在的感覺。雖然我們不在同一物理位置,但在其他方面都很真實。這引出了一個哲學問題,即現代現實世界的本質是什麼?我認爲,這不僅是物理世界和我們的存在感,還包括我們所擁有的日益豐富、強大和有能力的數字世界,以及在其中所創造的所有創新。
因此,我認爲這是極爲令人興奮的,因爲數字世界正日益壯大,拓寬了我們實現偉大壯舉的可能性,然而物質世界的深刻卻是不可忽視的。我們之所以成爲人類,很大程度上是因爲我們存在於物質世界。因此,我認爲我們不應逃避這一事實,而是沉浸於屏幕之中。這也是我如此熱衷於幫助塑造和加速未來計算平臺發展的原因之一。我深感這是一項強大的力量。儘管現階段我們還停留在使用頭戴式設備的層面,我堅信這將成爲至今最具人性化和社交性的計算平臺,這也是我如此興奮的原因。
是的,我認爲,只要我們能夠緊緊抓住現實的不斷變化的本質,就如同抓住真實的事物一樣,我們也許能夠將其引向某種意識層面。因此,真實的不僅僅是主觀體驗,也與我們所處的物理空間有關。我們的感覺就好像我們處於同一個物理空間中。這種有意識的體驗,或許就是真實的定義。時空並非如其物理學屬性所表現的那樣,就好像我們超越了物理學,轉而關注於意識,這纔是真實的,不論我腦海中怎樣思考。
然而,伴隨着這種過去僅限於身體存在的經歷,確實存在許多社會和心理層面的因素,不是嗎?我認爲這其中蘊含着親密、信任和一定程度的溝通,因爲許多溝通是非言語的,基於你的表達方式,在這樣的環境中,你正在與人分享。在這些變得可能之前,若我乘飛機飛往奧斯汀與你坐在同一地方,我想,我們實際上是在以更便捷的方式應對物理法則,傳遞社會情感。能夠身臨其境地感受到與他人的共融,我認爲這對全球人類來說都是巨大的利好。我贊同你的看法,認爲這將是一件具有深遠意義的事務。這也正是虛擬宇宙所承諾的,是我認爲我們正在探索的下一個前沿領域的原因。
當我開始研究社交網絡時,它們主要基於文本,如Facebook的早期版本,僅包含個人資料和一張照片,其餘的則是用戶的興趣列表。隨後,我們進入了以照片爲主的階段。現在,我們正處於大多數內容以視頻形式呈現的時代,但隨着時間的推移,展現出一種明顯趨勢,即我們表達自我和獲取對周圍世界的洞察的方式正變得越來越豐富多彩和生動。
從我的角度看,能夠與周圍的人,或者與我們關心的人一起沉浸並感受存在,顯然是下一個前沿領域。這在技術上是非常具有挑戰性的,不是嗎?實現這一目標需要構建新的計算平臺和全新的軟件堆棧。但我覺得,這正是我們作爲公司應該去做的事情。
我真的很欣賞你們通過對話建立的聯繫。對我而言,這種照片寫實主義確實非常令人興奮。我對這個未來充滿了期待。感謝你們爲此做出的努力。同時,我也要感謝我遇到的傑出的Meta團隊、工程師以及我在這裡接觸到的每一個人。感謝你們共同建設這個未來。
感謝你,馬克,與我在虛擬宇宙中進行交流。這真的讓我震驚。我幾乎無法言表。我真的很想不斷地測量我的心率。如果你現在真的就像坐在海灘上一樣,那真是太有趣了。我並不在海灘上,我在會議室裡。好吧,我確實在海灘上,而且沒穿褲子。對於在物理空間中看到我的人,我真的很抱歉。無論如何,非常感謝你今天的發言。這確實讓我震驚。這是我一生中最不可思議的經歷之一。
所以,感謝你帶給我這樣的體驗。真是太棒了。很高興能與你交流,而且對話總是如此有趣。好的,希望不久後能再次與你交流。再見了。回頭見。
這真是太棒了,夥計們。這實在是太神奇了。