工人必被AI淘汰?19世紀的織布工是怎樣在工業革命中活下來的?
大家好,我是烏鴉。
本月初,全球首屆人工智能(AI)安全峰會於英國倫敦舉辦。
可這次大會,在舉辦前就政治風波不斷。美國爲阻止中國參會,向東道主英國方面施加了巨大壓力,說中國參會會涉及安全問題。英國前“最短命首相”特拉斯也跳出來反對邀請中國。英國現任蘇納克政府則是一會傳出消息考慮不邀請中國,一會說是隻允許中國參與一天的議程,一會又說預計中國會參加全部兩天會議,可謂搖擺不定。
不過,爲中國說話的聲音也不小。加拿大創新科學和工業部長商鵬飛表示,人工智能不應受國界限制。美國企業界代表馬斯克更直言,中國不參加,峰會就毫無意義。英國首相蘇納克在壓力下最終邀請中國參與全部議程。中方派出科技部副部長吳朝暉帶隊,中國科學院、阿里巴巴及騰訊也有代表出席。
這次峰會的主要成果,就是成功地將中美歐代表“聚集在同一張桌子上”,包括中國、美國、英國在內的28個國家及歐盟共同簽署了《布萊奇利宣言》,承諾以安全、以人爲本、值得信賴和負責任的方式設計、開發、部署和使用AI。
當然,不管是從會前的政治操弄,還是中方與會專家提出的“希望明年有數十場會議,有更多國家受邀參加,建立真正包容性的國際合作”的呼籲,都不難看出,這一屆大會所取得的成果,都只能算一小步。不如反過來說,這屆峰會的舉辦,倒確實體現瞭如今人類對AI技術的安全性問題格外關注。
技術帶來效率和便利的同時,對人類社會來說往往也會形成種種擔憂。有關人工智能的“安全性”,烏鴉特別邀請到了中國科學院軟件研究所張立波副研究員(@圖靈宇宙),就其中一些最受關注的問題,爲大家講解。
問題1:AI技術的安全隱患主要是什麼?我們的隱私會不會進一步被利用?
圖靈宇宙:首先我們明確一點,大部分AI技術是通過訓練出的模型來執行具體下游任務。所以在這個基礎上,關於AI的隱患,我們可以從模型訓練前,訓練時,和訓練後三個方面談一談。
模型訓練前,就目前主流的方法來說,都需要準備海量數據,因此這些數據的安全性和正確性是AI技術面臨的首要問題。這個問題展開涉及到方方面面,例如這些數據從哪裡來,是否可靠,是否涉及個人隱私問題,是否具有偏見性等等。我們舉個簡單的例子,如果訓練一個對話系統,你用的數據裡總是描述“太陽是綠色的”,模型裡就會把這個當成一個事實。訓練模型就像培養一個孩子,你教給他什麼,他就傾向於如何理解,所以如果傳遞的訓練數據中混入了錯誤和偏見信息,對於模型來說就非常危險。
那現在的訓練數據安全嗎?我們來看一下目前大模型主流的訓練數據是什麼,90%以上的數據來自於英文文獻或翻譯,只有不到10%的部分是中文語料,那這其中可想而知極有可能存在一些錯誤和偏見數據,在這樣的數據訓練基礎上得到的對話系統,會有一些錯誤甚至偏激的答案。當然,如何解決數據和輸出結果可靠性也是目前大模型面臨的熱門研究方向,例如交叉驗證、規則過濾和人工覈驗等等,都能起到一定的作用。
模型訓練過程中,通過各種攻擊技術能夠讓模型功能產生偏差,甚至產生相反的效果。這裡可以舉個例子,想象一下,無人駕駛車輛載着你在山間小路,遇到一個指示牌,本來顯示的是前方懸崖,但現在的技術只要在上面貼一個指甲蓋大小的廣告,就能讓模型的識別結果變爲能夠通行。另一方面,無論訓練數據和場景多麼完善,模型總是在有限的數據下進行訓練,世間萬物千變萬化,這意味總會有超出訓練數據的情況出現,模型遇到從未見過的題目也會懵。
模型訓練完成後,會在具體的應用中產生作用。AI技術和訓練完的模型本無好壞,但可能會被不法之人用在不法之處,在我們身邊就已經能夠遇到,偶爾你可能接到虛擬聲音的電話,注意這就有可能是AI詐騙,犯罪分子通過虛擬聲音和智能語音問答來實施違法行爲。
從上面的分析中我們看出數據在整個流程中至關重要,也有讀者提出了個人隱私的安全性問題。實際上,是有途徑來解決隱私保護問題的,這裡我可以簡單介紹幾種常見的方法,首先可以構建虛擬數據集,這樣訓練使用的數據符合現實使用的分佈,但又沒有觸碰個人隱私,一舉兩得;
其次,可以對隱私數據進行局部保護,比如你的任務是行人檢測,那就可以對視頻或圖片中的人臉進行馬賽克,這裡可能會有人問,如果任務是人臉識別呢,彆着急,現在的生成技術完全可以生成需要的虛擬人臉。最後,有一些企業,例如銀行、證券等核心金融機構的數據要求更加嚴格,可能連觸碰這些數據都不行,這時候怎麼辦呢。其實,在學術上早就有了解決方法,可以使用聯邦學習技術,這種模型訓練方法,可以在不直接接觸訓練數據的基礎上,只通過反饋來完成所需模型的訓練,也就是說對模型來說,訓練數據是一個黑盒子。
問題2:AI技術對人類就業有何影響?非計算機領域的普通人如何應對AI浪潮的衝擊?
圖靈宇宙:我記得在很久之前,就有過AI技術對從業者衝擊的討論,甚至有一些媒體會憂心忡忡地列出了未來最容易被取代和最不容易被取代的職業,在最易替代上幾乎沒有懸念,代駕、收銀員、流水線工人等位列其中。在最不容易被替代的職業榜單上,排在第一位的是程序員。
但這次我想換個角度來回答這個問題,因爲我覺得每一次產業技術升級都面臨原本由人工完成的工作可以讓機器來完成。那些被機器替代的人,都去哪兒了呢?
我講個故事吧,講完這個故事,大家或許就都明白了。
1768年,卡特賴特發明水力織布機,將織布效率提高了40倍,1804年雅卡爾提花機的出現將織布效率提高了25倍。這些下崗的工人,去哪了呢?以英格蘭西北部的蘭開夏爲例,從1820年到1851年,織布工人數量從20萬銳減到5萬。爲了保住工作,他們其中有人甚至還發生過暴動,砸壞了數百臺織布機。你要知道在1812年的英國,毀壞紡織機械是死罪。
雅卡爾提花機
在那個年代,換個工作很難嗎?很遺憾,事實確實如此。在當時的英國,姓氏幾乎是由他們的職業決定的,例如史密斯(鐵匠)、米勒(磨坊)、庫珀(桶匠),如果你表示懷疑,可以在英文字典裡搜索Cooper,看到桶匠的釋義。這些行業是沿着家族流傳下來,往往需要多年的學徒生涯,每天工作時間很長,幾乎沒有業餘時間。他們所做的,也是他們的父親,父親的父親所做的,工作不僅是養家餬口的途徑,也成爲了自己身份的象徵。
所以歷史其實是相似的,現在的我們實際也在面臨同樣的問題。人工智能技術的飛速發展,使得原本由人工完成的工作可以讓機器來完成。非計算機從業者在面臨這些問題,計算機從業者其實也是一樣。DeepMind團隊在歷經AlphaGo打敗圍棋世界冠軍李世石和AlphaFold完成預測蛋白質結構之後,推出了智能編程系統AlphaCode。它默默地參加了著名網站Codeforces舉行的10場編程比賽,成績超過一半人類,在未來取代程序員或許只是時間問題。技術在以超乎人類判斷的速度進步,回看歷史,各個領域都在不斷經歷技術的變革,例如3G、4G已經被5G取代成爲過去,雲計算和大數據被更加火熱的虛擬現實、量子計算等新名詞奪去風頭。
在這種形勢下我們該如何應對?讓我們先回到19世紀英國織布工人的時代,在我原本的想象中,這15萬人可能流離失所,但是我驚奇地發現,他們中的大部分人,在別無選擇下重新學習了新的技能,適應了新的工作,從1920年到1950年,大部分人選擇從織布工人轉爲了紡紗工人,從事紡紗的工人數量從8.5萬增加到27.5萬。大部分下崗的織布工人重新找到工作,活了下來。
當下的技術會不斷變化,現在高效的或許也在不久的將來被淘汰,紡織行業如此,計算機行業也是如此,各行各業的工作者都會面對同樣的問題。總結下來,打開未來的鑰匙或許只有跟上時代的步伐,不斷學習,終身學習。
問題3:以後AI不斷深入生活,人們會不會對AI產生依賴?
圖靈宇宙:實際上這種情況已經正在發生,可以說AI現在我們生活中幾乎無處不在,但很多時候你可能毫無察覺。你上個月買了一盒牙膏,AI可以精準地判斷你快用完了,適時地在購物車裡給你推薦新的牙膏;夜晚你躺在牀上,想着刷一個視頻就睡覺,結果一直刷到了天亮,你以爲是自己的意志力比較薄弱,但實際上是人工智能準確計算了你的愛好和偏向,精準持續地給你推薦你喜歡看的內容,讓你欲罷不能。
所以人們對AI的依賴是確定的,對於技術來說沒有好壞,只是看使用的人如何來使用這項技術,剛纔提到的例子會讓人覺得AI會使人淪陷,但實際上還有很多正面的例子,例如醫生通過AI診斷能夠更準確地判斷病人的病情,甚至有一些失明的孩子能夠通過視覺傳感技術重新看見這個世界。
在學習上,每個老師很難照顧到所有的學生,但AI可以通過每個學生對知識點掌握的情況,因材施教地給每個學生制定個性化的學習方案。在工作上,AI已經可以幫助我們生成一些基礎的文檔和圖片,甚至還能製作和美化PPT。
如果從讓工作生活更加美好便捷的角度出發來看,AI帶來的依賴是正向的,或者說我們需要正向地去使用AI技術,說到底AI只是一種工具,類似於我們的鍋碗瓢盆,做出什麼樣的菜,實際上取決於使用廚具的廚師。
問題4:傳統的機器學習方法會被深度學習打敗嗎?傳統的機器學習還有發展的空間嗎?
圖靈宇宙:目前來看傳統機器學習不會被深度學習打敗,事實上在很多深度學習模型應用中都會使用與機器學習混合的方法,包括最近很火的ChatGPT,僅靠深度學習模型的輸出,面對未知情況時,模型的輸出不可控,在這個時候傳統機器學習方法能夠用規則將輸出約束在可控範圍內。另外,深度學習技術依賴海量數據的訓練,但並不是所有的問題都有海量數據,甚至有一些問題沒有任何可以參考的數據,在這些案例上,傳統機器學習就具有了不可取代的優勢,因爲傳統機器學習可以依靠人類設定規則和手工特徵來起到作用。
傳統機器學習和深度學習都在發展,深度學習最初也是從機器學習裡發展出來的,一個方向的發展,有很多因素影響,其實深度學習的出現可以追溯到20世紀50年代,當時也沒有掀起太大的風浪,直到反向傳播算法的出現,再加上算力的提升,才得以發展到當今這個程度。
我不認爲深度學習是人工智能的終極答案,它只是目前階段的最優解。傳統機器學習裡還有很多具備潛力的算法。例如量子計算機如果能夠取得突破,意味着機器學習領域很大程度上不再受到算法複雜度的限制,主流算法將發生翻天覆地的變化。也許下一次風來的時候,我們又看到新的海浪涌起。
本期內容已於11月27日在各平臺上線視頻版本,有興趣的朋友歡迎移步觀看
張立波老師的微信公衆號“圖靈宇宙”(ID:tulingyuzhou)