| 數(shù)據(jù)的完整性問(wèn)題
如今的AI需要大量的數(shù)據(jù)才能產(chǎn)生有意義的結(jié)果,但無(wú)法利用其他應(yīng)用程序的經(jīng)驗(yàn)。雖然班尼特認(rèn)為克服這些局限性的工作正取得進(jìn)展,但是在模型以可擴(kuò)展的方式應(yīng)用之前,學(xué)習(xí)的轉(zhuǎn)移是有必要的。然而,在某些情況下,AI可以在今天得到有效的應(yīng)用,比如在圖像、聲音、視頻和翻譯語(yǔ)言方面的洞察力。
企業(yè)正在學(xué)習(xí)應(yīng)該關(guān)注的問(wèn)題:
1)數(shù)據(jù)的多樣性,包括適當(dāng)人群的代表性。
2)在創(chuàng)建算法的過(guò)程中確保不同的經(jīng)驗(yàn)、觀點(diǎn)和思維。
3)數(shù)據(jù)質(zhì)量?jī)?yōu)先于數(shù)量。這些都是非常重要的,特別是隨著偏見(jiàn)的引入,對(duì)AI的信任和信心數(shù)據(jù)都在下降。例如,在土耳其語(yǔ)中屬于中性的語(yǔ)言,谷歌翻譯中的AI模型在將其翻譯成英語(yǔ)時(shí)卻錯(cuò)誤地預(yù)測(cè)了性別。
此外,癌癥識(shí)別AI在圖像識(shí)別訓(xùn)練時(shí)只使用皮膚白皙的人照片。從上面的計(jì)算機(jī)視覺(jué)例子中,喬伊·布拉馬維尼(Joy Buolamwini)測(cè)試了這些AI技術(shù),并意識(shí)到它們?cè)谧R(shí)別男性VS女性或淺色VS深色皮膚方面更有效。識(shí)別男性的錯(cuò)誤率低至1%,而識(shí)別深色皮膚女性的錯(cuò)誤率則高達(dá)35%。這些問(wèn)題的發(fā)生是因?yàn)闆](méi)有使用多樣化的數(shù)據(jù)進(jìn)行培訓(xùn)。
班尼特承認(rèn):“AI的概念很簡(jiǎn)單,但通過(guò)獲取越來(lái)越多的真實(shí)世界數(shù)據(jù),算法會(huì)變得越來(lái)越聰明,然而要解釋這些決策卻變得極其困難。數(shù)據(jù)可能會(huì)不斷變化,AI模型需要進(jìn)行過(guò)濾,以防止錯(cuò)誤的標(biāo)簽,比如將非洲人貼上大猩猩的標(biāo)簽,或者將熊貓誤認(rèn)為長(zhǎng)臂猿。企業(yè)依靠錯(cuò)誤的數(shù)據(jù)來(lái)做出決策,將導(dǎo)致更加糟糕的結(jié)果。”
幸運(yùn)的是,由于AI的狹義存在,很少有公司會(huì)根據(jù)今天的數(shù)據(jù)做出重大商業(yè)決策。從我們所看到的情況來(lái)看,大多數(shù)解決方案主要是產(chǎn)品推薦和個(gè)性化營(yíng)銷(xiāo)溝通。由此得出的任何錯(cuò)誤結(jié)論都不會(huì)對(duì)社會(huì)造成太大影響,至少目前如此。使用數(shù)據(jù)來(lái)進(jìn)行業(yè)務(wù)決策并不新鮮,但發(fā)生變化的是使用結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)的數(shù)量和組合正呈指數(shù)級(jí)增長(zhǎng)。AI使我們能夠持續(xù)性地使用來(lái)自他們?cè)搭^的數(shù)據(jù),并更快地獲得洞察力。對(duì)于具有處理來(lái)自不同數(shù)據(jù)源的數(shù)據(jù)和結(jié)構(gòu)能力的企業(yè)來(lái)說(shuō),這意味著巨大的機(jī)會(huì)。
然而,對(duì)于其他企業(yè)來(lái)說(shuō),大量的數(shù)據(jù)可能代表著一種風(fēng)險(xiǎn),因?yàn)椴煌膩?lái)源和格式使得轉(zhuǎn)換信息變得更加困難。這些信息來(lái)自電子郵件、系統(tǒng)日志、網(wǎng)頁(yè)、客戶記錄、文檔、幻燈片、非正式聊天、社交網(wǎng)絡(luò)以及圖像和視頻更豐富的媒體。數(shù)據(jù)轉(zhuǎn)換仍然是開(kāi)發(fā)干凈數(shù)據(jù)集和有效模型的絆腳石。
| 偏見(jiàn)比我們意識(shí)到的更普遍
許多商業(yè)模型都存在偏見(jiàn),以最小化風(fēng)險(xiǎn)評(píng)估和優(yōu)化目標(biāo)機(jī)會(huì),雖然它們可能產(chǎn)生有利可圖的商業(yè)結(jié)果。但眾所周知,它們會(huì)導(dǎo)致意想不到的后果,導(dǎo)致個(gè)人傷害,加大經(jīng)濟(jì)差距。保險(xiǎn)公司可能會(huì)利用位置信息或信用評(píng)分?jǐn)?shù)據(jù)向較貧窮的客戶發(fā)放更高的保費(fèi)。銀行可能會(huì)批準(zhǔn)信用評(píng)分較低的貸款申請(qǐng),盡管這些人已經(jīng)負(fù)債累累,可能無(wú)法負(fù)擔(dān)更高的貸款利率。
由于AI的引入不僅會(huì)使現(xiàn)有的偏見(jiàn)永久存在,而且這些學(xué)習(xí)模型的結(jié)果可能會(huì)推廣到加深經(jīng)濟(jì)和社會(huì)鴻溝的程度,因此圍繞著偏見(jiàn)的謹(jǐn)慎程度也越來(lái)越高。在當(dāng)前情況下,偏見(jiàn)出現(xiàn)在類(lèi)似“替代性制裁的懲罰性罪犯管理分析”(Correctional Offender Management Profiling for Alternative Sanctions,簡(jiǎn)稱COMPAS)的算法中。
COMPAS是由名為Northpointe的公司創(chuàng)建的,目的旨在評(píng)估審前聽(tīng)證中被告犯罪行為的風(fēng)險(xiǎn),并作出預(yù)測(cè)。COMPAS初步研究中使用的問(wèn)題類(lèi)型足以顯示,無(wú)意中對(duì)待黑人的偏見(jiàn)會(huì)在系統(tǒng)中延續(xù)。在沒(méi)有公共標(biāo)準(zhǔn)可用的情況下,Northpointe得以自己創(chuàng)建公平的定義,并在沒(méi)有第三方評(píng)估的情況下開(kāi)發(fā)了一種算法。這篇文章證明:一個(gè)流行的算法在預(yù)測(cè)犯罪方面并不比隨機(jī)的人更好。
如果這款軟件和未受過(guò)訓(xùn)練的人對(duì)在線調(diào)查的反應(yīng)一樣準(zhǔn)確,我認(rèn)為法院在做決定時(shí)應(yīng)該考慮到這一點(diǎn)。班尼特稱:“當(dāng)我們?cè)噲D修復(fù)現(xiàn)有系統(tǒng)以最小化這種偏見(jiàn)時(shí),關(guān)鍵是要對(duì)不同的數(shù)據(jù)集進(jìn)行模型訓(xùn)練,以防止將來(lái)產(chǎn)生危害。”由于錯(cuò)誤模型的潛在風(fēng)險(xiǎn)遍布企業(yè)和社會(huì),企業(yè)沒(méi)有治理機(jī)制來(lái)監(jiān)督不公平或不道德的決策,而這些決策將無(wú)意中影響最終消費(fèi)者。
| 對(duì)隱私日益增長(zhǎng)的需求
我和班尼特都曾在雅虎工作過(guò),我們與強(qiáng)大的研究和數(shù)據(jù)團(tuán)隊(duì)合作,能夠在我們的平臺(tái)上對(duì)用戶的行為進(jìn)行仔細(xì)研究。我們不斷地研究用戶行為,了解他們?cè)谝魳?lè)、主頁(yè)、生活方式、新聞等眾多屬性方面的傾向。當(dāng)時(shí),對(duì)數(shù)據(jù)使用沒(méi)有嚴(yán)格的標(biāo)準(zhǔn)或規(guī)定。隱私被降級(jí)為平臺(tái)上用戶被動(dòng)遵守的協(xié)議中的條款和條件,與今天的情況類(lèi)似。
最近的劍橋分析公司濫用Facebook用戶數(shù)據(jù)丑聞把個(gè)人數(shù)據(jù)隱私問(wèn)題推到了風(fēng)口浪尖。主要信貸機(jī)構(gòu)(如Equifax)、最近的Facebook和Google+頻繁發(fā)生的數(shù)據(jù)泄露,繼續(xù)加劇了這一問(wèn)題。2018年5月25日生效的歐洲《通用數(shù)據(jù)保護(hù)條例》(GDPR)將改變企業(yè)的游戲規(guī)則,特別是那些收集、存儲(chǔ)和分析個(gè)人用戶信息的公司。它將改變企業(yè)經(jīng)營(yíng)多年的商業(yè)規(guī)則。毫無(wú)節(jié)制地使用個(gè)人信息已經(jīng)到了緊要關(guān)頭,因?yàn)槠髽I(yè)現(xiàn)在會(huì)意識(shí)到,數(shù)據(jù)的使用將受到重大限制。更重要的是,所有權(quán)之爭(zhēng)更為激烈。
我們看到了定位廣告的早期效果。這個(gè)價(jià)值750億美元的行業(yè),預(yù)計(jì)到2021年將以21%的年復(fù)合增長(zhǎng)率增長(zhǎng),但仍受到Facebook和谷歌的寡頭壟斷的阻礙,它們獲得了大部分收入,F(xiàn)在,GDPR加大了風(fēng)險(xiǎn),讓這些廣告技術(shù)公司擔(dān)負(fù)起更多責(zé)任。這種風(fēng)險(xiǎn)非常高,以至于(廣告商)必須非常確定,你被告知的內(nèi)容實(shí)際上是符合要求的。對(duì)于什么最終會(huì)構(gòu)成違規(guī),似乎存在著足夠多的普遍困惑,人們對(duì)此采取了廣泛的方法,直到你能夠準(zhǔn)確地了解合規(guī)。
盡管監(jiān)管最終會(huì)削弱營(yíng)收,但至少就目前而言,移動(dòng)和廣告平臺(tái)行業(yè)也正面臨著越來(lái)越多的審查,這些行業(yè)多年來(lái)一直在從消費(fèi)者身上賺錢(qián)。這一點(diǎn),再加上圍繞既定實(shí)踐的審查,將迫使行業(yè)改變收集、聚合、分析和共享用戶信息的方式。對(duì)隱私進(jìn)行操作需要時(shí)間、重大投資以及心態(tài)上的改變,這些將影響企業(yè)政策、流程和文化。
共3 頁(yè) 上一頁(yè) [1] [2] [3] 下一頁(yè) 第1頁(yè) 第2頁(yè) 第3頁(yè)
AI泡沫將破裂?中國(guó)已誕生14只AI“獨(dú)角獸”
用AI賦能母嬰電商 貝貝網(wǎng)的成功之路有多遠(yuǎn)
Rains在上海開(kāi)出亞洲第二家概念店 這次引入定制服務(wù)
母嬰電商貝貝網(wǎng)擁抱AI 大大提高轉(zhuǎn)化率
AI+大數(shù)據(jù):二手車(chē)電商的“升階”戰(zhàn)
搜索更多: AI