這個(gè)問題已經(jīng)在世界各地的會(huì)議和社交聊天的討論表中浮出水面了-“機(jī)器可以打開人類嗎?”這個(gè)問題經(jīng)常伴隨著《終結(jié)者》等電影的場景和視覺效果,但是我們所知道的和所看到的在大數(shù)據(jù)中使用AI的原因在于,在設(shè)計(jì)具有更復(fù)雜環(huán)境的更大規(guī)模的系統(tǒng)時(shí),必須考慮某些不確定性和偏差。
機(jī)器“感覺”是什么?是什么使他們的行為方式不同于插入大型機(jī)的代碼?如今,艾薩克·阿西莫夫(Isaac Asimov)的三項(xiàng)法律在定義機(jī)器在復(fù)雜環(huán)境中的行為標(biāo)準(zhǔn)時(shí)是否仍然立于不敗之地?這些問題的答案在于我們選擇定義游戲規(guī)則以及機(jī)器如何應(yīng)對突然變化的方式。
在人工智能研究中,道德偏見是不確定性的一個(gè)特殊區(qū)域,涉及小裝飾品和杠桿,這些小裝飾品和杠桿會(huì)拉動(dòng)機(jī)器以有時(shí)看起來有些奇怪甚至有害的方式運(yùn)行。隨著無人駕駛汽車的興起和AI驅(qū)動(dòng)的生產(chǎn)方法逐漸占領(lǐng)世界,一個(gè)懸而未決的問題再次需要答案。我們?nèi)绾翁幚磉@些機(jī)器?
您可能還會(huì)喜歡: AI可以自我警戒并減少偏見嗎?
偏向簡介
從數(shù)據(jù)角度來看,偏差和方差與測量值與實(shí)際值的接近程度有關(guān)。在這種情況下,方差是測量值彼此之間相差多少的度量,偏差是指測量值與實(shí)際值相差多少。在具有高精度的模型的高度特定的情況下,方差和偏差都將很小。
但是,這可能反映出該模型對新數(shù)據(jù)的執(zhí)行效果有多差。然而,很難實(shí)現(xiàn)低偏差和方差,這是各地數(shù)據(jù)分析師的禍根。對于涉及簡單決策而用簡單的二進(jìn)制計(jì)算還不夠的用例,偏差尤其難以處理。
您可能會(huì)想問偏見如何進(jìn)入系統(tǒng)。而且,如果一臺機(jī)器無法在不低于人類的臨界點(diǎn)上做出決定,那么為什么要首先使用它們呢?要回答這些問題,您需要查看在大數(shù)據(jù)領(lǐng)域中如何構(gòu)建模型的一般方法。
首先從執(zhí)行器和傳感器中收集并清除數(shù)據(jù),這些數(shù)據(jù)可為分析人員提供原始數(shù)據(jù)。這些值然后經(jīng)過預(yù)處理步驟,在此將它們標(biāo)準(zhǔn)化,標(biāo)準(zhǔn)化或轉(zhuǎn)換為除去尺寸和單位的形式。一旦將數(shù)據(jù)轉(zhuǎn)換為合適的表格或逗號分隔格式,就將其插入到層或功能方程式網(wǎng)絡(luò)中。如果模型使用一系列隱藏層,請放心,它們將具有激活函數(shù),該函數(shù)將在每個(gè)步驟中引入偏差。
但是,偏差也可以通過許多收集方法的陷阱進(jìn)入系統(tǒng)。也許數(shù)據(jù)沒有針對某一組或某類輸出進(jìn)行平衡,也許數(shù)據(jù)不完整/錯(cuò)誤,或者可能沒有任何數(shù)據(jù)開始。
隨著數(shù)據(jù)集變得越來越多且記錄不完整,系統(tǒng)肯定有可能用一些預(yù)定義的值填補(bǔ)這些空白。這導(dǎo)致另一種假設(shè)偏見。
黑匣子難題
許多學(xué)者還認(rèn)為,沒有適當(dāng)?shù)纳舷挛模瑪?shù)字可能不會(huì)意味著同一件事。例如,在有爭議的《鐘形曲線》一書中,作者關(guān)于種族群體間智商差異的說法受到了環(huán)境約束和差異概念的挑戰(zhàn)。但是,如果一個(gè)人能夠達(dá)成這樣的解決方案,directadmin漢化,那么一臺機(jī)器要花多長時(shí)間才能消除這種邏輯上的判斷失誤?
機(jī)會(huì)很小。如果機(jī)器被送入錯(cuò)誤或錯(cuò)誤的數(shù)據(jù),它將輸出錯(cuò)誤的值。問題是由AI模型的構(gòu)建模棱兩可引起的。這些通常是黑盒模型,作為數(shù)據(jù)接收器和數(shù)據(jù)源存在,而沒有解釋內(nèi)部內(nèi)容。對于用戶而言,不能質(zhì)疑或質(zhì)疑這種黑匣子模型如何得出結(jié)果。此外,結(jié)果差異還需要解決其他問題。
由于缺乏對黑匣子運(yùn)作方式的了解,即使使用相同的輸入,分析師也可能得出不同的結(jié)果。對于精度不是關(guān)鍵因素的值,這種變化可能不會(huì)產(chǎn)生太大的影響,但是數(shù)據(jù)領(lǐng)域卻很少那么慷慨。
例如,如果AI系統(tǒng)無法預(yù)測高度特定的參數(shù)(例如pH值,溫度或大氣壓),則工業(yè)制造商將蒙受損失。但是,當(dāng)目標(biāo)是解決諸如貸款兼容性,犯罪再犯甚至適用于大學(xué)錄取等問題的答案時(shí),AI缺乏清晰的價(jià)值將處于不利地位。但是,AI愛好者有責(zé)任從另一個(gè)角度解決這個(gè)問題。
必須解決層之間干擾的方法和規(guī)則,以解釋每一行代碼和系數(shù)所代表的含義。因此必須將黑匣子連根拔起并解剖,以了解是什么使機(jī)器滴答作響,這說起來容易做起來難。即使看一下最簡單的神經(jīng)網(wǎng)絡(luò)AI,也足以表明此類系統(tǒng)的原始性。節(jié)點(diǎn)和層全部堆疊在一起,各個(gè)權(quán)重與其他層的權(quán)重相互作用。
對于訓(xùn)練有素的人來說,這看起來像是一筆宏偉的交易,但是對于理解機(jī)器卻幾乎沒有解釋。難道僅僅是由于人類和機(jī)器語言水平的差異?是否可以采用一種外行可以理解的格式來分解機(jī)器語言的邏輯?
偏見的類型