Губици ДеепМинд-а и будућност вештачке интелигенције


ДеепМинд абецеде је изгубљен 572 милиона долара прошле године. Шта то значи?

ДеепМинд, вероватно највећа светска операција вештачке интелигенције у свету, брзо губи пуно новца, више од милијарду долара у последње три године. ДеепМинд такође има више од милијарду долара дуга у наредних 12 месеци.

Да ли то значи да се АИ распада?

ВИРЕД МНЕЊЕ

О ТОМЕ

Гари Марцус је оснивач и извршни директор Робуст.АИ и професор психологије и неуролошких наука на НИУ. Аутор је, с Ернестом Дависом, о предстојећим Поновно покретање АИ: Изградња вештачке интелигенције којој можемо веровати.

Нимало. Истраживање кошта новац, а ДеепМинд сваке године ради више истраживања. Укључени долари су велики, можда више него у било којој претходној истраживачкој операцији АИ, али далеко од невиђених у поређењу са износима утрошеним у неке од највећих научних пројеката. Велики хадронски сударач кошта нешто попут милијарде долара годишње, а укупни трошкови откривања Хигсовог Босона процењени су на више од 10 милијарди долара. Свакако, истинска машинска интелигенција (позната и као вештачка општа интелигенција), такве врсте која би напајала Звездане стазе– рачунар сличан стању, способан за анализу свих врста упита постављених на обичном енглеском језику, вредео би много више од тога.

Ипак, пораст величине губитака ДеепМинд-а вриједи узети у обзир: 154 милиона долара у 2016. години, 341 милион долара 2017. године, 572 милиона долара 2018. године. По мом мишљењу, постоје три централна питања: Да ли је ДеепМинд на правом путу научно? Да ли су улагања ове величине са аспекта Абецеде? И како ће губици утицати на АИ уопште?

По првом питању постоји разлог за скептицизам. ДеепМинд већину својих јаја ставља у једну корпу, технику познату као учење дубоког појачања. Та техника се комбинује дубоко учење, првенствено се користи за препознавање образаца, са учење ојачања, усмерено на учење засновано на сигналима награде, као што је резултат у игри или победа или пораз у игри попут шаха.

ДеепМинд је техници дао име 2013. године, у узбудљивом раду који је показао како се један систем неуронске мреже може обучити за играње различитих Атари игара, као што су Избити и Освајачи свемира, као и, или боље од људи. Рад је био инжењерска сила, и вероватно кључни катализатор у продаји компаније Гоогле ДеепМинд у јануару 2014. године. Даљњи напредак технике подстакао је ДеепМинд-ове импресивне победе у Го-у и компјутерској игри СтарЦрафт.

Проблем је што је техника специфична за уске околности. У игрању Избити, на пример, ситне промене – попут померања весла за неколико пиксела – могу изазвати драматичне паде перформанси. ДеепМинд'с СтарЦрафт исходи су били слично ограничени, с резултатима бољим од човека када се играју на једној мапи са једном „трком“ карактера, али лошији резултати на различитим мапама и са различитим знаковима. Да бисте пребацили карактере, морате да преквалификујете систем испочетка.

На неки начин, учење дубоког појачања је врста меморије са турбопуњавањем; Системи који га користе способни су завидне подвиге, али имају само плитко разумевање онога што раде. Као посљедица тога, тренутни системи немају флексибилност и стога нису у могућности да надокнаде ако се свијет промијени, понекад чак и на ситне начине. (Недавни резултати компаније ДеепМинд са болешћу бубрега доведени су у питање на сличне начине.)

Дубоко учвршћивање захтева такође огромну количину података – на пример, милионе самостално играних игара Го. То је пуно више него што би човеку било потребно да постане Го свјетска класа, а често тешко или скупо. То доноси захтев за рачунарским ресурсима у Гоогле скали, што значи да би, у многим стварним проблемима, рачунарско време само било скупо да би многи корисници то узели у обзир. По једној процени, време обуке за АлпхаГо коштало је 35 милиона долара; иста процена упоредила је количину енергије која се троши са 12.760 људских мозгова који непрекидно раде три дана без сна.

Али то је само економија. Право питање, као што тврдимо Ернест Давис и ја, у нашој наредној књизи Поновно покретање АИ, је поверење. За сада се дубоком учвршћивању може веровати само у окружењима која су добро контролисана, уз мало изненађења; то за Го иде добро – ни плоча ни правила се нису променили у 2000 година – али не бисте се желели ослонити на то у многим стварним ситуацијама.

Мали комерцијални успех

Делимично зато што су мали проблеми из стварног света ограничени као и игре на које се ДеепМинд усредсредио, ДеепМинд тек треба да нађе велику комерцијалну примену учења дубоког појачања. До сада је Алпхабет уложио отприлике две милијарде долара (укључујући пријављену откупну цену у износу од 650 милиона долара у 2014. години). Директан финансијски поврат, не рачунајући публицитет, био је скроман за поређење, око 125 милиона долара прихода прошле године, од којих су неки дошли из примене дубоког учења ојачања у оквиру Алпхабет-а како би се смањили трошкови електричне енергије за хлађење Гооглеових сервера.

Учење дубоког појачања могло би бити попут транзистора, истраживачког изума који је промијенио свијет, или би могло бити „рјешење у потрази за проблемом“.

Оно што делује за Го можда неће радити за изазовне проблеме које ДеепМинд тежи да реши са АИ, попут рака и чисте енергије. ИБМ је ово научио на тежи начин када је покушао да преузме Ватсон-ов програм који је победио Опасност! и примените га у медицинској дијагнози, са мало успеха. Ватсон је добро функционирао у неким случајевима, а у другима није успео, понекад недостајући дијагнозе попут срчаних удара који би били очигледни студентима прве године медицине.

Наравно, то може једноставно бити питање времена. ДеепМинд ради на учењу са дубоким ојачањима бар од 2013. године, можда и дуже, али научни напредак ретко се претвара у производ преко ноћи. ДеепМинд или други можда у коначници пронађу начин за стварање дубљих и стабилнијих резултата са дубоким учвршћивањем, можда комбинирањем са другим техникама – или можда неће. Учење дубоког појачања могло би се на крају показати као транзистор, истраживачки изум из корпоративног лабораторија који је у потпуности променио свет, или би могао бити врста академске радозналости коју је Јохн Маинард Смитх једном описао као „решење у потрази за проблемом“. Моја лична претпоставка је да ће се испоставити да је негде између, корисног и распрострањеног оруђа, али не и промене света.

Нитко не би смио рачунати ДеепМинд, чак и ако се његова тренутна стратегија покаже мање плодном каквом се многи надају. Учење дубоког оснаживања можда није краљевски пут ка вештачкој генералној интелигенцији, али сам ДеепМинд је ужасна операција, чврсто вођена и добро финансирана, са стотинама доктора наука. Јавност настала успесима у Го, Атари и СтарЦрафт привлаче све више талента. Ако се ветрови у АИ померају, ДеепМинд је можда у добром положају да се ухвати у другом правцу. Није очигледно да било ко може да га усклади.

У међувремену, у ширем контексту Алпхабета, 500 милиона долара годишње није велика опклада. Алпхабет је (мудро) направио друге опкладе на АИ, као што је Гоогле Браин, који и сам брзо расте. Алпхабет може да промени биланс свог портфеља АИ на различите начине, али у компанији са приходима од 100 милијарди долара која годишње зависи од АИ-а за све, од претраживања до препорука за оглашавање, није лудо за Алпхабет да направи неколико значајних инвестиција.

Забринутост прекомерном напретку

На последње питање, како ће економија ДеепМинд-а утицати на АИ уопште, тешко је одговорити. Ако хипе премаши испоруку, то би могло довести до „АИ зиме“, где чак и присталице не воле да улажу. Инвестициона заједница примећује значајне губитке; ако би се губици ДеепМинд-а наставили приближно удвостручити сваке године, чак би се и Алпхабет могао осећати примораним да се повуче. И то није само новац. До сада недостаје опипљивих финансијских резултата. У неком тренутку ће инвеститори можда бити приморани да поново калибришу своје ентузијазам за АИ.

То није само ДеепМинд. Многи помаци обећани пре само неколико година – попут аутомобила који могу самостално да возе или цхатбота који разумеју разговоре – још увек нису остварени. Марк Зуцкерберг је априла 2018. године обећао Конгресу да ће АИ ускоро решити проблем лажних вести већ ублажен, колико смо Девис и ја предвидели. Причање је јефтино; крајњи степен ентузијазма за АИ зависи од тога шта је достављено.

За сада је истинску машинску интелигенцију лакше сагледати него изградити. Иако је дошло до великог напретка у ограниченим доменима попут оглашавања и препознавања говора, АИ неупитно још има дуг пут. Користи звучне анализе великих скупова података не могу се порећи; чак и у ограниченом облику, АИ је већ моћан алат. Корпоративни свет може постати мање буран око АИ, али не може себи дозволити да се потпуно повуче.

Моја претпоставка?

За десет година ћемо закључити да је учење дубоког јачања прецењено крајем 2010-их и да су многи други важни путеви истраживања занемарени. Сваки долар уложен у учење ојачања је долар који није уложен негде другде, у време када би, на пример, увиди из људских когнитивних наука могли да дају вредне трагове. Истраживачи машинског учења често се питају: „Како машине могу да оптимизирају сложене проблеме користећи огромне количине података?“ Могли бисмо такође питати, „Како деца усвајају језик и разумеју свет, користећи мање енергије и података од тренутних АИ система ? ”Ако бисмо на последње питање потрошили више времена, новца и енергије, можда бисмо пре тога дошли до вештачке опште интелигенције.


Још сјајних прича о ВИРЕД-у